Ampere(微架構)
外觀
這是此頁批准,以及是最近的修訂。
安培微架構(Ampere)是 NVIDIA 佇二空二空年五月發布的一个 GPU 架構。用代圖靈微架構(Turing microarchitecture)。 號名號做「安培」以向法國物理學家安德烈-馬里 ・ 安培(André-Marie Ampère)致敬。Ampere 架構擁有電晶體達五百四十億,是三星八 nm 級晶片。是世界上電晶體上濟的晶片,直到尾仔來去予蘋果 M 一 Max 擊敗。
硬體
- NVIDIA A 一百 Tensor Core GPU 是因為 NVIDIA Ampere 架構,嘿針對 AI、資料分析佮 HPC 的 GPU。
- DGX A 一百系統整合八个 NVIDIA A 一百 Tensor Core GPU、有到三百二十 GB 記持體,有擁有 NVIDIA Mellanox® HDR 兩百 Gbps 互連以及5 Petaflops 的 AI 效能。
- DGX SuperPOD 是一百四十台 DGX A 一百系統運用 MellanoxHDR 兩百 Gbps InfiniBand 互相連技術組成的一个樹仔,AI 計算能力達到了七百 Petaflops。
- NVIDIA EGX™ A 一百是 NVIDIA 佇咧二空二空年五月發布的所在 Ampere 架構的一款邊緣 AI 平台。
- NVIDIA GeForce 三十系列
- GeForce RTX 三千空五十
- GeForce RTX 三千空六十
- GeForce RTX 三千空六十 Ti
- GeForce RTX 三千空七十
- GeForec RTX 三千空七十 Ti
- GeForce RTX 三千空八十十 GB
- GeForce RTX 三千空八十十二 GB
- GeForce RTX 三千空八十 Ti
- GeForce RTX 三千空九十
- GeForce RTX 三千空九十 Ti
核心組態
- 佇咧做為計算卡專用的 GA 一百核心內,敢若像前身仝款,彼每一个 SM 中安排有三十二个雙精度浮點核心;佇咧做非計算卡使用的 GA 一百空二等核心中,遮的雙精度浮點核心被替換做兩倍數量的單精度浮點核心。因為單精度浮點核心事實上成做真濟遊戲的流處理器,因此單個 SM 表觀流處理器數量達到頂一代的二倍,RTX 三千空七十的流處理器數量達到欲六千个,接近上代旗艦 RTX 二千空八十 Ti;無問題,用單精度浮點核心類比雙精度的效率並無懸,因此遊戲顯示卡的雙精度浮點計算速度(主要作用佇挖礦佮深度學習等應用)比較上代並無明顯提升。
- 電晶體密度:GA 一百使用台積電七 nm 製程達到約六千六百萬 / mm 二,GA 一百空二、GA 一百空四使用三星八 nm 製程達到約四千五百萬 / mm 二,啊若上代的圖靈全系列攏使用台積電十二 nm 製程,干焦達到差不多兩千五百萬 / mm 二。
- A 一百顯示卡中每一个 SM 私有的 L 一 / 共享記憶體容量達到一百九十二 KB,佮前代比起來 V 一百顯示卡的百二八 KB 增加一爿五倍。
記錄
二空二空年七月,根據 MLPerf 基準測試結果,NVIDIA 宣布安培拍破十六項世界紀錄,包括加速器的八項基準測試佮樹仔 DGX SuperPOD 的八項喔。
參考資料
外部連結
- NVIDIA A 一百 Tensor Core GPU Architecture whitepaper
- Nvidia Ampere Architecture
- Nvidia A 一百 Tensor Core GPU
- NVIDIA Ampere Architecture In-Depth