Ampere(微架構)

安培微架構（Ampere）是 NVIDIA 佇二空二空年五月發布的一个 GPU 架構。用代圖靈微架構（Turing microarchitecture）。號名號做「安培」以向法國物理學家安德烈-馬里・安培（André-Marie Ampère）致敬。Ampere 架構擁有電晶體達五百四十億，是三星八 nm 級晶片。是世界上電晶體上濟的晶片，直到尾仔來去予蘋果 M 一 Max 擊敗。

硬體

NVIDIA A 一百 Tensor Core GPU 是因為 NVIDIA Ampere 架構，嘿針對 AI、資料分析佮 HPC 的 GPU。
DGX A 一百系統整合八个 NVIDIA A 一百 Tensor Core GPU、有到三百二十 GB 記持體，有擁有 NVIDIA Mellanox® HDR 兩百 Gbps 互連以及5 Petaflops 的 AI 效能。
DGX SuperPOD 是一百四十台 DGX A 一百系統運用 MellanoxHDR 兩百 Gbps InfiniBand 互相連技術組成的一个樹仔，AI 計算能力達到了七百 Petaflops。
NVIDIA EGX™ A 一百是 NVIDIA 佇咧二空二空年五月發布的所在 Ampere 架構的一款邊緣 AI 平台。
NVIDIA GeForce 三十系列
GeForce RTX 三千空五十
GeForce RTX 三千空六十
GeForce RTX 三千空六十 Ti
GeForce RTX 三千空七十
GeForec RTX 三千空七十 Ti
GeForce RTX 三千空八十十 GB
GeForce RTX 三千空八十十二 GB
GeForce RTX 三千空八十 Ti
GeForce RTX 三千空九十
GeForce RTX 三千空九十 Ti

核心組態

佇咧做為計算卡專用的 GA 一百核心內，敢若像前身仝款，彼每一个 SM 中安排有三十二个雙精度浮點核心；佇咧做非計算卡使用的 GA 一百空二等核心中，遮的雙精度浮點核心被替換做兩倍數量的單精度浮點核心。因為單精度浮點核心事實上成做真濟遊戲的流處理器，因此單個 SM 表觀流處理器數量達到頂一代的二倍，RTX 三千空七十的流處理器數量達到欲六千个，接近上代旗艦 RTX 二千空八十 Ti；無問題，用單精度浮點核心類比雙精度的效率並無懸，因此遊戲顯示卡的雙精度浮點計算速度（主要作用佇挖礦佮深度學習等應用）比較上代並無明顯提升。
電晶體密度：GA 一百使用台積電七 nm 製程達到約六千六百萬 / mm 二，GA 一百空二、GA 一百空四使用三星八 nm 製程達到約四千五百萬 / mm 二，啊若上代的圖靈全系列攏使用台積電十二 nm 製程，干焦達到差不多兩千五百萬 / mm 二。
A 一百顯示卡中每一个 SM 私有的 L 一 / 共享記憶體容量達到一百九十二 KB，佮前代比起來 V 一百顯示卡的百二八 KB 增加一爿五倍。

記錄

二空二空年七月，根據 MLPerf 基準測試結果，NVIDIA 宣布安培拍破十六項世界紀錄，包括加速器的八項基準測試佮樹仔 DGX SuperPOD 的八項喔。

參考資料

外部連結

NVIDIA A 一百 Tensor Core GPU Architecture whitepaper
Nvidia Ampere Architecture
Nvidia A 一百 Tensor Core GPU
NVIDIA Ampere Architecture In-Depth