跳至內容

Ampere(微架構)

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

安培微架構(Ampere)是 NVIDIA 佇二空二空年五月發布的一个 GPU 架構。用代圖靈微架構(Turing microarchitecture)。 號名號做「安培」以向法國物理學家安德烈-馬里 ・ 安培(André-Marie Ampère)致敬。Ampere 架構擁有電晶體達五百四十億,是三星八 nm 級晶片。是世界上電晶體上濟的晶片,直到尾仔來去予蘋果 M 一 Max 擊敗。

硬體

  • NVIDIA A 一百 Tensor Core GPU 是因為 NVIDIA Ampere 架構,嘿針對 AI、資料分析佮 HPC 的 GPU。
  • DGX A 一百系統整合八个 NVIDIA A 一百 Tensor Core GPU、有到三百二十 GB 記持體,有擁有 NVIDIA Mellanox® HDR 兩百 Gbps 互連以及5 Petaflops 的 AI 效能。
  • DGX SuperPOD 是一百四十台 DGX A 一百系統運用 MellanoxHDR 兩百 Gbps InfiniBand 互相連技術組成的一个樹仔,AI 計算能力達到了七百 Petaflops。
  • NVIDIA EGX™ A 一百是 NVIDIA 佇咧二空二空年五月發布的所在 Ampere 架構的一款邊緣 AI 平台。
  • NVIDIA GeForce 三十系列
  • GeForce RTX 三千空五十
  • GeForce RTX 三千空六十
  • GeForce RTX 三千空六十 Ti
  • GeForce RTX 三千空七十
  • GeForec RTX 三千空七十 Ti
  • GeForce RTX 三千空八十十 GB
  • GeForce RTX 三千空八十十二 GB
  • GeForce RTX 三千空八十 Ti
  • GeForce RTX 三千空九十
  • GeForce RTX 三千空九十 Ti

核心組態

  • 佇咧做為計算卡專用的 GA 一百核心內,敢若像前身仝款,彼每一个 SM 中安排有三十二个雙精度浮點核心;佇咧做非計算卡使用的 GA 一百空二等核心中,遮的雙精度浮點核心被替換做兩倍數量的單精度浮點核心。因為單精度浮點核心事實上成做真濟遊戲的流處理器,因此單個 SM 表觀流處理器數量達到頂一代的二倍,RTX 三千空七十的流處理器數量達到欲六千个,接近上代旗艦 RTX 二千空八十 Ti;無問題,用單精度浮點核心類比雙精度的效率並無懸,因此遊戲顯示卡的雙精度浮點計算速度(主要作用佇挖礦佮深度學習等應用)比較上代並無明顯提升。
  • 電晶體密度:GA 一百使用台積電七 nm 製程達到約六千六百萬 / mm 二,GA 一百空二、GA 一百空四使用三星八 nm 製程達到約四千五百萬 / mm 二,啊若上代的圖靈全系列攏使用台積電十二 nm 製程,干焦達到差不多兩千五百萬 / mm 二。
  • A 一百顯示卡中每一个 SM 私有的 L 一 / 共享記憶體容量達到一百九十二 KB,佮前代比起來 V 一百顯示卡的百二八 KB 增加一爿五倍。

記錄

二空二空年七月,根據 MLPerf 基準測試結果,NVIDIA 宣布安培拍破十六項世界紀錄,包括加速器的八項基準測試佮樹仔 DGX SuperPOD 的八項喔。

參考資料

外部連結

  • NVIDIA A 一百 Tensor Core GPU Architecture whitepaper
  • Nvidia Ampere Architecture
  • Nvidia A 一百 Tensor Core GPU
  • NVIDIA Ampere Architecture In-Depth