跳至內容

KataGo

出自Taiwan Tongues 台語維基
於 2025年8月23日 (六) 15:24 由 TaiwanTonguesApiRobot留言 | 貢獻 所做的修訂 (從 JSON 檔案批量匯入)

(差異) ←上個修訂 | 已批准修訂 (差異) | 最新修訂 (差異) | 下個修訂→ (差異)

KataGo是由 David J . Wu(lightvector)所研究並開發的一套圍棋軟體。

簡介

KataGo 是 David J . Wu 依照 DeepMind 的 AlphaGo Zero 佮 AlphaZero 論文為基礎,以及真濟佇咧 DeepMind 論文了後的相關研究佮原創的研究,大幅度改善囉訓練的速度(超過五十倍), 嘛因此搭配所釋出訓練網路的資料,成做目前世界上上強的電腦圍棋軟體之一。

KataGo 所實在做的電腦圍棋程式包括著:

  • 自我對弈訓練的程式(使用 C + +、Python 三與 TensorFlow 實在做)
  • 會當透過軟體操作的 GTP ia̋n-jín(使用 C + + 實在做)

另外由 Jane Street Capital(作者所蹛的公司)提供運算所需要資源外,公開釋出訓練的成果(訓練網路的資料)。

KataGo 因為豐富的分析能力,予人用佇咧圍棋線頂懸分析網站 AI Sensei 做預設的分析 ia̋n-jín。

「 KataGo」這个名來就是日語單詞「かた ( kata )」(類型)。 目前,就算佇咧英語內底,武道的形式嘛予人號做是「kata」。 作者 lightvector ( David J . Wu ) 表示,伊成做一个通過強化學習永久訓練家己並旨佇完成家己的形式的人工智慧的名稱若像是合理的。

差異

AlphaZero

除了開放原始碼佮開放資料以外,KataGo 佮 AlphaZero 主要差異在透過研究大幅降低矣初期自我訓練的成本,予一般家用的高階電腦會當佇天內,對零訓練出一个具有中高段水準的兼高手的水準的訓練網路。

Leela Zero

KataGo 佮 Leela Zero 的主要差佇咧講,KataGo 的 GTP ia̋n-jín 支援矣 ` kata-analyze ` 指令,會當予前端的程式(像講 Lizzie)取得 KataGo 的目數分析,這會當輔助人類棋手判斷,減輕予子棋中烏棋袂行出上好的選擇的問題。

另外一个精差是 KataGo 同時支援 OpenCL(自 ` v 一孵二 ` 支援)佮 CUDA(佇咧 OpenCL 上,上新版本做矣優化,不再是 CUDA 版本快數倍,是兩个版本相差無幾个), 猶毋過 Leela Zero 干焦支援 OpenCL。

強度

頭一个版本

頭一个版本(編號 g 六十五,` v 一垺零 `)是佇二空一九年二月使用三十五粒 NVIDIA Tesla V 一百訓練七工,對六 blocks x 九十六 filters 訓練到十五 blocks x 一百九十二 filters,棋力大約佮 LZ 一百三十(Leela Zero 的第一百三十代)相符,大約是超越人類的強度。

第二个版本

第二个版本(編號 g 一百空四,` v 一孵一 `)是佇二空一九年五月和六月使用二十八粒 NVIDIA Tesla V 一百訓練,對六 blocks x 九十六 filters 訓練到二十 blocks x 兩百五十六 filters,因為大幅改善超參數(hyperparameters), 干焦使用三更加五工就超過頭一版的棋力,另外引入了 LCB(英語:Lower confidence bound)大幅的提昇矣棋力。最後訓練十九工產生出二十 blocks 的版本,棋力有超越 LZ-ELFv 二(ELF OpenGo 的 v 二權重配上 Leela Zero 的程式), 另外佮 Leela Zero 四十 blocks 彼版本的較,大約落佇咧 LZ 兩百的棋力。

第三个版本

第三个版本的訓練自開始使用二十九个 GPU,到第十四工了後增加為三十七个 GPU,閣二十四工了後(三十八工)增加為四十七个 GPU。

自 v 一垺五 . 零開始支援純 CPU 運算(使用 Eigen 函式庫)。 並自 v 一孵八 . 零版開始支援分散式訓練,允准全球的使用者做伙訓練權重。

相關連結

  • AlphaGo Zero
  • AlphaZero
  • SAI,修改自 Leela Zero,支援動態貼目的圍棋軟體。
  • 電腦圍棋
  • 圍棋軟體

參考資料

註解

外部連結

  • 官方網站(英文)
  • 分散式訓練網站(英文)
  • katago-public,訓練的資料佮訓練出來的網路。
  • Accelerating Self-Play Learning in Go,KataGo 研究所寫落來的論文。