跳至內容
主選單
主選單
移至側邊欄
隱藏
導覽
首頁
近期變更
隨機頁面
MediaWiki說明
Taiwan Tongues 台語維基
搜尋
搜尋
外觀
建立帳號
登入
個人工具
建立帳號
登入
檢視 AlphaZero 的原始碼
頁面
討論
臺灣正體
閱讀
檢視原始碼
檢視歷史
工具
工具
移至側邊欄
隱藏
操作
閱讀
檢視原始碼
檢視歷史
一般
連結至此的頁面
相關變更
特殊頁面
頁面資訊
外觀
移至側邊欄
隱藏
←
AlphaZero
由於以下原因,您無權編輯此頁面:
您請求的操作只有這些群組的使用者能使用:
使用者
、taigi-reviewer、apibot
您可以檢視並複製此頁面的原始碼。
'''AlphaZero'''是 DeepMind 所開發的人工智慧軟體。 ==簡介== AlphaZero 使用佮 AlphaGo Zero 類似但是閣較一般性的演算法,咧無做傷濟改變的前提落,並且演算法對圍棋延伸到將棋佮西洋棋上。AlphaZero 佮 AlphaGo Zero 無仝的所在佇咧: * AlphaZero 的超參數是寫死的。 * AlphaZero 這馬會斷更新人工神經網路。 * 圍棋佇咧某一寡狀況是對稱抑是會當轉踅的,AlphaGo Zero 的程式利用這個特性降低計算複雜性,AlphaZero 因為延伸到將棋佮西洋棋伊是提掉這段程式。 * 西洋棋有已經知影佮局終局資料庫,所以乎 AlphaZero 利用這个終局的資料庫納入計算。 ==佮 Stockfish 以及 elmo 的較== AlphaZero 是無蒙特卡洛樹搜揣,每秒只會當揣八萬步(西洋棋)與四萬步(將棋), 比較起來 Stockfish 每秒會當七千萬步,以及 elmo 每秒會當三千五百萬步,AlphaZero 是利用類神經網路提昇矣搜揣的品質。 ==訓練== AlphaZero 使用五 , 空粒第一代的 TPU 進行訓練。 ==成績== ===西洋棋=== 佇四點鐘的訓練了後(大約自我訓練四千四百萬局), AlphaZero 用二十八勝七十二佮空敗的成績拍敗 Stockfish。 ===將棋=== 你若十二點鐘的訓練了後(大約是自我訓練兩千四百萬局), AlphaZero 以九十勝二佮八敗的成績拍敗 elmo。 ===圍棋=== 佇咧三十四點鐘的訓練了後(大約是自我訓練兩千一百萬局), AlphaZero 以六十勝四十敗的成績拍敗 AlphaGo Zero。 ==相關連結== * AlphaGo Zero * DeepMind * ELF OpenGo * KataGo ==參考資料== ==外部連結== * Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm,AlphaZero 的論文。 * Game Downloads,AlphaZero 佮西洋棋軟體 Stockfish 的對弈記錄。 * Chess . com Youtube playlist for AlphaZero vs . Stockfish [[分類: 待校正]]
返回到「
AlphaZero
」。