用圍棋理解人工智慧
2015年我第一次聽到"AlphaGo"、"蒙地卡羅"、"次一手正答率"...這些名詞,心裡想深層學習是專學棋譜,蒙地卡羅可是用自己的機制在下棋 ,這又不是在圍棋講解會上猜次一手,正答率有什麼用呢 ?
不會下棋的人還是很容易受騙。正答率高就是棋力高的想法, 不是表示他只會猜次一手,他的意義是對圍棋看法的全面提升,例如:後補手,不止第一順位的候補手,第2位以下的候補手水準也會全面提升,這樣的話棋力當然也會進步 ,概率不是單獨和你打賭次一手,而是在各種互相作用裡,對全方位理解的表現。
ownership(所有權)、criticality (重要度)、第三参數
Ownership 占地模擬結果的平均值, 模擬到最後空地必為一方所占,他的平均值就是目前棋盤空間的情況,會用黑白記號大小顯示佔有率的高低,棋盤全體顯示的就是雙方的勢力分佈圖。
Criticality 是占據某點時,對勝率產生的影響度。空點的數字越高顏色越深表示該點對勝率產生的影響度也越大,也就是棋局的重要部位。和無關緊要的點,不管哪一邊下道都不會影響勝負,數字就會很低。棋子被吃掉,其點就會被對方佔據,所以已經有棋子的點本身也有criticality值,介面無法在旗子上面顯示。
Ownership 是"地"的指標 ,criticality顯示"力"的方向。 地與力是圍棋的兩大要素, 經過電腦的深層學習,加強訓練後的模擬棋力變強,參數的準確性也大大提高,使得參數本身對軟體具有參考價值。 不止於前述"現在對手下哪裡?"有關,狂石下法穩定的部分原因,正是源自ownership。 Zen在中央攻殺蠶鬥時幾乎不會出錯的原因,可能有賴於對於criticality的處理 有關。
第三参數 :
一般的圍棋知識是求更好,但若是變化無限的話,好壞的方向也會模糊,所以要借用概率。我覺得圍棋可以用兩個觀點去含蓋即所謂"空壓法":
- 第一、棋子之間的位置關係...空(間) ,
- 第二、棋子之間的力量關係...壓(力)。
- 和第三參數就是統合空與壓的互補互盛的條件,不是可以分開處理的。
留言
張貼留言
Aron阿龍,謝謝您的留言互動!