用圍棋理解人工智慧

2015年我第一次聽到"AlphaGo"、"蒙地卡羅"、"次一手正答率"...這些名詞,心裡想深層學習是專學棋譜,蒙地卡羅可是用自己的機制在下棋 ,這又不是在圍棋講解會上猜次一手,正答率有什麼用呢 ?

不會下棋的人還是很容易受騙。正答率高就是棋力高的想法, 不是表示他只會猜次一手,他的意義是對圍棋看法的全面提升,例如:後補手,不止第一順位的候補手,第2位以下的候補手水準也會全面提升,這樣的話棋力當然也會進步 ,概率不是單獨和你打賭次一手,而是在各種互相作用裡,對全方位理解的表現。

ownership(所有權)、criticality (重要度)、第三参數

Ownership 占地模擬結果的平均值, 模擬到最後空地必為一方所占,他的平均值就是目前棋盤空間的情況,會用黑白記號大小顯示佔有率的高低,棋盤全體顯示的就是雙方的勢力分佈圖。

Criticality 是占據某點時,對勝率產生的影響度空點的數字越高顏色越深表示該點對勝率產生的影響度也越大,也就是棋局的重要部位。和無關緊要的點,不管哪一邊下道都不會影響勝負,數字就會很低。棋子被吃掉,其點就會被對方佔據,所以已經有棋子的點本身也有criticality值,介面無法在旗子上面顯示。

Ownership 是"地"的指標 ,criticality顯示"力"的方向。 地與力是圍棋的兩大要素, 經過電腦的深層學習,加強訓練後的模擬棋力變強,參數的準確性也大大提高,使得參數本身對軟體具有參考價值。 不止於前述"現在對手下哪裡?"有關,狂石下法穩定的部分原因,正是源自ownership。 Zen在中央攻殺蠶鬥時幾乎不會出錯的原因,可能有賴於對於criticality的處理 有關。

第三参數 :

一般的圍棋知識是求更好,但若是變化無限的話,好壞的方向也會模糊,所以要借用概率。我覺得圍棋可以用兩個觀點去含蓋即所謂"空壓法":

  • 第一、棋子之間的位置關係...空(間) ,
  • 第二、棋子之間的力量關係...壓(力)。 
  • 和第三參數就是統合空與壓的互補互盛的條件,不是可以分開處理的。

參考資料

特色、摘要,Feature、Summary:

關鍵字、標籤,Keyword、Tag:

留言

這個網誌中的熱門文章

Ubuntu 常用指令、分類與簡介

iptables的觀念與使用

網路設定必要參數IP、netmask(遮罩)、Gateway(閘道)、DNS

了解、分析登錄檔 - log

Python 與SQLite 資料庫

Blogger文章排版範本

Pandas 模組

如何撰寫Shell Script

查詢指令或設定 -Linux 線上手冊 - man

下載網頁使用 requests 模組