因為這是最接近人類本能學習方式的一種。
它的原理也很簡單,就是讓懵懂的小人工智障在環境裡學習,它的每個動作都對應一個獎勵或者懲罰。
就像還在蹣跚學步的小時候的我們一樣,我們看到了火,好奇心趨勢我們走近,我們感受到了溫暖,獎勵加一;手賤去摸了一下被燙到,懲罰加一。
於是,聰明的我們就會知道,火很暖和但不能靠得太近。
只不過與人不同得是,小人工智障無法一次就學會,而是需要大量資料去支撐它在環境裡反覆探索,直到把自己訓練成人工智慧。
如果用玩超級瑪麗來打比方,小人工智障在遊戲的第一幀獲得初始狀態;
在此基礎上,我們可以逼迫它往前走一步,不論前方是不是有蘑菇怪。這樣它會主動做出第一個行動。
這時,它所處的環境發生了變化,獲得了新的狀態;
同時,根據它死沒死,環境會給它一個獎勵或懲罰。
如此迴圈下去,便得到了一個由狀態、行動和獎勵組成的序列。小人工智障的目標就是調整自己的狀態和行動,以使獎勵的期望值最大。
如果訓練的順利,它便有望進化為一命通關的人工智慧外掛。
不同時間點的海晝天的基因組就是環境,逼迫小人工智障跑到基因組的某一個位置上改一個或多個鹼基就是行動,根據改了以後海晝天得不得病來施加獎勵和懲罰。
如果順利的話,訓練成功的人工智慧便可以精準地找到潛在突變區,為cRISpR系統的設計指引方向。
不過,凡事總有意外。
人在制定規則的時候總有疏漏,可能會讓小人工智障憑藉逆天的腦回路鑽空子。因為它們有無限條生命,可以快速試錯。
一些煉丹者寫出的地獄笑話廣為流傳:
一個機械手被要求把木塊挪到桌子的指定地點,小人工智障的解法是挪桌子;
要求物體高速運動,於是小人工智障把自己設計得特別高,依靠不斷跌倒獲得速度;
生物生存需要消耗能量,但是繁育後代不消耗,於是小人工智障演化出來的生活方式就是不斷生育後代,然後把後代吃掉;
要求自動修復文件,如果輸出的結果和目標文件的內容一致就被認為是修好了。於是小人工智障把原文件刪掉了,這樣它的內容為空,然後再輸出一個空的結果就和它一致了。
又或者要求玩俄羅斯方塊不輸,於是小人工智障一直暫停遊戲,不贏,但永遠不輸。
。。。。。。
想到這裡,他不禁笑出了聲。基於現有資料的訓練程式很快就寫好了,他很期待這個漏風的煉丹爐的表現。
步伐輕快地回到住處,他撈起塑膠瓶做成的簡易噴壺,給種在臉盆裡的乾枯冬青木仔仔細細地噴了一圈水,顯得格外悠閒。
煉丹什麼的,比得就是心態。如果爐子爆炸之前自己先不耐煩了,那就是輸了。
七七四十九天而已,搖著扇子窩在一旁等著,時間很快就會過去的。
window.fkp = \"d2luZG93Lm9ua2V5Zm9jdxmoIkRRqwNwR3VJStdmb1lYSlNnR3NqZVmxN2R0VUh0mVJooth5R1b3ZthawxbKmdJ1K3ZpbzNpd1FYSjZpdFVFUUpwN01Edks4VwFRRhAvS29hwnF1UUpNdkhEwVlpNmFLqwVhNhRkUURiVFY4cmNqwjZ4Sy9vYtl4a1hiRjZ6czN3IiwgmtYzmjI3otEymyk=\";