頭上懸著三把劍:
如何逆轉非編碼區基因突變程序?
腺病毒如何透過影響非編碼RNA影響植物?
倒計時2548天。
每當看到著四行字時,盧赫都覺得真的有一個大寶劍虛貼在自己的後腦勺上,好像下一秒就要被破瓢。
頭痛。
不過並不是每一個人都像他一樣痛苦。因為倒計時的盡頭是什麼,只有少數人知曉。
事實上,也就是像他一樣的小年輕才會糾結為什麼會從13年縮水到7年。混過職場的老油條對此都是見怪不怪的:
拖延症是打工人的專屬,領導們一般都有強迫症和妄想症。因為他們總是恨不得專案一申下來,立刻就給做完。
所以重要的時間節點,一般都會往前定,給出一定的餘量與緩衝。對於這種關乎人類存亡的事情,餘量6年更是無可厚非。
至於7年的真正緣由誰知道誰不知道,分辨起來也很簡單。
只要搬把椅子坐到門口,翹著二郎腿,心不在焉地掃一眼來人的表情,便可輕易知曉:
剛被奇奇怪怪的早餐摧殘過,神情呆滯地直視一眼橫幅便一股腦往裡衝的,大機率是不知道的。
本來腳步輕快,卻在看到橫幅後停頓一下,然後開始皺眉的,大機率是知道的。
雖然這個鑑別同胞的想法在盧赫腦中存在很久了,但他從未真正實踐過。
因為研究的推進比他想象得要快,短短几天內,基於海晝天基因組的資料集已經建好了,他們可以開始煉丹了。
之所以稱之為煉丹,是因為機器學習模型的訓練過程,受到超引數的影響。
所謂超引數就是人為預先設定的引數,設得好,模型訓練得就快;設得不好,模型可能壓根就不收斂。
至於什麼是好,什麼是不好,只有全知全能老天爺才能知道。
天心最難揣度。
說到底,除了紮實的基礎和豐富的經驗以外,想要快速訓練出一個能用的模型、煉出一個能不把人吃死的丹藥,運氣最重要。
而煉丹是要時間的,七七四十九天之後,如果這丹藥不能用,那麼這時間就被完全浪費掉了。
所以,他跟著那幫專業煉丹的人開了大半天的會,討論了怎樣分配有限的煉丹爐。
雖然他聽不懂那些高深的特徵增廣、小樣本學習、時間序列預測、給資料驅動模型新增物理約束等理論。但作為一個通識課上學了9個學時,就被要求一個暑假裡手擼一個影象識別演算法的高材生,他有他自己的想法。
他要用強化學習。
“對於強化學習而言,我們的樣本太少了。”哪裡都要摻一腳的鄭K一如既往地苦著臉說。
“少就少唄,又不是不能用。再說了,我們不是正在用老鼠造模嗎?造完了樣本就多了。”盧赫不以為然。
“具體思路呢?”鄭K憂心忡忡地問。
“跟你們一樣。特徵是某時間點的基因組,標籤是未來的突變位點,然後讓單鹼基編輯的載著相應嚮導RNA的cRISpR系統在那裡等著,一旦突變了,就立刻給修復。把病扼殺在搖籃裡。
非要說有什麼不同,第一,我這是黑箱,只能發揮作用,卻不知道怎麼發揮作用;第二,我這基本算是端到端的、全自動的,人工干預只在定期查基因組和設計cRISpR系統,這部分工作未來也有希望自動化。
功過相抵,中規中矩。”
散會後,盧赫坐到電腦跟前,摩拳擦掌。
雖然不是專業人士,但一直跟進這方面進展的他,始終覺得那些在數年間如雨後春筍般湧現出來的大幾十種方法裡,強化學習最有前途。