人工智能研發重鎮 DeepMind 創造的 AlphaGo,憑借擊敗國際象棋大師和圍棋冠軍一炮而紅,但這家只有科學研發業務的“創業公司”有一位永遠不滿足于現狀的創始人戴密斯·哈薩比斯(Demis Hassabis)。在公司 2018 年虧損額高達 5.72 億美元(約合 40 億人民幣)的情況下,他依然想要解決能改變真實世界的、更大的科學問題。
戴密斯·哈薩比斯 | 圖片來源:Wired
來源 WIRED.UK
作者 Greg Williams
編譯 桑頌
編輯 魏瀟
戴密斯·哈薩比斯(Demis Hassabis)——前兒童國際象棋神童、劍橋大學雙學科績優生、世界智力運動會(World Mind Sports Olympiad)五屆冠軍得主、麻省理工學院(MIT)和哈佛大學校友、游戲設計師、青年創業者,以及人工智能(AI)創業公司 DeepMind 的聯合創始人——此刻正頭戴黃色頭盔,身著高領夾克和工裝靴,站在國王十字街區(King’s Cross)的一個屋頂上注視著倫敦,這是一個能夠從各個方向俯瞰這座城市的地方,在這里他能望到通往海格特(Highgate)的斜坡,他和他的家人就住在那里。
他來到這里是為了巡視 DeepMind 正在建設的新總部大樓,這家公司于 2010 年由他和倫敦大學學院(University College London, UCL)的研究員塞恩·雷格(Shane Legg)以及童年摯友穆斯塔法·蘇萊曼(Mustafa Suleyman)一同創建。雖然世人都默認 DeepMind 是一家科技創業公司,但它目前的主要業務仍是科學研發,而且已經在學術期刊上發表了數百篇論文——這和那些人工智能研究機構做的事情沒有什么區別。這棟由 500 個建筑承包商打造的大樓計劃于 2020 年中投入使用,象征著 DeepMind 的新起點。
DeepMind 官網對研究成果的介紹
新總部的位置位于國王十字車站以北,以“知識街區(Knowledge Quarter)”聞名。DeepMind 創建時,倫敦的大部分創業公司還在屈從于舊街(Old Street.)的影響力。但哈薩比斯和他的合伙人卻有著不同的愿景:“破解人類智能之謎”,并發展通用人工智能(AGI)——更加強大的、能夠應用于多領域的 AI。到目前為止,AI主要是通過構建能夠贏得游戲的算法來實現的,比如打磚塊、國際象棋和圍棋。下一步則是將其應用于科學研究,利用計算機科學來解決化學、物理學和生物學中的復雜問題。
“我們是一家研發為主的公司,” 43 歲的哈薩比斯說。“我們希望離大學近一點,”他指的是倫敦大學學院(UCL),在那里他憑借題為《以神經活動進程為基礎的情景記憶研究》的論文,獲得了自己的博士學位。“這也是為什么我們喜歡留在這兒,我們仍然離 UCL、大英圖書館、圖靈研究所很近,離帝國理工也不算太遠……”
哈薩比斯和他的合伙人深知,DeepMind 以它在機器學習和深度學習方面的突破而聞名于世:他們開發的神經網絡算法不但精通電腦游戲,還擊敗了國際象棋大師,并讓世界圍棋冠軍李世乭宣告:“從游戲開始的那一刻起,我就沒有一刻覺得自己能贏。”
“人機圍棋大戰”第二局前99手。| 來源:Wikipedia
過去,機器在與人類的棋類或其他類游戲比賽中會顯現出明顯的算法特征:應對風格嚴格且死板。但是在圍棋對弈中,DeepMind 開發的人工智能 AlphaGo 以一種近乎人類的方式打敗了李世乭。第二局比賽中第 37 手一個極不尋常的舉動令那些在首爾現場觀戰的人們倒吸了一口冷氣,并讓數百萬在線觀眾感到困惑—— AI 用一種在人類眼中極富創造力的方式走了一步棋。
對于哈薩比斯、蘇萊曼和雷格來說,如果 DeepMind 的前九年被認為是他們集中研究強化學習(reinforcement learning)的階段【這種基于代理系統的理論不僅試圖讓 AI 建立起所處世界和識別模式的模型(像深度學習所做的那樣),也能讓 AI靈活地做出決定并努力達到目標)】,那么目前 AI 通過游戲對抗帶來的證據將定義下一個十年:即使用數據和機器學習來解決一些科學中最難的問題。哈薩比斯說,他們下一步的工作將從這個問題出發:找到一個方法,讓深度學習將強化學習拓展到真實世界的問題中。
“強化學習的缺點在于它一直集中于解決于小玩具式的問題,這就像網格一樣規律又簡單,”他說。“人們覺得它可能無法拓展到混亂真實的現實問題,這才是我們想把強化學習和深度學習聯合起來并起到作用的地方。”
對于 DeepMind 來說,新總部的修建象征著公司的新篇章——努力將研究的影響力和計算能力轉變為對構筑有機生命的單元的理解。這家公司希望通過這種做法能夠在醫學和其他學科取得對多個領域產生影響的突破。“我們的任務將是科學發展史上最迷人的旅程之一,”哈薩比斯說。“我們正在努力建造一個科學進取的殿堂。”
在 UCL 和 MIT 求學期間,哈薩比斯發現跨學科合作成了熱門。在他的回憶里,研討會是由來自不同學科如神經科學、心理學、數學乃至哲學的學者們參與的。研究者們在回到自己所屬院系前會進行幾天的交流和辯論,并說好要定期聚會、尋找合作方法。但是下一次會議很可能在一年之后才能召開——申請經費、教學任務以及研究和學術生活都會妨礙這種跨學科合作。
“開展跨學科研究很難,”哈薩比斯說。“假設有兩位在數學和基因組學領域世界領先的科學家——顯然這之間存在一些交叉——但是誰來充當理解他人領域的工作、術語以及真正問題的角色呢?”
即便找到了該領域存在的真正問題,那么為什么這個問題還沒有被解答?如果沒有得到解答,那么它面臨的棘手困難是什么?這在外人看來可能很簡單。但是即使是處于同一學科的科學家,也不總是用同樣的方式來看待他們的工作。而且眾所周知的是,學者們很難為其他學科增添價值,找到一個能一起攻克的共性問題就更難了。
現在的 DeepMind 總部——實際上就是國王十字街區 Google 大廈中的兩層——近年已越來越知名。僅公司的 AI 研究就集中了六到七個學科,在擴大影響范圍的同時還一直在招募數學、物理學、神經科學、心理學、生物學和哲學方面的專家。
“科學最有趣的領域在于學科間的斷層和交叉,”哈薩比斯說。“我努力建設 DeepMind 是為了尋找‘粘合劑人才’——那些在多個領域都處于世界一流水平的人才,擁有找到不同學科之間相似之處和連接點的創造力。”
普什米·科里(Pushmeet Kohli)就是“粘合劑人才”中的一員——這位微軟研究院(Microsoft Research)的前任主管,現在正領導著 DeepMind 的科學團隊。那段幾乎沒有任何實際進展的“ AI 寒冬”在過去十年已經結束。如今,面臨類似困境的,是蛋白質折疊預測。
蛋白質結構示意圖。| 來源:Pixabay
科里匯集了一支由結構生物學、機器學習和物理學專家組成的團隊來迎接這項重要問題挑戰。蛋白質是所有哺乳動物生命的基礎,它們在分子水平上搭建起了組織和器官的大部分結構和功能。它由氨基酸序列構成,氨基酸序列的折疊結構決定了蛋白質的形狀,進而決定其功能。
“蛋白質是有史以來最令人嘆為觀止的機器,它允許原子在納米尺度移動,化學效率是人造機器的 10n 倍,”約翰·江珀(John Jumper)說,他是 DeepMind 的蛋白質折疊研究者。“這些自組裝機器非常不可思議。”譬如,蛋白質對細胞的每種功能來說都是必需的,而錯誤折疊的蛋白質被認為是導致帕金森、阿茨海默癥和糖尿病等疾病的關鍵因素。
“如果了解蛋白質自然形成的過程,我們自己就能夠構建它,”江珀說。“是時候看清這個復雜的微觀世界了。”
蛋白質折疊問題能夠吸引 DeepMind 團隊的原因還包括基因組數據集的廣泛應用。從 2006 年開始,DNA 數據的采集、存儲、傳遞和分析開始激增。研究人員推測到 2025 年時,可能已經有二十億個基因組數據集被分析,這需要占據 40 EB(exabyte,1 EB = 1024 PB = 1048576 TB)的儲存容量。
“從深度學習的角度來這是一個很好的問題,因為人類付出了巨大的金錢、復雜性和時間(投入)成本,我們用來理解蛋白質結構的驚人資源已經到位,”江珀說。
取得進展的同時,科學家們也在警惕虛假繁榮的泡沫。備受尊敬的美國分子生物學家塞勒斯·萊文索爾(Cyrus Levinthal)冷靜地表達了這項挑戰的復雜性,他指出在得到正確的三維結構之前,找出一種代表性蛋白質所有可能結構所需的時間,可能比整個宇宙的發展進程還要長。“搜索空間非常巨大,” DeepMind 的研發科學家里奇·埃文斯(Rich Evans)說,“比圍棋還要大。”
無論如何,在 2018 年 12 月墨西哥坎昆舉行的蛋白質結構預測技術關鍵評估(Critical Assessment of Techniques for Protein Structure Prediction,CASP)大會中,DeepMind 通過已知的氨基酸序列預測蛋白質結構,取得了里程碑式的進展。
他們的參賽代表是 AlphaFold——他們在之前兩年間開發出的新 AI。組織方會提前向參賽成員發送數據集,后者則在不知道是否正確的情況下發回他們的預測結果。一共有 90 個蛋白質結構需要預測,其中一些是已經有模板的預測目標,參賽者能使用已解析出結構的蛋白質作為參考,而另一些則要從頭開始建模。DeepMind 團隊的最終賽果可以稱得上輝煌:AlphaFold 總體上比其他團隊更準確,一些指標遠超其他團隊,在需要從頭建模的 43 個蛋白質序列模型中,AlphaFold 精準預測了 25 個,并且優勢十分明顯——第二名只成功預測出了 3 個。
AlphaFold在CASP13比賽中預測的蛋白質三維骨架可視化圖。| 來源:Wired
此次預測競賽的參與者、來自哈佛醫學院的穆罕默德·阿爾庫雷希(Mohammed AlQuraishi)表示:“我承認他們做得很好,但卻沒想到會那么好。”
根據阿爾庫雷希的介紹,DeepMind 使用的方法與其他實驗室是類似的,但其獨特之處在于它們能夠“更好地完成”。他同時指出了 DeepMind 團隊在工程方面的實力。
“我認為他們能夠比學術團隊做得更好,因為這個領域的學術團隊往往不愿公開自己的成果,”阿爾庫雷希說。“而且,即使 DeepMind 將他們對算法的構思公之于眾讓大家獨立地嘗試,也沒有人能將它們整合起來。”
阿爾庫雷希將機器學習領域的學術團體做了個對比,近年來像 Google Brain、DeepMind 和 Facebook 這類公司經歷了一些大規模的變遷,它們的組織結構變得更加高效、薪酬待遇更為充足,而且擁有大學里沒有的計算機資源。
“在一定程度上來說,機器學習領域的計算機科學團體在過去的四到五年中已積累了豐富的經驗,”他說。“計算生物學(Computational biology)在嶄新的現實面前才剛剛蘇醒。”
這與 DeepMind 的創始人在 2014 年 1 月被 Google 收購時的解釋相呼應。Google 龐大的計算設備網絡能夠使公司更快地推動研究進展,而 4 億英鎊(約合 34 億人民幣)的支票讓雇傭世界一流人才成為可能。哈薩比斯描述了招募適合特定研究領域的目標人才的策略。“我們的路線圖告訴我們哪個學科領域或者 AI /神經科學的哪個子領域將是重要的,”他說。“然后我們就去找到相應領域中最優秀的人。”
“像 DeepMind 這樣的公司,我認為研究蛋白質折疊是一個很好的起點,因為它的問題很明確,并且有能夠使用的數據,你幾乎像是在處理一個純粹的計算機科學問題。”阿爾庫雷希說。“在其他的生物學領域則不太現實,它們更麻煩。因此,我并不認為 DeepMind 在蛋白質折疊方向取得的成功能夠自動轉化到其他領域。”
作為一家研究型企業,DeepMind 的項目管理體系非常龐大。每 6 個月,高級項目經理會審查優先事項、重新組織一些項目并對團隊成員尤其是工程師們進行激勵、并進行人事調整。學科交叉是常見且有意為之的。公司的許多項目周期都比較長,通常在兩到四年之間。但是,盡管 DeepMind 的信息一直圍繞其研究,它現在是 Google 母公司——Alphabet 旗下的一個子公司,同時也是全球排位第四的最有價值公司。在倫敦的學者期望他們能夠參與長期、開創性的研究的同時,加利福尼亞的高管們則會留心他們的投資回報率。
曾有媒體報道,DeepMind 近年來接連虧損,其 2018 年虧損已達 5.72 億美元(約合 40 億人民幣)。可以明確的是,錢大部分都貢獻給了旗下員工:DeepMind 雇用數百名昂貴的研究人員和數據科學家,但并沒有產生任何重大收入。2018 年,DeepMind 為約 700 名員工花費了 4.8 億美元,員工平均年薪高達 400 萬人民幣,比 2017 年增加了近一倍。
“我們關注產品,我們希望 Google 和 Alphabet 是成功的,并且能夠通過我們正在進行的研究獲取利潤——他們擁有 DeepMind 編程的數十種產品和背后的技術,重要的是這是一種推動而不是拉動,”哈薩比斯說。
“許多產業研究都是產品導向的,”哈薩比斯說。“問題在于你只能做增量研究,這不利于開展重大突破所必須的、有雄心高風險的研究。”
哈薩比斯提到,大型制藥公司會為研發投入數十億美元:在季度盈利報告的推動下,制藥行業隨著失敗成本的增加變得愈加保守。根據創新基金會 Nesta 2018 年的一份報告,在過去 50 年中,生物醫藥研發生產力穩步下降——盡管公共和私人投資大幅增加,但新藥的開發成本越來越高。該報告指出,“開發新藥的成本呈指數增長,這直接反映在研發支出的低回報率上。最近的一項估計顯示,全球最大的制藥公司的回報率為 3.2% ; 同樣,德勤的研究估計,生物制藥的研發回報率從 2010 年的 10.1% 降至 2018 的 1.9%,達到了 9 年來的最低水平。
“看看大多數大型制藥公司的首席執行官,他們不是科學家,而是來自財務部門或營銷部門,”哈薩比斯說。“這對組織有什么影響?這意味著公司要從已經發明的東西中擠出更多利潤,比如削減成本或拓展市場,而不是真正發明新東西——這更有風險。你不能就這么輕易地把電子表格里的研發成本砍掉。這不是一種富有創造力的思維方式......
對于許多創業者來說,他們常擁有一個機緣巧合的起點——他們遇到了讓自己下定決心解決的問題,偶然遇到了合伙人或投資人以及擁護自己想法的學者。但對哈薩比斯來說情況并非如此,他有目的地做了一系列決定——其中一些甚至是在生命中更早的階段就定下了的,而這些決定最終促成了 DeepMind 的誕生。“這是我窮盡一生來抵達的目標,”他說。“從游戲設計,到游戲對抗、學習神經科學和編程、大學期間學習 AI、去許多世界頂級機構深造、攻讀博士學位的同時開始創立自己的早期事業……我已經盡可能地用上了自己的每一點經驗。我很明確,在每個人生路口做出的選擇最終匯聚在一起,形成了我目前的人生。”
即便公司已經準備搬到新的總部,哈薩比斯仍認為 DeepMind 還是一家創業公司,正在與世界上其他國家(如中國和美國)的公司進行競爭,“有許多大公司在試圖做這些事情,”他說。他提到,盡管取得了進展,但 DeepMind 在破解人類智能之謎、建立 AGI 上仍有很長的路要走。“我仍然希望我們保持有一個創業公司應該有的渴望、節奏與活力。”
DeepMind 的員工們站在國王十字街區的屋頂上。| 來源:Wired
創新是困難且孤獨的。建立一個組織的流程和文化,使其能夠“在世界中有所作為,”——就像史蒂芬·喬布斯(Steve Jobs)告訴團隊開發 Mac 計算機那樣,很少有企業或者機構能夠在多領域發展出多條產品線。隨著 DeepMind 的發展,創始人需要尋求前路,同時密切留意在未來幾年中可能成為最具變革性的技術,這其中充滿著潛在的危險及機遇。
“你會度過許多艱難的日子,我認為在一天結束時,努力賺到很多錢或其他任何事情都不足以幫你度過那些真正痛苦的節點,”哈薩比斯說。“只有真正地懷有熱情并堅定地相信自己所做是真正重要的事情,才能讓你渡過難關。”