精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
圖靈獎(jiǎng)得主Judea Pearl:機(jī)器學(xué)習(xí)無(wú)法成為強(qiáng)AI基礎(chǔ),突破口在“因果革命”





  新智元編譯  

來(lái)源:arXiv

編輯:新智元編輯部


【新智元導(dǎo)讀】圖靈獎(jiǎng)得主、貝葉斯網(wǎng)絡(luò)之父Judea Pearl日前在arXiv上傳了他的最新論文,論述當(dāng)前機(jī)器學(xué)習(xí)理論局限,并給出來(lái)自因果推理的7大啟發(fā)。Pearl指出,當(dāng)前的機(jī)器學(xué)習(xí)系統(tǒng)幾乎完全以統(tǒng)計(jì)學(xué)或盲模型的方式運(yùn)行,不能作為強(qiáng)AI的基礎(chǔ)。他認(rèn)為突破口在于“因果革命”,借鑒結(jié)構(gòu)性因果推理模型,能對(duì)自動(dòng)化推理做出獨(dú)特貢獻(xiàn)。



深度學(xué)習(xí)理論研究已經(jīng)引發(fā)了越來(lái)越多的關(guān)注,但是,機(jī)器學(xué)習(xí)也存在理論上的局限性。


然而,對(duì)于這個(gè)問(wèn)題的關(guān)注,似乎還沒(méi)有掀起多大波瀾。


近日,圖靈獎(jiǎng)得主、貝葉斯網(wǎng)絡(luò)之父Judea Pearl在arXiv上傳了他的最新論文,論述當(dāng)前機(jī)器學(xué)習(xí)理論局限,并給出來(lái)自因果推理的7大啟發(fā)。


或許,你還記得 NIPS 2017上Judea Pearl 落寞的身影——在他關(guān)于機(jī)器學(xué)習(xí)理論局限的報(bào)告會(huì)上,到場(chǎng)的人數(shù)稀少。


CMU教授Eric Xing的消息,Judea Pearl報(bào)告會(huì)場(chǎng)人跡稀少,圖片來(lái)自周志華


報(bào)告的題目《機(jī)器學(xué)習(xí)的理論障礙》(Theoretical impediments to machine learning),正是Judea Pearl對(duì)機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)背后理論的思考。


雖然無(wú)法親到現(xiàn)場(chǎng),但我們可以細(xì)細(xì)閱讀Pearl這篇“因果革命”的論文。


Judea Pearl:落寞的身影與因果推理尚未激起的7大火花


Judea Pearl 曾獲得2011年的圖靈獎(jiǎng),獎(jiǎng)勵(lì)他在人工智能領(lǐng)域的基礎(chǔ)性貢獻(xiàn),他提出概率和因果性推理演算法,徹底改變了人工智能最初基于規(guī)則和邏輯的方向。他主要的研究領(lǐng)域是概率圖模型和因果推理,這是機(jī)器學(xué)習(xí)的基礎(chǔ)問(wèn)題。圖靈獎(jiǎng)通常頒給純理論計(jì)算機(jī)學(xué)者,或者早期建立計(jì)算機(jī)架構(gòu)或框架的學(xué)者。


身為 UCLA 計(jì)算機(jī)科學(xué)系的教授,Judea Pearl曾兩次居于科學(xué)革命的中心:第一次是在 20 世紀(jì) 80 年代,他為人工智能引入了一套新的工具,叫貝葉斯網(wǎng)絡(luò)。第二次革命,鑒于貝葉斯網(wǎng)絡(luò)在計(jì)算上的優(yōu)勢(shì),Pearl 意識(shí)到簡(jiǎn)單的圖模型和概率論(正如貝葉斯網(wǎng)絡(luò)中的那樣)也能用于因果關(guān)系的推理。這一發(fā)現(xiàn)為人工智能的發(fā)展奠定了另一個(gè)基礎(chǔ),但意義遠(yuǎn)非如此,這一能驗(yàn)證因果關(guān)系的、條理性的數(shù)學(xué)方法,幾乎已經(jīng)被所有科學(xué)和社會(huì)科學(xué)領(lǐng)域采用。


Judea Pearl 還是美國(guó)國(guó)家工程院院士,AAAI 和 IEEE Fellow,是以他兒子姓名命名的 Daniel Pearl 基金會(huì)的主席(他的兒子Daniel Pearl曾是華爾街日?qǐng)?bào)記者,2002年被巴基斯坦恐怖份子綁架并斬首,為這事美國(guó)還專門拍了一部電影 ” A Mighty Heart” 。)


機(jī)器學(xué)習(xí)理論障礙與因果革命七大火花。



摘要

目前的機(jī)器學(xué)習(xí)系統(tǒng)幾乎完全以統(tǒng)計(jì)學(xué)或盲模型的方式運(yùn)行,這對(duì)于其力量和性能造成了嚴(yán)格的理論上的限制。這樣的系統(tǒng)不能引發(fā)干預(yù)和反思,因此不能作為強(qiáng)AI的基礎(chǔ)。為了達(dá)到人類智力水平,會(huì)學(xué)習(xí)的機(jī)器需要現(xiàn)實(shí)模型的指導(dǎo),類似于在因果推理任務(wù)中使用的模型。為了演示這些模型的重要作用,我將提出七個(gè)任務(wù)的總結(jié),這些任務(wù)是當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)無(wú)法實(shí)現(xiàn)的,并且是使用因果建模工具完成的。


科學(xué)背景


如今,如果我們審視驅(qū)動(dòng)機(jī)器學(xué)習(xí)的系統(tǒng),我們發(fā)現(xiàn)它幾乎完全以統(tǒng)計(jì)學(xué)的方式運(yùn)行。換句話說(shuō),學(xué)習(xí)機(jī)器通過(guò)來(lái)自環(huán)境的感官輸入流參數(shù)來(lái)優(yōu)化其性能。這是一個(gè)緩慢的過(guò)程,在很多方面類似于達(dá)爾文進(jìn)化論的自然選擇過(guò)程。


它解釋了老鷹和蛇這樣的物種如何在數(shù)百萬(wàn)年的時(shí)間里發(fā)展出高超的視覺(jué)系統(tǒng)。然而,它不能解釋科技超級(jí)進(jìn)化的過(guò)程,例如人類能夠在幾千年的時(shí)間里建立眼鏡和望遠(yuǎn)鏡。


人類所擁有而其他物種所缺乏的是一種心理表征,一種人類可以增加意志、想象、假設(shè)、規(guī)劃和學(xué)習(xí)來(lái)操縱生存藍(lán)圖的能力,像哈拉里(N. Harari)和米森(S. Mithen)這樣的人類學(xué)家普遍認(rèn)同這一點(diǎn)。


在4萬(wàn)年前,我們智人祖先實(shí)現(xiàn)全球統(tǒng)治的決定性因素,是他們編排環(huán)境的心理表征的能力、質(zhì)疑表征的態(tài)度、并通過(guò)想象的精神付諸行動(dòng),最后假設(shè)“如果不這樣呢?”,或提出介入性探究:“如果我采取行動(dòng)呢?”以及回顧性、解釋性反思:“如果我采取了不同的行動(dòng)呢?”、“如果我們禁止吸煙會(huì)怎樣?” 如今,絕大多數(shù)機(jī)器學(xué)習(xí)都不具備解決這些問(wèn)題的能力。


我認(rèn)為解決這些問(wèn)題的關(guān)鍵是給機(jī)器裝備因果推理工具來(lái)加速學(xué)習(xí),以達(dá)到人類認(rèn)知水平。這個(gè)假設(shè)在20年前的反事實(shí)信息數(shù)學(xué)化階段就已經(jīng)被推測(cè)了,但今天不是這樣。


圖形和結(jié)構(gòu)模型的進(jìn)步使反事實(shí)計(jì)算上易于管理,從而使得模型驅(qū)動(dòng)推理出一個(gè)更有前途的方向,利于建立強(qiáng)大的AI。在下一節(jié)中,我將使用三級(jí)層次來(lái)描述機(jī)器學(xué)習(xí)系統(tǒng)所面臨的障礙,這個(gè)三級(jí)層次管理因果推理中的推理。最后一節(jié)總結(jié)了如何利用現(xiàn)代因果推斷工具規(guī)避這些障礙。


因果關(guān)系的三大層次


圖1:因果關(guān)系層級(jí)。i 級(jí)的問(wèn)題只有在 i 級(jí)或以上級(jí)別的信息能夠獲取時(shí)才能被回答。


因果推理的邏輯所揭示的一個(gè)非常有用的見解是,就每個(gè)類別能夠回答的問(wèn)題類型而言,存在對(duì)因果信息的一個(gè)清晰的分類。


這個(gè)分類形成了一個(gè)三層的層次結(jié)構(gòu),這意味著只有當(dāng)層次 j(j ≥ i)的信息可以獲得時(shí),層次 i(i = 1,2,3)上的問(wèn)題才能被回答。


圖1顯示了有3級(jí)的層次結(jié)構(gòu),以及每個(gè)級(jí)別可以回答的典型問(wèn)題。這些級(jí)別分別為:①聯(lián)想(Association),②干預(yù)(Intervention),③反事實(shí)(Counterfactual)。選擇這些名字是為了強(qiáng)調(diào)它們的用法。我們叫第一層聯(lián)想,因?yàn)樗{(diào)用了純粹的統(tǒng)計(jì)關(guān)系,由裸數(shù)據(jù)定義。例如,購(gòu)買牙膏的顧客也更容易購(gòu)買牙線;這種關(guān)聯(lián)可以使用條件期望直接從觀測(cè)數(shù)據(jù)中推斷出來(lái)。這一層的問(wèn)題由于不需要因果信息,因此被放置在最底層。第二級(jí)干預(yù)比聯(lián)想要高,因?yàn)樗婕暗牟粌H僅是看到什么,還包括改變我們所看到的。這個(gè)級(jí)別的典型問(wèn)題是:如果我們將價(jià)格加倍會(huì)發(fā)生什么?這樣的問(wèn)題不能單從銷售數(shù)據(jù)來(lái)回答,因?yàn)樗鼈兩婕暗娇蛻粜袨榈淖兓@會(huì)影響新的定價(jià)。這些選擇可能與以前的漲價(jià)情況有很大不同。(除非我們精確地復(fù)制價(jià)格達(dá)到目前價(jià)值兩倍的市場(chǎng)條件。)最后,最頂層被稱為反事實(shí)信息(Counterfactuals),這個(gè)術(shù)語(yǔ)可以追溯到哲學(xué)家大衛(wèi)·休謨和約翰·斯圖爾特·穆勒(John Stewart Mill),也是過(guò)去二十年來(lái)一直使用的,對(duì)計(jì)算機(jī)友好的語(yǔ)義。反事實(shí)類別中的一個(gè)典型問(wèn)題是,“如果我采取了不同的行動(dòng)會(huì)怎么辦”,因此需要追溯推理。


反事實(shí)被放在層次結(jié)構(gòu)的最頂層,是因?yàn)樗鼈儼深A(yù)和聯(lián)想的問(wèn)題。如果我們有一個(gè)可以回答反事實(shí)問(wèn)題的模型,我們也可以用它來(lái)回答關(guān)于干預(yù)和聯(lián)想的問(wèn)題。例如,如果把價(jià)格加倍會(huì)發(fā)生什么(干預(yù)型問(wèn)題)可以通過(guò)提出一個(gè)反事實(shí)的問(wèn)題來(lái)回答:價(jià)格是目前價(jià)值的兩倍會(huì)發(fā)生什么?同樣,當(dāng)我們可以回答干預(yù)型問(wèn)題,聯(lián)想類問(wèn)題也能得到回答。


相反,有了聯(lián)想問(wèn)題模型,并不能回答更上層的問(wèn)題,比如我們不能對(duì)那些接受過(guò)藥物治療的受試者重新進(jìn)行實(shí)驗(yàn),看看他們沒(méi)有吃藥的話有會(huì)怎樣的行為。因此,層次結(jié)構(gòu)是有方向性的,頂層是最強(qiáng)大的層次。


反事實(shí)是科學(xué)思維的基石,法律和道德推理亦是。例如,在民事法庭,被告被認(rèn)為是造成傷害的罪魁禍?zhǔn)住H绻麤](méi)有被告的行為,傷害很可能就不會(huì)發(fā)生。“如果沒(méi)有”的計(jì)算意義要求比較現(xiàn)實(shí)世界和沒(méi)有發(fā)生被告行為的另一個(gè)世界。


層次結(jié)構(gòu)中的每一層都有一個(gè)句法簽名,用來(lái)表征被錄入的那層語(yǔ)句。例如,關(guān)聯(lián)層的特征是條件概率句,例如P(y | x)= p,說(shuō)明:假設(shè)我們觀察到事件X = x,事件Y = y的概率等于p。在大型系統(tǒng)中,可以使用貝葉斯網(wǎng)絡(luò)或任何支持深度學(xué)習(xí)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)來(lái)高效計(jì)算這些證據(jù)句子。


在介入層,我們找到類型為P(y | do(x),z)的句子,它表示“事件Y = y的概率,假設(shè)我們介入并將X的值設(shè)為x,然后觀察事件Z = ?。這樣的表達(dá)式可以從隨機(jī)試驗(yàn)或者使用因果貝葉斯網(wǎng)絡(luò)(Pearl,2000,第3章)進(jìn)行實(shí)驗(yàn)性的估計(jì)。一個(gè)孩子通過(guò)對(duì)環(huán)境的有趣操縱(通常在一個(gè)確定性的操場(chǎng)上)來(lái)學(xué)習(xí)干預(yù)的效果,人工智能規(guī)劃人員通過(guò)行使他們指定的行為來(lái)獲得干預(yù)知識(shí)。無(wú)論數(shù)據(jù)有多大,都不能從被動(dòng)觀察中推斷干涉表達(dá)。


最后,在反事實(shí)層面上,我們有了類型P(yx | x',y')的表達(dá)式,它代表“如果我們觀察到X是x,事件Y = y的概率就會(huì)被觀察到,基于我們實(shí)際上觀察到X是x’和Y是y'。例如,如果Joe讀完大學(xué),他的工資就會(huì)是y。而他“只上了兩年大學(xué)”,實(shí)際工資就會(huì)是y’。”只有在我們擁有功能或結(jié)構(gòu)方程模型時(shí)或具有這些模型的屬性時(shí),才能計(jì)算出來(lái)這樣的句子。(Pearl,2000,第7章)。


這個(gè)層次結(jié)構(gòu)及其所需的形式限制,解釋了為什么基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)系統(tǒng)無(wú)法推理行動(dòng),實(shí)驗(yàn)和解釋。它也告訴我們需要哪些額外的統(tǒng)計(jì)信息,以何種格式來(lái)支持這些推理模式。


研究人員經(jīng)常感到驚訝的是,這個(gè)層次結(jié)構(gòu)降低了把深度學(xué)習(xí)的成就降到了聯(lián)想的級(jí)別。與課本曲線擬合練習(xí)并列。一個(gè)反對(duì)這種比較的觀點(diǎn)認(rèn)為,在深度學(xué)習(xí)上我們盡量減少“過(guò)擬合”,而曲線擬合的目標(biāo)是盡可能最大化“擬合”。不幸的是,分隔三層的理論障礙在層次結(jié)構(gòu)中告訴我們,我們的目標(biāo)函數(shù)的性質(zhì)并不重要。只要我們的系統(tǒng)優(yōu)化觀測(cè)數(shù)據(jù)的某些屬性,但沒(méi)有提及數(shù)據(jù)之外的世界,我們又回到了層次結(jié)構(gòu)的第一層面,這一層面有許多局限性。


因果推理模型的7大支柱:你能用因果推理模型做什么?


考慮以下 5 個(gè)問(wèn)題:


  • 給定的療法在治療某種疾病上有多有效?

  • 是新的稅收優(yōu)惠導(dǎo)致了銷量上升了嗎?

  • 每年的醫(yī)療費(fèi)用上升是由于肥胖癥人數(shù)增多導(dǎo)致的嗎?

  • 招聘記錄可以證明雇主的性別歧視罪嗎?

  • 我應(yīng)該放棄我的工作嗎?


這些問(wèn)題的一般特征是它們關(guān)心的都是原因和效應(yīng)的關(guān)系,可以通過(guò)諸如導(dǎo)致、由于、證明和應(yīng)該等詞看出這類關(guān)系。這些詞在日常語(yǔ)言中很常見,并且社會(huì)一直都需要這些問(wèn)題的答案。然而,直到最近都沒(méi)有足夠好的科學(xué)方法對(duì)這些問(wèn)題進(jìn)行表達(dá),更不用說(shuō)回答這些問(wèn)題了。和幾何學(xué)、機(jī)械學(xué)、光學(xué)或概率論的規(guī)律不同,原因和效應(yīng)的規(guī)律曾被認(rèn)為不適合應(yīng)用數(shù)學(xué)方法進(jìn)行分析。


但是,過(guò)去30年來(lái),事情已發(fā)生巨大變化。一種強(qiáng)大而透明的數(shù)學(xué)語(yǔ)言已被開發(fā)出來(lái)用于處理因果關(guān)系,還有配套的把因果分析轉(zhuǎn)化為數(shù)學(xué)博弈的工具。這些工具讓我們能夠表達(dá)因果問(wèn)題,然后用數(shù)據(jù)來(lái)估計(jì)答案。


我把這種轉(zhuǎn)化稱為“因果革命”(Pearl and Mackenzie, 2018, forthcoming),而導(dǎo)致因果革命的數(shù)理框架我將其稱之為“結(jié)構(gòu)性因果模型”(Structural Causal Models,SCM)。


SCM 由三部分構(gòu)成:圖模型、結(jié)構(gòu)化方程、反事實(shí)和干預(yù)式邏輯


其中,圖模型作為表征知識(shí)的語(yǔ)言,反事實(shí)邏輯幫助表達(dá)問(wèn)題,結(jié)構(gòu)化方程以清晰的語(yǔ)義將前兩者關(guān)聯(lián)起來(lái)。



接下來(lái)我將介紹 SCM 框架的 7 項(xiàng)最重要的特性,并討論每項(xiàng)特性對(duì)自動(dòng)化推理做出的獨(dú)特貢獻(xiàn)。


1. 編碼因果假設(shè)——透明度和可測(cè)試性


一旦我們認(rèn)真對(duì)待透明度(transparency)和可測(cè)試性(testability)的要求,用一種緊湊的、可用的形式來(lái)編碼假設(shè)的任務(wù)并不是一件簡(jiǎn)單的事情。透明度使分析人員能夠辨別所編碼的假設(shè)是否合理(基于科學(xué)依據(jù)),或者是否有必要進(jìn)行額外的假設(shè)。可測(cè)試性允許我們(無(wú)論是分析師還是機(jī)器)能夠確定所編碼的假設(shè)是否與可用數(shù)據(jù)兼容,如果不兼容,則識(shí)別那些需要修復(fù)的假設(shè)。


圖模型(graphical models)的進(jìn)步使緊湊編碼變得可行。它們的透明度來(lái)源于這樣一個(gè)事實(shí):所有假設(shè)都是用圖形編碼的,這與研究人員對(duì)領(lǐng)域中因果關(guān)系的理解方式是一致的;不需要對(duì)反事實(shí)或統(tǒng)計(jì)依賴性的判斷,因?yàn)檫@些可以從圖的結(jié)構(gòu)中讀出。可測(cè)試性是通過(guò)一個(gè)稱為d-separation的圖形標(biāo)準(zhǔn)來(lái)促進(jìn)的,它提供了原因和概率之間的基本聯(lián)系。它告訴我們,對(duì)于模型中任何給定的路徑模式,哪些依賴模式是數(shù)據(jù)中應(yīng)該存在的(Pearl, 1988)。


2. Do-calculus和控制混雜


混雜(confounding),或者說(shuō)出現(xiàn)兩個(gè)或多個(gè)變量的未被觀察到的因素,長(zhǎng)期以來(lái)被認(rèn)為是從數(shù)據(jù)中得出因果推斷的主要障礙。通過(guò)一種稱為“back-door”的圖形標(biāo)準(zhǔn)可以“解混雜”(deconfound)。選擇一組合適的變量來(lái)控制混雜的任務(wù)已經(jīng)被簡(jiǎn)化成一個(gè)簡(jiǎn)單的“roadblocks”問(wèn)題,可以用一個(gè)簡(jiǎn)單的算法解決(Pearl, 1993)。


對(duì)于那些“back-door”標(biāo)準(zhǔn)不成立的模型,有一個(gè)符號(hào)引擎叫做“do-calculus”,它能預(yù)測(cè)任何可行情況下策略干預(yù)的效果,當(dāng)預(yù)測(cè)不能用特定的假設(shè)來(lái)確定時(shí),會(huì)以失敗退出(Pearl, 1995; Tian and Pearl, 2002; Shpitser and Pearl, 2008)。


3. 反事實(shí)的算法化


反事實(shí)分析處理的是特定個(gè)體的行為,根據(jù)一組不同的特征來(lái)確定。例如,假設(shè)Joe的薪資為Y = y,并且他上了X = x年大學(xué),那么Joe的薪資是多少呢?那么假如Joe再上一年大學(xué),他的薪資會(huì)是多少?


因果革命的一項(xiàng)成就是,在圖形表示中將反事實(shí)推理形式化,圖形表示是研究人員用來(lái)編碼科學(xué)知識(shí)的一種表現(xiàn)形式。每個(gè)結(jié)構(gòu)方程模型都決定了每個(gè)反事實(shí)語(yǔ)句的真值。因此,我們可以通過(guò)分析來(lái)判斷句子的概率是否可以通過(guò)實(shí)驗(yàn)或觀察研究來(lái)確定,或通過(guò)這兩者的組合來(lái)估算[Balke and Pearl, 1994; Pearl, 2000, Chapter 7]。


在有關(guān)因果的論述中,人們特別感興趣的是關(guān)于“效果的原因”(causes of effects)的反事實(shí)問(wèn)題(和“原因的效果”相對(duì))。例如,Joe去游泳是Joe死亡的必要(或充分)原因(Pearl, 2015a; Halpern and Pearl, 2005)。


4. 調(diào)解分析和直接、間接效應(yīng)的評(píng)估


調(diào)解分析(mediation analysis)關(guān)注的是將變化從原因傳遞到效果的機(jī)制。對(duì)中間機(jī)制的檢測(cè)是生成解釋的基礎(chǔ),且必須應(yīng)用反事實(shí)邏輯幫助進(jìn)行檢測(cè)。反事實(shí)的圖形表示使我們能夠定義直接和間接效應(yīng),并確定這些效應(yīng)可以從數(shù)據(jù)或?qū)嶒?yàn)估計(jì)的條件(Robins and Greenland, 1992; Pearl, 2001; VanderWeele, 2015)。由這個(gè)分析可以回答的典型問(wèn)題是:X對(duì)Y的影響有多少是由變量Z導(dǎo)致的。


5. 外部有效性和樣本選擇偏差


所有實(shí)驗(yàn)研究的有效性都受到實(shí)驗(yàn)和實(shí)現(xiàn)設(shè)置之間差異的影響。當(dāng)環(huán)境條件發(fā)生變化時(shí),我們沒(méi)法期待在某個(gè)環(huán)境中訓(xùn)練的機(jī)器還能夠表現(xiàn)良好,除非這些變化是局部的、可確定的。這個(gè)問(wèn)題及其各種表現(xiàn)形式都已經(jīng)被機(jī)器學(xué)習(xí)研究者認(rèn)可,諸如“領(lǐng)域適應(yīng)”、“遷移學(xué)習(xí)”、“終身學(xué)習(xí)”和“可解釋的人工智能”等等,這些只是研究人員和資助機(jī)構(gòu)研究的一些子任務(wù),試圖緩解穩(wěn)健性(robustness)的普遍問(wèn)題。


不幸的是,穩(wěn)健性的問(wèn)題需要環(huán)境的因果模型,并且不能在關(guān)聯(lián)級(jí)別上進(jìn)行處理,在這個(gè)級(jí)別上,大多數(shù)補(bǔ)救措施都已經(jīng)嘗試過(guò)了。關(guān)聯(lián)(association)不足以確定所發(fā)生的變化所影響的機(jī)制。我們前面討論的 do-calculus為克服環(huán)境變化帶來(lái)的偏見提供了一種完整的方法,它既可用于重新調(diào)整學(xué)習(xí)政策以規(guī)避環(huán)境變化,也可用于控制非典型樣本的偏差(Bareinboim and Pearl, 2016)。


6. 數(shù)據(jù)丟失


數(shù)據(jù)丟失的問(wèn)題困擾著實(shí)驗(yàn)科學(xué)的每一分支。例如,受訪者沒(méi)有回答全問(wèn)卷所有項(xiàng)目,傳感器因環(huán)境條件變化而失靈,患者經(jīng)常因?yàn)槲粗脑蛲顺雠R床研究。對(duì)于這個(gè)問(wèn)題,大量的文獻(xiàn)致力于統(tǒng)計(jì)分析的盲模型范式(model-blind paradigm),因此,這些研究嚴(yán)重局限于數(shù)據(jù)丟失隨機(jī)發(fā)生的情況,也就是說(shuō),與模型中其他變量的值無(wú)關(guān)。使用丟失過(guò)程(missingness process)的因果模型,我們現(xiàn)在可以把因果關(guān)系和概率關(guān)系從不完整的數(shù)據(jù)中恢復(fù)出來(lái),并且只要條件滿足,就可以得到對(duì)所需關(guān)系的一致估計(jì)(Mohan and Pearl, 2017)。



7. 因果發(fā)現(xiàn)


前面描述的d-separation標(biāo)準(zhǔn)使我們能夠檢測(cè)和列舉給定的因果模型的可測(cè)試推斷。這為利用不精確的假設(shè)和數(shù)據(jù)兼容的模型集合進(jìn)行推理提供了可能,并且可以緊湊地表示這個(gè)集合。系統(tǒng)的搜索已經(jīng)被開發(fā)出來(lái),在某些情況下,可以將一組兼容模型的集合修剪到可以直接從該集合中評(píng)估因果問(wèn)題的程度(Spirtes et al., 2000; Pearl, 2000; Peters et al., 2017)。


結(jié)論


哲學(xué)家Stephen Toulmin認(rèn)為,基于模型與盲模型的二分法是理解巴比倫與古希臘科學(xué)之間競(jìng)爭(zhēng)的關(guān)鍵。根據(jù)Toulmin的說(shuō)法,巴比倫天文學(xué)家是黑箱預(yù)測(cè)的高手,在準(zhǔn)確性和一致性方面遠(yuǎn)遠(yuǎn)超過(guò)了古希臘人(Toulmin,1961,pp.27-30)。然而科學(xué)卻青睞希臘天文學(xué)家的創(chuàng)造性思辨戰(zhàn)略,這種戰(zhàn)略和形而上學(xué)的形象一樣很狂野:充滿火焰的圓形管,可以看見天火的小洞,還有騎在龜背上的半球形地球。然而,這種狂野的建模策略,顛覆了Eratosthenes(公元前276  -  194年)在古代世界最有創(chuàng)造性的實(shí)驗(yàn)之一,并測(cè)量了地球的半徑。這絕對(duì)不會(huì)發(fā)生在巴比倫。


回到強(qiáng)人工智能,我們已經(jīng)看到,對(duì)可執(zhí)行的認(rèn)知任務(wù)來(lái)說(shuō),盲模型的方法有內(nèi)在限制。我們描述了其中的一些任務(wù),并展示了如何在SCM框架中完成這些任務(wù),以及對(duì)于執(zhí)行這些任務(wù),為什么基于模型的方法是必不可少的。我們的總體結(jié)論是,人類的AI不能單純地從盲模型的學(xué)習(xí)機(jī)器中出現(xiàn),它需要數(shù)據(jù)和模型的共生協(xié)作。


數(shù)據(jù)科學(xué)只不過(guò)是一門科學(xué)而已,因?yàn)樗兄诮忉寯?shù)據(jù):這是一種二體問(wèn)題,將數(shù)據(jù)與現(xiàn)實(shí)聯(lián)系起來(lái)。不管數(shù)據(jù)有多大,如何被靈巧應(yīng)用,數(shù)據(jù)本身并不是一門科學(xué)。



論文地址:https://arxiv.org/pdf/1801.04016.pdf



新智元 立即體驗(yàn)新智元小程序,一鍵直達(dá)AI大咖

小程序

加入社群


新智元AI技術(shù)+產(chǎn)業(yè)社群招募中,歡迎對(duì)AI技術(shù)+產(chǎn)業(yè)落地感興趣的同學(xué),加小助手微信號(hào): aiera2015_1 入群;通過(guò)審核后我們將邀請(qǐng)進(jìn)群,加入社群后務(wù)必修改群備注(姓名-公司-職位;專業(yè)群審核較嚴(yán),敬請(qǐng)諒解)。


此外,新智元AI技術(shù)+產(chǎn)業(yè)領(lǐng)域社群(智能汽車、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等)正在面向正在從事相關(guān)領(lǐng)域的工程師及研究人員進(jìn)行招募。


加入新智元技術(shù)社群,共享AI+開放平臺(tái)



本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
圖靈獎(jiǎng)得主Judea Pearl :從“貝葉斯網(wǎng)絡(luò)之父”到“AI社區(qū)的叛徒”
圖靈獎(jiǎng)得主Judea Pearl 智源大會(huì)演講:從“大數(shù)據(jù)革命”到“因果革命”
貝葉斯之父Judea Pearl推薦:機(jī)器學(xué)習(xí)因果推理的7個(gè)有用工具
一場(chǎng)因果革命,Judea Pearl最新力作《為什么》中文版發(fā)布
因果科學(xué):連接統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)與自動(dòng)推理的新興交叉領(lǐng)域
專訪貝葉斯網(wǎng)絡(luò)之父Judea Pearl:我是AI社區(qū)的叛徒
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 宜昌市| 东明县| 老河口市| 兴义市| 濉溪县| 潮州市| 荆门市| 油尖旺区| 靖远县| 十堰市| 邻水| 商洛市| 台东县| 仪征市| 浦江县| 金寨县| 平湖市| 北宁市| 东乡| 昌平区| 务川| 洛川县| 雷波县| 贡觉县| 江门市| 大冶市| 张家港市| 建昌县| 张家口市| 库伦旗| 靖边县| 江油市| 明溪县| 怀来县| 赫章县| 焦作市| 包头市| 勐海县| 阳信县| 新闻| 乐至县|