根據統計,近幾年在科學技術領域最重要最有前景的技術——大數據,機器學習和人工智能名列前茅。
今天,就算你不知道什么是人工智能,也一定聽過AI(Artificial Intelligence)的大名,甚至還能聊上一聊個人的見解。如果你是各種信息平臺的重度用戶,那一定已經深切地體會到大數據推送的精準和神奇。
筆者今天要科普的不是機器學習和人工智能,而是連接該技術的另一端,通過對人工智能的研究,反過來認識和理解我們人類自身大腦的機理,然后從科學的角度來解釋什么是意識。
我們的思想來自于大腦,然而我們又無法直接觀察大腦的運作,因此要了解大腦的工作機理非常困難。
想揭開大腦的奧秘,我們先來看看計算機的工作原理。
我們都知道,計算機/電腦是由輸入,輸出,控制,運算,存儲五個基本部分組成。計算機的功能概括起來就是:將輸入的信息,經過一系列的運算,然后輸出一個運算結果。
計算機為什么被稱為電腦?因為它的基本工作原理跟人腦是一樣的:我們通過視覺,聽覺,嗅覺,味覺,觸覺向大腦傳送信息(輸入);然后大腦對信息進行一系列的分析判斷(運算);最后做出相應的反應(輸出)。
其中輸入和輸出部分是直觀的,而運算部分(大腦)是一個黑盒,沒有人能夠看到大腦究竟是如何處理信息的。
既然看不到我們的大腦是如何分析信息的,那么就先來看一下電腦是如何進行計算的。
稍微懂一些編程的都知道,計算機的運算程序最早是由很多if else指令進行邏輯運算的。大概是這個樣子的:
if 輸入1 then 輸出1
else if 輸入2 then 輸出2
else if………
這樣的程序雖然也能夠處理越來越復雜的邏輯,甚至很多復雜的程序遠遠超過人腦的分析能力,但是,這樣的程序是沒有靈魂的。
因為所有的邏輯判斷都是程序設定好的,計算過程是固定的,靈活性只取決于你的程序中寫了多少if else分支。
但人腦顯然不是按照固定的邏輯來處理信息的,人腦的靈魂來自學習,所謂活到老學到老,隨著學習和認知的改變,人腦對相同信息的判斷是不斷變化著的。
電腦技術發展到這個時期,雖然算力在不斷提高,但終究還只是一部按照指令運行的機器,還談不上智能。
然而,當計算機技術進入到人工智能階段以后,情況就開始變得有趣了。
很多人可能對人工智能的第一印象是,由大量運算模擬出來的類似智能的決策。其實不是,人工智能的質變是讓電腦實現了人腦的學習能力,從而電腦也可以通過學習來不斷獲得和更新知識,而不再是單純的運行指令而已。
學習能力,是實現智能的關鍵。
比如今天普遍應用的人臉識別技術,它不只是識別靜態的證件照而已,不管你做什么樣的表情,或者從不同的角度,不同的距離,它都能夠準確的識別出來,那么計算機是如何做到的呢?
比如大數據推送能夠精準地把你感興趣的內容推送給你,這又是如何做到的呢?難道計算機已經能夠讀懂并理解人類的語言?
本文我們不展開討論機器學習的細節,而是要引入一個重要的概念:神經網絡(Neural Network)模型。
神經網絡是實現機器學習(Machine Learning)的一種模型,這種網絡結構的原理是受我們大腦的生理結構——互相交叉相連的神經元啟發。
也就是說,神經網絡系統是實現機器學習的理論基礎,跟我們人腦學習的原理是一樣的,只是在具體實現上有一些不同。
機器學習的人工神經網絡算法由三種網絡層組成:輸入層(輸入信息)、隱藏層(分析計算)以及輸出層(輸出結果)。
輸入層:為數據特征輸入層,輸入數據特征個數就對應著網絡的神經元數。
隱藏層:即網絡的中間層,隱藏層層數可以為0或者很多層,其作用是接受前一層網絡輸出作為當前的輸入值,并計算輸出當前結果到下一層。隱藏層是神經網絡性能的關鍵,通常由含激活函數的神經元組成,以進一步加工出高層次抽象的特征,以增強網絡的非線性表達。隱藏網絡層數直接影響模型的擬合效果。
輸出層:為最終結果輸出的網絡層。輸出層的神經元個數代表了分類標簽的個數。(注:在做二分類時,如果輸出層的激活函數采用sigmoid,輸出層的神經元個數為1個;如果采用softmax分類器,輸出層神經元個數為2個)
引入神經網絡的重點在于,我們人腦處理信息的機制,也是一個由神經元組成的網絡。每一個神經元有輸入,處理,輸出。然后很多神經元連接在一起,形成一個個網絡,對各種信號進行處理和反應,這就是大腦會思考的根本。
接收區:樹突到胞體部分,會有電位的變化,階梯性的生電。階梯性是指樹突接受不同來源的突觸,如果接收的來源越多,對胞體膜電位的影響越大,反之亦然。而接受的信息在胞體內整合。
觸發區:在細胞體整合的電位,決定是否產生神經信號的起始點。位于軸突和胞體交接的地方。也就是軸丘的部分。
傳導區:為軸突的部分,當產生神經信號時,遵守全有全無定律來決定是否將神經信號傳導下去。
輸出區:神經信號的目的就是要讓神經末梢,突觸的神經傳遞物質或電信號輸出,才能影響下一個接受的細胞,稱為突觸傳遞。
有了神經網絡,就可以進行決策分析了嗎? —— 還不行。
如一個新生兒,雖然已經有了大腦,但是還不會思考。需要有一個長期的學習過程才能慢慢建立起來認知和邏輯。
那么,神經網絡是如何通過學習獲取認知的呢?
其基本原理并不復雜,就是從大量的歷史數據中找出規律,根據規律建立一個函數/算法。這個算法不是固定的,而是在學習數據的過程不斷調整精度,學習的數據越多這個算法就越精確。而這個算法在神經網絡里面的存在形式,就是交織在一起的網絡結構 。
也就是說,人腦/神經網絡的學習過程,是通過大量的經驗數據來訓練組建神經元組織結構的一個過程。
我們大腦的認知是通過數據訓練出來的,而這種認知是一種以神經網絡的形式客觀存在的(硬件而不是軟件)。
大腦的思考過程不是一種虛無縹緲的,隨意的意識行為,而是神經元網絡對信號的處理過程,是一個客觀實體的反應過程。
到這里我們已經大概了解到我們的大腦是如何學習知識并且思考決策的,這不是一個虛無的純粹意識層面的活動,而是以神經元網絡的形式客觀存在的。這是一種大腦硬件結構而不是軟件,認識到這一點非常重要。
只有認識到這一點,我們才可以通過觀察人工神經網絡來反過來分析我們的大腦,因為這兩者的工作原理其實是一樣的。
為了文字的簡潔,在下文中,如果提到神經網絡,沒有特別說明的情況下是指人工神經網絡/電腦;如果提到人腦,就是指人腦中的神經元網絡。以此來區分電腦神經網絡和人腦神經網絡。
下面我們用一個最簡單的例子,分析一下如何利用神經網絡訓練對電腦進行“洗腦”。
比如我們要讓神經網絡學會識別什么是一只貓。
我們首先給電腦輸入大量貓的圖片,神經網絡就會根據這些圖片逐漸找到共性,提取特征,調整這個參數的權重,逐漸訓練出一個識別率很高的算法(網絡結構)。
比如這個算法可能是根據兩只耳朵,兩個眼睛,一個頭,四條腿,一條尾巴作為特征來識別貓。甚至更精確的參數,耳朵是什么形狀,頭占整體的比例大概多少等等。
于是,電腦通過對大量數據的學習,成功學會了如何識別一只貓。
看起來好像是一個成功的學習案例。
但是,這樣訓練出來的神經網絡,如果我們給它看一張狗的圖片,電腦會如何判斷呢?——它可能會覺得這也是一只貓。
因為狗也有兩只耳朵,一個頭,四條腿,一條尾巴,符合電腦學習到的貓的特征。
如果我們告訴電腦這是一只狗,不是貓,電腦會不會立刻改變它對貓和狗的認知?
——不會的。 因為電腦對貓的判斷是基于神經網絡復雜的算法路徑,這個算法路徑是經過長期學習訓練出來的,并不會因為一次糾正就徹底改變;所以,盡管你告訴它一個事實(這是一只狗),它也不會立刻接受。
你看,我們通過給電腦“洗腦”,讓它把狗認成一只貓,哪怕你告訴它那是一只狗,它也不會“相信”你。
為什么會出現這種情況呢?因為我們在給電腦輸入數據學習的時候,只給它輸入了貓的數據,而沒有提供用來做對比分類的數據,比如狗,兔子等其他哺乳動物。
通過這個例子我們可以得出這樣的結論:給神經網絡/大腦輸入大量單方面的信息,過濾掉用以對比分類的其他信息,會把神經網絡/大腦訓練成一個片面的認知模型,從而會錯判其他類型的信息。
——通過信息過濾,可以灌輸認知。
再考慮下面這個例子。
假如我們給電腦學習的過程中輸入了1萬張貓的圖片,然而這一萬張貓的圖片里面只有一千張是真的貓,另外9千張其實是狗。
結果又會怎樣呢?
很明顯,神經網絡在學習之后會認為狗才是貓(90%可能是貓),而貓不是貓(只有10%可能是貓)。如果你給它一張狗的圖片告訴它:這是狗,或者給它一張貓的圖片告訴它:這是貓。電腦會認為你錯了。
通過這個例子我們可以得出這樣的結論:只要給神經網絡/大腦輸入足夠多次數的錯誤信息,這個錯誤信息最終會覆蓋掉正確的信息。而正確的信息反而會被判定為是錯誤的。
——謊言重復1000遍,就變成了真理。
同理,如果我們給電腦神經網絡輸入一萬張貓的圖片,但是告訴電腦這不是貓。
顯然,這樣可以把電腦訓練出“貓不是貓”的認知。
——只要我們重復灌輸否定事實的判定,最終神經網絡就會認為事實不是真的。
通過以上這些例子我們可以直觀的看出,洗腦策略的基本原理是相通的,就是通過大量的重復灌輸某些特定的信息,來訓練神經網絡,最終讓神經網絡形成一種固定的判定路徑,一旦這種判定形成,任何不同判定的信息(哪怕是事實),都會被神經網絡否定。
這就是我們所常說的慣性思維,價值觀,意識形態。
看,通過對神經網絡的分析,我們是可以直觀的理解意識形態是怎么形成的。
我們現在已經理解了洗腦的基本原理,那么,我們如何才能判斷自己是不是被洗腦了呢?
在進入這個問題之前,我們先要了解神經網絡深度學習中一個重要的機制:驗證機制。
上面說過,神經網絡是通過學習逐漸建立起來的一個復雜的網絡路徑/算法,這個算法不是固定的,而是隨著學習逐漸改進的。驗證機制就是用來改進算法的重要機制。
比如我們的電腦通過一段時間的學習已經形成了一個識別貓的網絡/算法,那么怎么知道這個算法是否足夠好呢?就是通過不斷的驗證。
比如我們輸入一張新的圖片,電腦通過網絡計算,如果輸出的結果是正確的,那么就得到一個正反饋,說明當前的算法是正確的。
然而,如果電腦計算輸出的結果是錯誤的(比如把狗認成貓),那么就得到一個負反饋。更重要的是,這時候電腦就需要計算誤差,再根據誤差調整現有的神經網絡結構。這個調整算法的過程可能會消耗大量的算力。
當神經網絡檢驗一條信息,如果這條信息符合當前的路徑/算法,那么會得到一個正反饋,誤差為0,輕松通過;
但是如果這條信息不符合當前的路徑/算法,就會得到一個負反饋,這個時候需要計算誤差,調整算法,相當消耗算力。
同樣,我們的大腦神經元網絡在接受信息的時候,如果信息符合當前神經路徑,大腦會得到一個正反饋,輕松愉悅;
但是如果這條信息不符合當前神經路徑,大腦會得到一個負反饋,這個時候,大腦會開始檢查究竟是哪里出錯了?出錯的原因是什么?然后再根據分析的結果反饋給神經元重新修正神經網絡。這個修正神經元網絡的過程會消耗大量的能量和精力,因此大腦會有一種非常不適的感覺(類似我們在健身的時候肌肉會感到非常不適)。
理解大腦對信息的反饋機制非常重要。這個機制可以幫助我們解釋很多現象。
比如為什么我們在玩的時候會很愉快,而在學習的時候會覺得很痛苦;比如為什么斯德哥爾摩綜合癥的受害者反而會為施害者辯護。 等等很多抽象的甚至不合常理的現象。
我們也可以用這個機制來檢驗我們的大腦是不是被“洗腦”了。
讀者可能會問,判斷是不是被洗腦不是應該以是不是知道“真相”為標準嗎?為什么還要理解大腦對信息的反饋機制?
因為,真相是一個很難鑒定,甚至有些主觀的概念。
每個人都認為自己了解的就是真相,但其實沒有任何人能夠了解真相的全部。真相的全部所包含的信息量非常龐大,錯綜復雜,可能遠遠超過我們每個人大腦所能存儲的范圍;就像一座冰山,每個人能夠看到的都只是冰山的一角,沒有人能夠看到冰山的全部,如果真相是冰山上的一只螞蟻呢?那你恐怕永遠都不可能找到它。
因此,大部分人都會有這樣的幻覺:“我了解到的才是真相,你們都被洗腦了。”——當我們這樣想的時候,我們可能已經被洗腦了。
因此,通過大腦的反應來識別洗腦是更直接有效的方法。
我們都有這樣的經歷,當我們刷抖音的時候,沉浸在一個接一個的視頻中,心情無比愉悅,興奮,感動,有認同感,看到激動處甚至心跳加速,心潮澎湃。于是不斷的刷視頻,停不下來。
根據大腦反饋機制判斷,這是因為這些視頻的內容與我們大腦中的神經網絡高度契合,因此我們的大腦不斷受到正反饋,感到愉悅,興奮。
而這個時候,我們就要停下來反思一下,我們是不是已經被這類內容洗腦了?
更糟糕的是,抖音也有它自身的神經網絡,而它的神經網絡會根據對你喜好的學習不斷給你推送類似的內容(大數據推送);這又反過來讓這類內容在你大腦中占的權重越來越高,也就讓你的洗腦狀態越來越嚴重。
而另一方面,有些時候,我們偶爾也會刷到一兩個不怎么常見的視頻。這類視頻會讓你感到很沒勁,無聊,荒謬,甚至不安。你會覺得看這種視頻太痛苦了,想立刻把它關掉。
根據大腦反饋機制判斷,這是因為這些視頻的內容與我們大腦中的神經網絡相抵觸,我們的大腦受到負反饋,需要重新調整神經網絡,所以感到不適。
這個時候,我們也要停下來反思一下,我們是不是已經被其他不同類的內容洗腦了?
現在我們已經了解了如何識別洗腦,那么,該如何對抗洗腦呢?
首先,我們要糾正一個關于洗腦和反洗腦的認識上的誤區——我們都認為被洗腦的人深陷其中是因為他們不知道事實的真相,只要他們接觸到了真相,他們就會從洗腦中清醒過來。
其實不是這樣的。
相信每個人都有過這樣的經歷,身邊有深陷傳銷或網購的人,無論你怎么跟他們擺事實講道理,他們都不會相信。為什么會這樣呢?
因為大腦對信息的判斷是基于神經元網絡,而神經元網絡是物理存在于我們大腦中的非常復雜的結構,這種結構不會因為接觸到了“真相”就會立刻被改變。
因此,對抗洗腦的根本是如何調整大腦中存在的神經網絡結構。
先來講一個小故事。
有一個段子,如果想讓一個南方人和一個北方人吵起來,最簡單的辦法就是討論這個問題:豆腐腦是加鹽還是加糖?番茄炒蛋是咸的還是甜的?
筆者是北方人,從小吃咸的番茄炒蛋長大。18歲那年,考入南方一所高校,記得第一次在學校食堂吃番茄炒蛋,一口差點沒吐出來,這怎么是甜的?太難吃了!
但是半年以后,筆者再也不覺得甜口的番茄炒蛋難吃,反而覺得味道很不錯。更神奇的是,回到北方老家,再吃咸口的番茄炒蛋,也還是一樣好吃。
從此,番茄炒蛋是咸的還是甜的對于筆者來說再也不是一個需要爭論的問題。
這個小故事包含了洗腦,反洗腦,對錯和真相的簡單邏輯。
番茄炒蛋放鹽和放糖,哪個是對的?哪個才是真相?
筆者一開始覺得甜口的番茄炒蛋太難吃了,真的是因為甜口的番茄炒蛋比咸口的番茄炒蛋難吃嗎?
答案讀者們應該都很清楚了,其實關于番茄炒蛋的對錯和真相,完全取決筆者的習慣。當筆者對兩種口味都習慣了以后,咸的和甜的就變成了都是對的。
當我們的大腦神經網絡傾向某一方面的時候,我們就會變得排斥其他方面;如果我們能讓我們的大腦接受其他的方面,我們就解鎖了新的技能,當我們解鎖越多的技能,就可以處理越復雜的矛盾。
筆者記得很多年前的談話節目,一般都要請兩個嘉賓,一個嘉賓講正方觀點,另一個嘉賓講反方觀點。不知道什么時候起,這種形式的媒體節目好像越來越少了。
今天,筆者有時會聽一聽《新聞聯播》在播些什么,每到這個時候,周邊的人就會投來異樣的眼光,好像在說,什么年代了,竟然還有人聽《新聞聯播》?
理解了洗腦的原理以及識別洗腦的方法,我們就有了對抗洗腦的策略:
當我們開始意識到我們大腦中的神經網絡越來越傾向某一個方向(被洗腦)的時候,我們應該嘗試著讓大腦接觸其他方向的信息,即使一開始我們可能會覺得其他方向的信息是錯誤的,荒謬的。就像筆者第一次吃甜口的番茄炒蛋一樣。
比如,如果你是一個無神論者,你可以嘗試接觸一下宗教知識,反之亦然。
比如,如果你是一個保守派,你可以嘗試傾聽一下自由派的觀點,反之亦然。
比如,如果你是某些人或事的鐵粉,你應該聽一聽反對他們的人在說些什么,反之亦然。
比如,當你感覺自己在追求“真相”的路上變得有點消極的時候,不妨接受一點《新聞聯播》的洗禮。
通過接受不同方面的信息來改進增強我們大腦中神經網絡結構,是對抗洗腦的一個最直接的方法。
而更進一步的方法是,建立邏輯,抽象模型和方法論。
比如在上文的例子中,我們要讓電腦學習識別貓,就給電腦“看”大量貓的圖片,讓電腦學習識別狗,就給電腦“看”大量狗的圖片。然而,地球上有百萬計的動物,通過這種學習方法所消耗的時間和能量可想而知。
那么,有什么辦法能提高學習的效率呢?有的,就是分類建模。比如我們通過對貓科動物的歸類和特征提取,就可以更快的識別虎,豹,獅子,貓,猞猁等。——這就是抽象歸類。
再比如,每個男生小時候都有一個武俠夢,總幻想自己能成為書中的那個武功蓋世的大俠。但是學過物理和牛頓定律以后,這個武俠夢基本都要破滅,因為根據牛頓第二,第三定律,萬有引力定律,我們就知道,所謂身輕如燕,左腳踩右腳右腳踩左腳的輕功是不可能存在的。 —— 這就是邏輯。
再比如,學習乘法的時候,我們只需要記1*1到9*9的九九乘法表就行,我們并不需要記下大于10的數字的所有組合,也可以進行兩位數,三位數,多位數的乘法計算。因為我們做乘法靠的是進位算法,而不是記下所有的排列組合。 —— 這就是方法論。
如果我們在大腦中建立了正確且足夠復雜的抽象,分類,邏輯,方法等神經網絡,就可以大大的提高學習信息的效率,減少被洗腦的套路。
筆者后注:
我們為什么要理解洗腦和反洗腦的原理和方法?
因為我們已經進入一個信息化高度發展的時代,我們幾乎每天都在信息的洪流中浮沉。我們應該學會如何不被信息左右我們的思想和心情;學習怎么利用信息去解決現實生活中的問題。
知道如何根據信息解決問題比一味的抱怨現實更有意義;利用知識改善現狀比深陷“真相”更重要。
人類一思考,上帝就發笑。
意識,是這個世界上最神秘的領域之一。尤其是當我們開始深入思考“我是誰”的時候,大腦會逐漸進入一種近乎瘋狂的狀態,就好像電腦在解一個嵌套算法時不小心進入死循環一樣。
而通過對人工智能的觀察,我們可以反過來了解我們的大腦是如何思考的。
有趣的是,我們大腦中一個個的神經元組織在一起形成的神經網絡在物理上決定了我們的思維特征;我們再通過今天的各種互聯網平臺把我們的思維特征傳遞給大數據的神經網絡;大數據的神經網絡再通過它的算法把這些特征反饋給無數其他的人類用戶。
于是,一個個極其微小的神經元,組成了一個個大腦神經網絡,再通過大數據的網絡互相聯系在了一起,就好像我們所有人最終都在一個巨大的神經網絡之上,這就是地球文明。
美學之旅
發現美,擁有美,享受美
讓我們一起構筑我們的美麗人生
讓我們一起構建我們的美麗世界