歸根到底,對Watson Health來說致命的問題在于,它的診斷結果不準確。此外,Watson只能比人類專家更快地給出相同的診斷結果,而無法治療人類醫生治不了的病。
人類豐滿的AI夢,正在撞上冰冷的現實。
1月19日,據外媒報道,IBM(118.99, -1.74, -1.44%)正在考慮出售 Watson Health 業務,可能的方案包括出售給私募股權公司、醫療行業企業或者與一家特殊目的收購公司(SPAC)合并。
Watson Health部門主要負責將AI用于幫助醫院、保險公司和制藥企業處理數據。據報道,該部門年收入大約為10億美元,但目前仍未盈利。
IBM在2020年4月迎來了新任 CEO 阿爾溫德·克里希納(Arvind Krishna)。上任后,克里希納著手簡化公司業務線,讓云計算在市場中變得更加有競爭力。如若Watson Health真的被出售,對IBM的AI業務來說,無疑是一次不小的挫折。
曾想替人類解決腫瘤治療
長久以來,Watson都是IBM AI業務的一塊招牌,也是人類最初充滿野心的AI夢的代表。
2011年,深度學習方法剛剛被重新定義,仍未掀起新一輪AI浪潮。但此時IBM的Watson就在美國最受歡迎的智力競猜節目《危險邊緣》中,擊敗了該節目歷史上最成功的兩位人類選手。
Watson在比賽中展現了強大的自然語音理解能力。要贏得比賽,它必須解析大量文字找到線索,然后搜索大量文本數據庫,以檢索可能的答案。在擊敗兩位人類冠軍后的第二天,IBM宣布了 Watson的新職業目標:一名AI醫生。
從邏輯上看,Watson在競猜節目上展現的能力,似乎可以移植到醫學領域——都是先理解自然語言(患者的電子病歷),然后檢索文本數據庫(治療方案和最新醫學文獻),最終給出答案。這個方案的價值在于,每天有將近8000篇醫療文章發布,醫生一篇篇讀是不可能的,AI能幫助醫生閱讀最新醫學成果。
2013年,IBM更是將研究重心聚焦于腫瘤治療這一最大的、人類尚無法攻克的醫學挑戰上。2015年,IBM成立了專門的部門—— Watson Health,可見其當時的決心。IBM前CEO羅睿蘭(Virginia Rometty)曾把Watson Health稱之為公司的“登月計劃”。
眾所周知,AI的基礎是大量訓練數據。為了獲得這些數據,IBM花費約40億美元收購了4家醫療領域數據驅動型公司,分別是Phytel、Explorys、Merge Healthcare和Truven Health Analytics。2016年,成立僅兩年的Watson Health,員工規模已經達到一萬多人。
在重點發力的腫瘤治療領域, Watson Health吸引了許多著名合作機構,包括安德森癌癥中心、紀念斯隆-凱特琳癌癥中心、梅奧醫院、奎斯特診斷(119.23, -2.62, -2.15%)公司。2016年8月,Watson Health還進軍中國,推出“健康中國”生態圈共贏計劃。
聲勢壯大的宣傳、數額龐大的并購、權威機構的合作,IBM通過一系列舉措讓外界對Watson Health的預期提得非常高。畢竟,用最前沿的AI技術來解決最困難的醫療問題,這件事情聽上去就非常性感。
不過,后來的發展事與愿違。安德森腫瘤中心曾與 IBM 合作,為腫瘤學家創建咨詢工具。該工具利用自然語言處理技術來匯總患者的電子健康記錄,然后匹配數據庫提供治療建議。安德森癌癥中心在這個項目上投入了6200萬美元,但最終結局卻是雙方在2017年2月終止了合作關系。
業界開始對Watson Health產生懷疑,它自己的問題也接踵而至。2018年5月,美國媒體The Register報道,Watson Health部門要解雇大約50%-70%員工,引發了巨大震動。不過后來科技媒體IEEE Spectrum的報道指出,被裁員工主要來自收購的三家公司Phytel、Explorys和Truven。大量收購使得公司面臨人員臃腫問題,為裁員埋下了伏筆。
但這些都是表面現象,歸根到底,對Watson Health來說致命的問題在于,它的診斷結果不準確。
2018年8月媒體報道,沒有任何已發表的研究表明,Watson提升了患者的治愈率。有十幾位使用過該系統的機構和醫生反饋,其癌癥應用收效甚微,某些情況下還會出錯。并且,由于缺乏罕見病例數據,Watson的更新速度跟不上癌癥治療的發展速度。
丹麥一個醫院在一份研究中指出,Watson給出的診斷方案,與專家給出的僅有30%重合度,因此拒絕采購Watson系統。德國媒體也曾報道,德國兩家機構在實際應用中發現,Watson對于那些癥狀特殊的病人會開出致命藥物。2018年10月,IBM Watson Health當時的CEO Deborah DiSanzo宣布離崗。
一切都不可逆轉地指向最終結局,如今終于傳出IBM尋求出售Watson Health的消息,失去業界的信心,再丟掉雄厚資金的支持,這個人類最早的AI明星的前景,不再明朗。
AI夢該醒了?
當前AI應用于醫療最普遍的場景是識別醫療影像,比如視網膜眼底影像。而Watson所挑戰的是診斷問題,并且還是醫學上難度最大的腫瘤治療領域。在該問題上,Watson Health面臨著數據和AI智能的雙重挑戰。
在數據獲取層面,大部分醫療數據是非結構化信息,比如醫生撰寫的病歷和出院總結。雖然AI的自然語言理解能力進步飛快,但相比人類依然差很多。圖靈獎得主約書亞·本希奧(Yoshua Bengio)曾表示,在醫學文本文檔中,AI無法理解歧義,也無法找到人類醫生會注意到的細微線索。
另一方面,有些罕見病例的數據往往難以獲取。《中國工業和信息化》雜志2020年的一篇文章指出,在解析Watson的數據中發現,在罕見病例研究中,本來應該喂給Watson大量的真實數據從而找到新的治療手段,由于罕見病例數據的極端匱乏,實際上Watson被灌了一堆沒什么用的假想數據,而并不是真正的病人數據。這種通過假想數據學出來的AI,準確性可想而知。這就出現了罕見病例中Watson的誤診情況。
全球領先的醫學資訊平臺Medscape在2018年一篇報道指出,Watson在學習根源上有問題 —— 它并沒有使用足夠的真實病例進行學習,而負責訓練它的人群,僅僅是紀念斯隆-凱特琳癌癥中心的腫瘤學家和IBM自己的工程師。Watson大量訓練時間用于掌握上述腫瘤學家設計出的理想(29.84, 0.40, 1.36%)化病例和治療方案。它用于訓練的真實病例數量很小,最多的肺癌也僅有635例,最少的卵巢癌更是僅有106例。
IBM在數據獲取上曾做過努力,花費40億美元收購了4家公司,但在數據融合上,IBM低估了復雜度。上述《中國工業和信息化》雜志文章指出,IBM前員工和前客戶的醫院管理人員說,雖然收購了大量數據,但在融合各種各樣的數據時發現需要花費難以想象的人力物力,還沒開始訓練,就讓人筋疲力盡。在巨大的經濟壓力和暗淡的前景面前,各個合作伙伴只能選擇終止合作,留下一個爛尾樓。
AI目前的智能程度,更是難以匹配腫瘤治療的復雜性。AI的本質是統計學,它所得出的結論局限于人類訓練員提供的數據,而無法像一個專業醫生一樣,獨立生成新的見解。
也就是說,Watson只能比人類專家更快地給出相同的診斷結果,而無法治療人類醫生治不了的病。
在巨大的風險面前,醫生只會將Watson的診斷結果作為參考,依然會進行大量臨床研究。在IBM的宣傳中,Watson能夠憑借著強大的計算能力發現人類看不到的模式。但事實證明,AI的智能遠未到這個程度。Watson對醫生的意義,也就大打折扣。
Watson Health的挫折反映出AI應用在診斷上困難重重,但這并不意味著AI在醫療領域沒有前景。在圖像分析、基因分析和制藥領域,都有不少公司在探索AI的應用場景。即使是在診斷領域,IBM的Watson沒做好,也不意味著其他人做不好。至少,后來者可以在Watson上學到一些經驗。一名中國AI醫療企業的創始人就對品玩說,無論AI領域創業者,公司還是投資人,都在變得務實,按今天AI與醫療的現狀,與其一上來就瞄準高精尖問題,倒不如先用自己的技術解決一下醫院院長的痛點。這樣自己的公司也能活下去,AI也真的能體現點價值。
本文作者:Decode,來源:品玩,原文標題:《大名鼎鼎的IBM Watson也要被賣了,人類的AI夢該醒了?》