精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
國(guó)產(chǎn)大模型黑馬誕生,千億級(jí)拿下雙榜第一!知識(shí)正確性能力突出,大幅降低LLM幻覺(jué)問(wèn)題


  新智元報(bào)道  

編輯:Aeneas 好困
【新智元導(dǎo)讀】夸克,也下場(chǎng)大模型了。甫一問(wèn)世,夸克大模型就迅速登頂權(quán)威測(cè)評(píng)雙榜第一,幻覺(jué)率大幅降低,可以預(yù)見(jiàn),風(fēng)靡年輕人的夸克APP,要掀起新的颶風(fēng)了。

最近的各大手機(jī)廠商和互聯(lián)網(wǎng)公司,都在卯足了勁兒地發(fā)布大模型。
而其中的一匹黑馬,顯得格外引人注目——
千億級(jí)在C-Eval和CMMLU兩大權(quán)威評(píng)測(cè)中拿下雙榜第一,百億級(jí)在法律、醫(yī)療、問(wèn)答等領(lǐng)域的性能評(píng)測(cè)中名列榜首。
如此擅長(zhǎng)人文社科,再結(jié)合夸克以往的業(yè)務(wù),阿里巴巴智能信息事業(yè)群為夸克大模型安排的這條路線,逐漸明晰了起來(lái)。
沒(méi)錯(cuò),答案就是——做通識(shí)問(wèn)答和專業(yè)搜索!
在年輕人中人氣極高的夸克APP,是一個(gè)集合搜、用、存的智能信息產(chǎn)品。而有了夸克大模型后,這項(xiàng)過(guò)程,就都可以進(jìn)行智能化升級(jí)。
要知道,如今的夸克APP,25歲以下的年輕用戶,占比已經(jīng)超過(guò)了一半。在夸克大模型的加持下,夸克APP必然在年輕用戶中,再掀一股颶風(fēng)。
效果有多好?請(qǐng)看——

搜索、健康、教育、辦公,輕松hold住

夸克大模型,是一個(gè)面向搜索、生產(chǎn)力工具和資產(chǎn)管理助手的應(yīng)用型大模型,應(yīng)用場(chǎng)景有通用搜索、醫(yī)療健康、教育學(xué)習(xí)、職場(chǎng)辦公等等。

搜索

現(xiàn)在的千億參數(shù)模型,已經(jīng)可以在部分夸克端的內(nèi)測(cè)場(chǎng)景里提供服務(wù)。
比如,讓它介紹《狂飆》的演員,答案不僅有演員表,還能介紹誰(shuí)在劇里演了什么。
這道歷史題「光武盛世、開(kāi)元盛世、貞觀之治、文景之治,是哪個(gè)朝代」,尤其體現(xiàn)了夸克大模型的能力。
如果問(wèn)普通搜索引擎,這種一連串的問(wèn)題,是搜不出來(lái)的。
而反事實(shí)的問(wèn)題,就更有難度,因?yàn)椴粌H能測(cè)出模型學(xué)過(guò)的知識(shí),還需要模型進(jìn)行推理。
如果問(wèn)它,秦始皇喜歡騎什么牌子的摩托車?
它就會(huì)推理出,秦始皇是秦朝的,摩托車是哪年發(fā)明的,所以秦始皇沒(méi)有機(jī)會(huì)騎摩托車,更沒(méi)有喜歡的品牌。
下面這個(gè)多輪對(duì)話下中英混合的case 「in和on有什么區(qū)別」,已經(jīng)到了可以自學(xué)英語(yǔ)的程度。
在多輪對(duì)話中,我們可以不斷對(duì)它提出需求。
可以看到,夸克大模型的回答,比一般的搜索結(jié)果在內(nèi)容的全面性和專業(yè)性上,都要好得多。

健康

健康,是夸克團(tuán)隊(duì)要重點(diǎn)建設(shè)的方面。
搜索引擎的核心群體,就是健康群體,因?yàn)檫@個(gè)群體并沒(méi)有其他軟件或APP提供很好的信息服務(wù)。
在健康上,夸克團(tuán)隊(duì)做了許多行業(yè)數(shù)據(jù)建設(shè)和知識(shí)建設(shè),建成了完整的健康知識(shí)圖譜。
另外,他們還建設(shè)了大量的醫(yī)典百科、醫(yī)典問(wèn)答這類面向C端的數(shù)據(jù),并且整理了大量指南、標(biāo)準(zhǔn)、書(shū)籍。
在「如何預(yù)防流感」這個(gè)問(wèn)題中,夸克大模型回答了不同的方法,包括個(gè)人衛(wèi)生、疫苗等等。同時(shí)會(huì)體現(xiàn)學(xué)到的知識(shí)點(diǎn)援引出處。
可見(jiàn),團(tuán)隊(duì)在行業(yè)里建立的知識(shí)權(quán)威性,大模型確實(shí)學(xué)到了。
而且,最理想的情況,模型不會(huì)只是回答健康的科普問(wèn)題,還要具備比較好的推理能力。
「咳嗽三天,是怎么回事?」
如果在搜索引擎里問(wèn)這個(gè)問(wèn)題,是無(wú)法獲得豐富、完備的信息的,因?yàn)榭人詫?duì)應(yīng)的疾病非常多。
而在夸克大模型在給出一個(gè)回答之后,還會(huì)有推理和反問(wèn)。
界面中會(huì)出現(xiàn)一張卡,詢問(wèn)用戶是否有其他情況。提交后,大模型會(huì)根據(jù)當(dāng)前癥狀給出一個(gè)更精準(zhǔn)的疾病范圍。
這個(gè)過(guò)程的核心,就是醫(yī)學(xué)相關(guān)的知識(shí)推理,和醫(yī)學(xué)知識(shí)的具體信息。
并且,團(tuán)隊(duì)還在準(zhǔn)備多模大模型,上傳生化檢驗(yàn)單后,就可以給用戶提供更準(zhǔn)確的信息。

教育

在教育類產(chǎn)品上,不止要看能不能答,更要看為什么能答。
比如這個(gè)應(yīng)用題,一個(gè)圓桶周長(zhǎng)25米,深40厘米,這桶水有多少千克呢?
夸克大模型回答時(shí),不僅會(huì)列出解題的過(guò)程,還會(huì)輸出解題會(huì)用到哪些公式,涉及哪些關(guān)鍵知識(shí)點(diǎn),比如各單位的換算關(guān)系。
然后先求圓的面積,然后算出體積,再得到最后的結(jié)果。

辦公

此外,夸克大模型還可以化身為職場(chǎng)打工神器。
舉例來(lái)說(shuō),一個(gè)關(guān)于銷售演講技巧的PPT有8頁(yè),逐頁(yè)看的話,很花時(shí)間。但只要把文檔上傳上去,夸克大模型就可以列舉出關(guān)鍵點(diǎn),讓效率大大提升。
而在大家常用的文案寫(xiě)作上,夸克也做了幾個(gè)小工具。比如,打卡網(wǎng)紅露營(yíng)地的時(shí)候想發(fā)個(gè)朋友圈,這時(shí)就可以讓AI寫(xiě)得有詩(shī)意一點(diǎn)。

國(guó)產(chǎn)大模型,學(xué)霸喜+1

可以說(shuō),全棧自研的千億級(jí)參數(shù)的夸克大模型,是國(guó)內(nèi)LLM班級(jí)里妥妥的學(xué)霸了。
C-Eval是由清華大學(xué)、上海交通大學(xué)和愛(ài)丁堡大學(xué)合作構(gòu)建的綜合性考試評(píng)測(cè)集,覆蓋52個(gè)學(xué)科,是目前權(quán)威的中文AI大模型評(píng)測(cè)榜單之一。
CMMLU是由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出,包含67個(gè)主題,專門(mén)用于評(píng)估語(yǔ)言模型在中文語(yǔ)境下的知識(shí)和推理能力。
兩個(gè)榜單的權(quán)威性毋庸置疑。
評(píng)測(cè)過(guò)程中,夸克大模型經(jīng)過(guò)了上萬(wàn)道專業(yè)考題的檢驗(yàn),覆蓋幾十個(gè)學(xué)科和不同學(xué)段。無(wú)論是常識(shí)問(wèn)題還是社會(huì)科學(xué)知識(shí),夸克大模型都展現(xiàn)出了處理復(fù)雜、多層次問(wèn)題的能力。
基于精調(diào)后的訓(xùn)練數(shù)據(jù),夸克大模型能夠更好地理解問(wèn)題的上下文、邏輯結(jié)構(gòu)和語(yǔ)義關(guān)系,從而更全面、深入地分析和解決問(wèn)題。
在5471道真題考試中,夸克大模型不僅成功超越了GPT-3.5,甚至部分成績(jī)還優(yōu)于GPT-4——

45個(gè)科目中,11科優(yōu)秀(準(zhǔn)確率≥80%),25科及格(準(zhǔn)確率≥60%)
總結(jié)來(lái)說(shuō),夸克大模型整體的水平與GPT-3.5相當(dāng),但能更好地理解中文知識(shí)體系并進(jìn)行文本寫(xiě)作。
在多語(yǔ)言翻譯、寫(xiě)代碼、安全合規(guī)、內(nèi)容創(chuàng)作等領(lǐng)域,處在國(guó)內(nèi)行業(yè)頭部水平。
多模態(tài)方面,夸克大模型支持相冊(cè)搜索、AI相機(jī)場(chǎng)景下的文搜圖、圖生圖、圖生文等。
從上面的演示可以看出,這些知識(shí)和創(chuàng)作對(duì)應(yīng)的能力,和夸克的產(chǎn)品之間,恰恰就有著極強(qiáng)的對(duì)應(yīng)關(guān)系。

破除大模型幻覺(jué),夸克是專業(yè)的

大模型要做產(chǎn)品,幻覺(jué)就是一道必然要解決的難題。
在蔣冠軍看來(lái),要解決大模型應(yīng)用的問(wèn)題,就要先解決知識(shí)正確性的問(wèn)題。
憑借著搜索技術(shù)能力的積累,團(tuán)隊(duì)在解決幻覺(jué)這個(gè)困擾絕大多數(shù)模型的老大難問(wèn)題時(shí),有著相當(dāng)大的優(yōu)勢(shì)。
能解決幻覺(jué)難題,首先就是因?yàn)榭淇嗽谒阉髦R(shí)體系的整體積累。
在健康場(chǎng)景下,錯(cuò)誤率甚至能降到5%以下。能達(dá)到如此高的可用性,也是因?yàn)楹芏嗨阉鹘Y(jié)果都是醫(yī)生三審三校的結(jié)果。
在模型的預(yù)訓(xùn)練中,因?yàn)閿?shù)據(jù)規(guī)模越大,引入的錯(cuò)誤知識(shí)也會(huì)越多。這是個(gè)悖論。因此,團(tuán)隊(duì)花費(fèi)了大量時(shí)間和精力,做了數(shù)據(jù)準(zhǔn)確性校驗(yàn)和對(duì)齊。

為什么能成學(xué)霸?

除了專門(mén)針對(duì)大模型的技術(shù)創(chuàng)新之外,夸克經(jīng)過(guò)多年發(fā)展所積累的4個(gè)優(yōu)勢(shì),也是培養(yǎng)出這位「新學(xué)霸」的原動(dòng)力。
1. 數(shù)據(jù)全面
首先,夸克積累了40多個(gè)行業(yè),幾乎涵蓋了整個(gè)中文領(lǐng)域的知識(shí)。
2. 多語(yǔ)言知識(shí)
其次,在英語(yǔ)等其他語(yǔ)種上,夸克也憑借著在通用搜索領(lǐng)域的深耕,積累了豐富的知識(shí)和數(shù)據(jù)。
對(duì)于大模型來(lái)說(shuō),知識(shí)的理解、對(duì)齊和校驗(yàn),是至關(guān)重要的。而夸克憑借著通用搜索的經(jīng)驗(yàn),已經(jīng)在內(nèi)容的理解方面,建立起了一個(gè)非常完整的體系。
3. 數(shù)據(jù)豐富
第三,夸克擁有很高的數(shù)據(jù)豐富程度。
搜索引擎本身就是海量的網(wǎng)頁(yè)數(shù)據(jù),在夸克的數(shù)據(jù)庫(kù)里,這個(gè)數(shù)字是千億級(jí)。
這也意味著,需要有一個(gè)強(qiáng)大的工程系統(tǒng)來(lái)處理如此大規(guī)模的網(wǎng)頁(yè)數(shù)據(jù),從而完成去重、分析等工作。這種能力和大模型的需求非常匹配——大模型要大算力,傳統(tǒng)搜索引擎本身就具備大算力。
此外,對(duì)于搜索引擎來(lái)說(shuō),如何去判斷搜索結(jié)果的好壞,以及如何在大量的站點(diǎn)中進(jìn)行篩選,都需要團(tuán)隊(duì)有一個(gè)高質(zhì)量的評(píng)估和評(píng)價(jià)體系。而這個(gè)體系,對(duì)于大模型來(lái)說(shuō)也同樣適用。
類似的,在大模型和人類對(duì)齊方面,傳統(tǒng)搜索積累的經(jīng)驗(yàn),也能夠更好地幫助團(tuán)隊(duì)。
4. 人才儲(chǔ)備
其實(shí),通用搜索涵蓋的范圍非常廣,包括網(wǎng)頁(yè)搜索、圖片搜索、視頻搜索、文檔搜索等等。而支持這些搜索功能的技術(shù)體系和人員,就是大模型所需的多模技術(shù)能力和人才體系。
在這方面,夸克有著深厚積淀。

夸克技術(shù)負(fù)責(zé)人蔣冠軍
此外,夸克的產(chǎn)運(yùn)團(tuán)隊(duì)在智能技術(shù)的產(chǎn)品創(chuàng)新上,也有著豐富的經(jīng)驗(yàn)。這是因?yàn)椋淇说哪繕?biāo)是成為一個(gè)工作和學(xué)習(xí)的個(gè)人助手,因此所有的智能化產(chǎn)品,都是以技術(shù)為核心驅(qū)動(dòng)的。
至于業(yè)務(wù)層面,夸克在健康、教育等關(guān)鍵的行業(yè)里,不僅有著較好的數(shù)據(jù)積累,同時(shí)團(tuán)隊(duì)成員里還有醫(yī)生和老師的從業(yè)經(jīng)驗(yàn)。這些人才帶來(lái)的一手經(jīng)驗(yàn),對(duì)于構(gòu)建大模型所需的高質(zhì)量SFT樣本和專業(yè)知識(shí)來(lái)說(shuō),至關(guān)重要。
5. 知識(shí)增強(qiáng)
最后,夸克還利用了搜索和知識(shí)圖譜文檔的積累,對(duì)自家的大模型進(jìn)行了知識(shí)增強(qiáng),從而極大地緩解了常見(jiàn)的幻覺(jué)問(wèn)題。

搜索,大模型應(yīng)用的最佳平臺(tái)

ChatGPT掀起大模型熱以來(lái),業(yè)內(nèi)一直在不斷探索,大模型的落地場(chǎng)景究竟在哪里?
業(yè)內(nèi)有觀點(diǎn)認(rèn)為,以搜索為代表的信息服務(wù)場(chǎng)景,是大模型開(kāi)發(fā)及應(yīng)用的最佳平臺(tái)。
在今年5月的I/O大會(huì)上,谷歌將生成式AI和自己傳統(tǒng)搜索服務(wù)結(jié)合起來(lái),發(fā)布了全新Search Generative Experience(SGE)。
簡(jiǎn)單來(lái)說(shuō),谷歌會(huì)利用AI為搜索的內(nèi)容提供說(shuō)明,回答用戶提出的問(wèn)題,幫用戶做旅行規(guī)劃等等。
期間,用戶不再需要貨比三家般的在多個(gè)鏈接之間來(lái)回跳轉(zhuǎn),也不用花心力去判斷哪個(gè)鏈接背后的信息是真的,因?yàn)樗锌捎玫膬?nèi)容都被集中到了AI收集到的回復(fù)之中。
在最近的更新中,谷歌又添加了讓SGE在AI生成的回復(fù)內(nèi)容中附加圖片和視頻的功能,幫助用戶更加直觀的了解自己搜索的知識(shí)和信息。
不僅如此,SGE的AI響應(yīng)中還會(huì)標(biāo)注發(fā)布時(shí)間的鏈接,來(lái)支持由AI生成的回復(fù)內(nèi)容。如果用戶對(duì)于相關(guān)的信息感興趣,點(diǎn)擊鏈接就能更加全面地了解具體的內(nèi)容。
而夸克大模型在夸克APP的落地,則是以扎實(shí)的技術(shù),跑通了中國(guó)的「大模型+搜索」之路。

夸克的自研之路

之所以夸克能夠自研大模型,其核心是發(fā)揮了在搜索引擎和數(shù)據(jù)上的優(yōu)勢(shì)。
蔣冠軍表示,要從千億級(jí)的網(wǎng)頁(yè)里,篩選出數(shù)億的高質(zhì)量網(wǎng)頁(yè),這個(gè)過(guò)程非常復(fù)雜。不是做搜索引擎的廠商,要完成這項(xiàng)任務(wù),成本和代價(jià)非常高。
首先,獲取海量的中文數(shù)據(jù)和知識(shí)本身,難度就非常大。
其次,網(wǎng)頁(yè)里的垃圾數(shù)據(jù)非常多。這時(shí)候,就需要把行業(yè)數(shù)據(jù)和知識(shí)圖譜的積累,輸入進(jìn)大模型作為補(bǔ)充。
第三個(gè)核心挑戰(zhàn),就是人類知識(shí)對(duì)齊和SFT精標(biāo)數(shù)據(jù)對(duì)齊。真正有用的SFT樣本數(shù)據(jù)很稀缺,這需要各行各業(yè)有經(jīng)驗(yàn)的人去做。
對(duì)此,夸克分了兩個(gè)階段進(jìn)行嘗試。第一版不行,就馬上重組了新的專業(yè)團(tuán)隊(duì),其中不只有資深的從業(yè)人員,還有來(lái)自各行各業(yè)的外包人員。然后才一步一步地走到了今天。
以后,夸克大模型會(huì)優(yōu)先落地通識(shí)問(wèn)答、專業(yè)搜索等場(chǎng)景,充分滿足年輕人自我提升和充電的需求。
在可見(jiàn)的未來(lái),會(huì)有更智能的下一代產(chǎn)品,讓AI助理無(wú)處不在。
「AI時(shí)代已經(jīng)來(lái)臨,大模型應(yīng)用的全新體驗(yàn)臨界點(diǎn)近在咫尺。」
隨著自研大模型的全面升級(jí),全新的夸克,必然會(huì)給我們帶來(lái)全新的驚喜。



本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
ChatGTP全景圖 | 背景 技術(shù)篇
中金 | AI Answer:大模型助力B端落地先行范式
中國(guó)有機(jī)會(huì)做出自己的 ChatGPT 嗎?
比爾·蓋茨都為之傾倒的AI Agent,究竟是什么
澳鵬宣布面向生成式AI戰(zhàn)略升級(jí)
關(guān)于ChatGPT的五個(gè)最重要問(wèn)題
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 兴义市| 雷山县| 改则县| 乌拉特中旗| 贡觉县| 全椒县| 株洲县| 宝兴县| 遂川县| 茂名市| 上林县| 屏山县| 邓州市| 卢氏县| 石屏县| 四平市| 昂仁县| 淳化县| 淄博市| 澄江县| 剑河县| 荃湾区| 繁昌县| 安阳县| 二手房| 浦江县| 江北区| 辽源市| 临海市| 湾仔区| 开阳县| 高阳县| 惠来县| 洛扎县| 鹤壁市| 巴彦淖尔市| 克拉玛依市| 军事| 岗巴县| 微博| 兴山县|