近日,阿里云聯合魔搭社區和Datawhale發起的第四季Create@AI創客松在上海模速空間完成Demo Day路演。當天共有25支隊伍從全球150+隊伍中脫穎而出線下進行路演,并由多位AI領域的專家組成專業評審團,從技術能力、產品體驗、市場前景、創新思路、云上創新等多個維度進行綜合評審,評選出本次Create@AI創客松的各個獎項。
01
Multi-Agent的25種解題思路
隨著 Agent的興起,大家逐漸認識到單一Agent的局限性。綜合多個不同功能的LLM-Powered Agent 的優點,通過多個 AI 智能體一起工作,分配任務并討論和辯論想法,以提出比單個智能體更好的解決方案。斯坦福大學教授吳恩達也曾公開表示非??春枚嘀悄荏w的發展,認為多智能體協作可以取得比單個智能體更好的性能。他期待AI智能體工作流在未來引領人工智能的新趨勢。正是因為如此,本次比賽demo day現場吸引了諸多觀眾,期待通過本次比賽的參賽作品一窺AI未來。
透過本次比賽,我們可以看到游戲領域是MultiAgent最多落地的場景,Action、藥品知識科普小分隊、模法創新者從教育科普類游戲切入,瓦力向前沖均借助多智能體的方式為游戲帶來更多個性化的體驗;X-D Lab心動實驗室、終抵繁星、鬼斧神工則帶來沉浸式的角色扮演體驗。
效率工具領域則是第二多落地的場景,AgentFreedom、cjy的隊伍借助Multi-Agent提升視頻和文本生成效率;嘉喻戶曉、今日宜開擺、MVP小組、SQL BOY、賽博大叔、無可比倪隊伍通過Multi-Agent重構工作流,為廣告、設計、工程等場景實現降本增效。
而在廣泛的生活需求上,包括生活減壓、社交矛盾調解、兒童陪伴、提升學習效率等,甚至小到推薦一杯雞尾酒,針對這些日常生活方方面面的需求,金牌調解員、老板說什么都不對、MumuLab、你有高速運轉的機器進入UESTC、SUN、職場馭師、致勝AI創客、智慧協同小隊這些隊伍也分別從不同角度給出多智能體應用解決方案。
參賽選手們現場展示開發成果,并與觀眾和評委團進行交互體驗。此次比賽也創新性開設觀眾互動環節,不僅有路演前的交流試玩,在路演中也邀請現場觀眾對心選作品參與點贊投票。
最終,以下隊伍分獲此次
Create@AI創客松獎項
02
從Agent到Multi-Agent,
創業者如何快速落地
此次Create@AI創客松比賽中,我們看到很多優秀的AI創業團隊帶來了多智能體應用作品,感受到Multi-Agent在不同領域中發揮的價值。從Agent到MultiAgent,從技術錘子走向應用落地,AI創業者們如何小步快跑,對自己的產品進行快速迭代?在推向市場過程中又會有哪些技術難題和發展挑戰?對此,我們還邀請了AI領域的產、投、研專家,圍繞《從Agent到MultiAgent:技術進展和應用落地》主題展開了一場圓桌討論。
從投資的視角出發,Atom Capital創始合伙人楊孟彤看到,從早期的代表Copilot,逐漸過渡到如今的自主性更強的Agent,不僅能執行單一任務,更能承擔起更為復雜的、獨立閉環的工作流,實現某種程度的自主操作。這也意味著Agent正逐漸演變為具備完整功能的數字員工,能夠在更多實際場景中落地應用,成為AI工作力量的重要組成部分。這一發展趨勢被視為極具潛力和前景的賽道。
阿里巴巴集團投資部執行董事王冉也表示,隨著底層模型的持續迭代更新,短期來看,Agent可能在精準度要求相對較低的游戲和C端消費領域中更容易落地,但從長期來看,Agent技術在效率提升和工具應用等B端場景中有望替代部分人工操作,并在某些方面超越。隨著技術成熟,企業級和專業化應用場景將迎來更多的發展機遇和突破。
技術錘子在走向落地的過程中,AI創業者們還面臨著很多難題,其中首當其沖的是模型幻覺問題。很多AI開發者會使用RAG技術進行優化。復旦大學計算機科學技術學院教授張奇肯定了RAG技術的積極作用,但也提到提升的過程仍面臨重大挑戰,尤其是在達到更高層次的性能時。例如,PDF解析和向量檢索等任務在處理復雜格式和提高檢索準確率方面存在困難。盡管大型模型提供了一定程度的改進,但在長文本處理等方面仍有待提高。將技術從demo到實際應用還需要在每個技術環節進行細致的優化,這是一個既艱難又必要的過程。
盡管挑戰重重,目前市場上已經出現了相對成熟的多智能體產品,例如斯坦福小鎮等,但也引起了社會對人機協作關系的廣泛討論。中國人民大學高瓴人工智能學院教授魏哲巍認為多智能體應用正深刻影響人文社會科學的研究范式。通過多智能體系統,能夠模擬現實中不可行或具有爭議的社會實驗,例如公租房分配實驗等。
總的來看,Multi-Agent在提升大型模型性能和應用效果方面有巨大潛力和長遠意義。通義實驗室資深算法專家李雅亮也提出,通過Multi-Agent系統積累的數據和經驗,可以用于訓練下一代大模型,使其具備更強的CoT(Chain of Thought,大模型思維鏈)能力。從長遠來看,隨著大模型CoT能力的提升,原本需要Multi-Agent協同完成的任務可能會由單個智能體獨立完成。
圖|圓桌討論現場
對于創業者而言,從技術走向應用不是重點,市場才是真正的目的地。正如瀾碼科技創始人兼CEO周健在啟發演講中總結的,AI創業者從想法到PMF的過程中,首先要找到解決問題的市場和目標客戶群體,并在銷售過程中需要不斷地迭代和改進產品,尋找合適的銷售渠道。產品走向市場過程中,品牌宣傳和個人影響力可以幫助提高獲客效率,而數據分析和用戶反饋對于優化產品和提高轉化率非常重要。創業者需要找到適合自己擅長的領域和專業技能,發揮自己的競爭優勢。
圖|周健 瀾碼科技創始人兼CEO
03
“云+AI”,構建多智能體
應用開發新范式
今天,“云+AI”正成為一種創業新范式。阿里云在2023年9月正式推出創業者計劃。該計劃可以為創業者提供最高100萬元的上云抵扣金,阿里云中小企業品牌總經理儲爾勇在開場致辭中特別強調希望通過該計劃幫助創業者快速啟動,“為創業者創新成長提速”。據悉,當前已超過1.3萬家創業公司申請加入。
圖|阿里云中小企業品牌總經理儲爾勇開場致辭
同時為了助力更多AI創業者快速構建自己的多智能體應用,阿里云與魔搭社區提供了云上創新資源支持。
阿里云所提供的“云+AI工具箱”,讓初創團隊快速從0 啟動,搭建自己的產品。阿里云一站式大模型應用開發平臺——百煉,通過集成了國內外主流優質大模型,提供模型選型、微調訓練、安全套件、模型部署等服務和全鏈路的應用開發工具,為選手簡化了底層算力部署、模型預訓練、工具開發等復雜工作。本次比賽中參賽隊伍就通過百煉快速調用了通義千問Qwen-max 、通義千問Qwen-VL-max 的能力。與此同時,在PaaS層,阿里云人工智能平臺PAI作為機器學習/深度學習工程平臺,提供包含數據標注、模型構建、模型訓練、模型部署、推理優化在內的AI開發全鏈路服務,為初創團隊提供低門檻、高性能的云原生AI工程化能力。
此次Create@AI創客松比賽中,選手們都基于AgentScope框架進行多智能體應用開發。AgentScope是全新開源的Multi-Agent框架,提供了分布式模式,支持將同一個應用中的多個 Agent 運行在不同的進程甚至不同的機器上。該框架可以讓多個Agent通訊及協作,從而提升任務完成的準確率和穩定性。
為創新成長提速,
下一季Create@AI創客松再會!
/ END /