加利福尼亞州雷德伍德城2024年10月30日 /美通社/ -- 陳天橋雒芊芊腦科學(xué)研究院(TCCI)內(nèi)部人工智能團(tuán)隊(duì)?wèi){借對(duì)大腦和記憶的深刻理解,在人工智能領(lǐng)域取得了重大突破。他們自主研發(fā)的OMNE多智能體框架在GAIA(通用人工智能助手)基準(zhǔn)測(cè)試排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)上奪得首位,該排行榜由Meta AI、Hugging Face和Hugging Face的AutoGPT共同發(fā)起。 OMNE的表現(xiàn)優(yōu)于包括微軟研究院(Microsoft Research)在內(nèi)的一些世界領(lǐng)先機(jī)構(gòu)的框架。 這一成就基于TCCI多年的大腦研究成果,賦予智能體長(zhǎng)期記憶(LTM)能力,使得框架能夠進(jìn)行更深層次、更緩慢的思考,并在復(fù)雜問(wèn)題解決中增強(qiáng)大型語(yǔ)言模型(LLM)的決策能力。
這一里程碑是自該研究院創(chuàng)始人、前中國(guó)科技巨頭陳天橋去年宣布"All-In AI戰(zhàn)略"以來(lái),TCCI人工智能團(tuán)隊(duì)的一項(xiàng)重大成就。
OMNE目前的總體成功率達(dá)到40.53%,在性能上超過(guò)了Meta、微軟、Hugging Face、普林斯頓大學(xué)、香港大學(xué)、英國(guó)人工智能安全研究所以及百川等提交的成果。 與此相比,配備插件的GPT-4的成功率僅為15%。
GAIA是多智能體智能領(lǐng)域中最嚴(yán)格的數(shù)據(jù)集之一,能夠在其排行榜上位居首位,彰顯了TCCI在人工智能領(lǐng)域的深厚專(zhuān)業(yè)知識(shí)以及拓展創(chuàng)新邊界的能力。
OMNE是一個(gè)基于長(zhǎng)期記憶(LTM)的多智能體協(xié)作框架。 每個(gè)智能體具有相同且獨(dú)立的系統(tǒng)結(jié)構(gòu),能夠自主學(xué)習(xí)和理解完整的世界模型,從而獨(dú)立理解其環(huán)境。 基于LTM的多智能體協(xié)同系統(tǒng)使人工智能系統(tǒng)能夠?qū)崟r(shí)適應(yīng)個(gè)體行為變化,優(yōu)化任務(wù)規(guī)劃和執(zhí)行,促進(jìn)個(gè)性化、高效的自我進(jìn)化。
這一突破是長(zhǎng)期記憶機(jī)制的融合,大大縮小了MCTS的搜索空間,提高了對(duì)復(fù)雜問(wèn)題的決策能力。 通過(guò)引入更高效的邏輯推理,OMNE不僅提升了單個(gè)智能體的智能水平,還通過(guò)優(yōu)化協(xié)作機(jī)制顯著增強(qiáng)了多智能體系統(tǒng)的整體能力。 這種增強(qiáng)的靈感來(lái)自對(duì)人類(lèi)大腦皮層柱狀結(jié)構(gòu)的研究。 作為大腦認(rèn)知和行為功能的基本單位,皮質(zhì)柱通過(guò)復(fù)雜的協(xié)作機(jī)制實(shí)現(xiàn)信息處理。 通過(guò)加強(qiáng)單個(gè)智能體之間的協(xié)作,人工智能模型可能逐漸展現(xiàn)出認(rèn)知能力,構(gòu)建起內(nèi)部表征模型,并最終推動(dòng)系統(tǒng)整體智能的飛躍。
"我們對(duì)OMNE榮登GAIA排行榜榜首感到無(wú)比自豪。" TCCI人工智能團(tuán)隊(duì)負(fù)責(zé)人表示。 "這一成就展示了利用長(zhǎng)期記憶推動(dòng)人工智能自我進(jìn)化和解決現(xiàn)實(shí)世界問(wèn)題的巨大潛力。 我們認(rèn)為,推進(jìn)長(zhǎng)期記憶和人工智能自我進(jìn)化的研究對(duì)于人工智能技術(shù)的持續(xù)發(fā)展和實(shí)際應(yīng)用至關(guān)重要。"