“l(fā)ambeq”將句子轉(zhuǎn)換為量子電路,隨著量子計算系統(tǒng)的擴大,加速實用QNLP應用的開發(fā)
英格蘭劍橋2021年10月14日 /美通社/ -- 劍橋量子(“CQ”)今天宣布推出全球首個量子自然語言處理(QNLP)工具包和文庫。該工具包被稱為lambeq,以已故數(shù)學家和語言學家Joachim Lambek的名字命名。
lambeq是全球首個QNLP軟件工具包,能夠?qū)⒕渥愚D(zhuǎn)換為量子電路。其目的是加快開發(fā)實用、現(xiàn)實世界的QNLP應用程序,如自動對話、文本挖掘、語言翻譯、文字到語音、語言生成和生物信息學。
lambeq在完全開源的基礎(chǔ)上推出,以造福全球量子計算界和快速發(fā)展的量子計算研究人員、開發(fā)人員和用戶生態(tài)系統(tǒng)。lambeq與CQ全球領(lǐng)先和快速增長的量子軟件開發(fā)平臺TKET無縫銜接,后者也是完全開源的。這使QNLP開發(fā)人員能夠訪問盡可能廣泛的量子計算機。
lambeq由首席科學家Bob Coecke領(lǐng)導的CQ位于牛津的量子計算研究團隊構(gòu)思、設(shè)計和打造而成,由資深科學家Dimitrios Kartsaklis博士擔任平臺的首席架構(gòu)師。lambeq和范圍更廣的QNLP是一個為期十多年的研究項目的結(jié)果。
Coecke表示:“我們的團隊一直在參與基礎(chǔ)性工作,探索如何利用量子計算機解決人工智能中一些最棘手的問題。這項工作的基礎(chǔ)是最初由我本人、現(xiàn)任CQ人工智能主管Steve Clark等人開創(chuàng)的進步結(jié)果。NLP是這些調(diào)查的核心。幾個月前的發(fā)布詳細介紹了CQ首次在實際量子計算機上實施QNLP的情況,以及我們在2019年12月首次披露了相關(guān)基本原則,現(xiàn)在lambeq的推出是自然邁出的下一步?!?/p>
Coecke補充道:“在過去一年中發(fā)表的各種論文中,我們不僅提供了量子計算機可以如何增強NLP的詳細信息,而且還證明了QNLP是“量子原生”,這意味著管理語言的組織結(jié)構(gòu)在數(shù)學上與管理量子系統(tǒng)的結(jié)構(gòu)是相同的。這將引領(lǐng)世界最終擯棄目前人工智能所依賴的不透明和近似性的蠻力技術(shù)模式?!?/p>
lambeq使CQ科學家先前描述的組成分布(DisCo)類型NLP實驗的設(shè)計和部署得以完成并實現(xiàn)自動化。這意味著從編碼文本結(jié)構(gòu)的句法/語法圖表到采用TKET實施的(古典)張量網(wǎng)絡或量子電路,可針對文本分類等機器學習任務進行優(yōu)化。lambeq采用模塊化設(shè)計,用戶可以在模型內(nèi)外交換組件,并在架構(gòu)設(shè)計中具有靈活性。
lambeq消除了專注于人工智能和人機互動的從業(yè)人員和研究人員的進入障礙,這可能是量子技術(shù)最重要的應用之一。TKET現(xiàn)在已有數(shù)十萬計的全球用戶群。lambedq有望成為尋求與QNLP應用程序互動之量子計算界最重要的工具包,而QNLP應用程序是人工智能最重要的市場之一。最近出現(xiàn)的一個關(guān)鍵點是,QNLP也將適用于在基因組學和蛋白質(zhì)組學中出現(xiàn)的符號序列分析。
lambeq的推出合作伙伴,同時也是早期采用者的默克集團最近發(fā)布了一篇關(guān)于QNLP的研究論文,這是其與慕尼黑技術(shù)大學的創(chuàng)新計劃“量子創(chuàng)業(yè)實驗室”進行的一個項目的一部分。
來自默克IT醫(yī)療創(chuàng)新孵化器,同時也是Quantum Computing Interest Group聯(lián)合創(chuàng)始人的Thomas Ehmer表示:“利用量子計算的獨特功能實現(xiàn)根本性突破,是我們在默克開展的研究的重要組成部分。我們最近披露的與慕尼黑技術(shù)大學研究人員合作的QNLP項目證明,使用QNLP技術(shù)的句子二元分類任務即使在現(xiàn)階段也可以取得與現(xiàn)有傳統(tǒng)方法相當?shù)慕Y(jié)果。顯然,圍繞量子計算的基礎(chǔ)設(shè)施需要取得進步才能在商業(yè)上采用這些技術(shù)。重要的是,我們可以看到在QNLP中采用的這種方法為實現(xiàn)可解釋的人工智能開辟了道路,從而也為實現(xiàn)更準確和更可靠的智能開辟了道路,而這在醫(yī)學上是至關(guān)重要的?!?/p>
Kartsaklis表示:“QNLP有許多有趣的理論工作,但理論通常與實踐有一定距離。通過lambeq,我們?yōu)檠芯咳藛T提供了獲得QNLP實驗方面實踐經(jīng)驗的機會,目前這完全是一塊未曾觸及的區(qū)域。這是朝著實現(xiàn)量子硬件上的實用、現(xiàn)實世界的NLP應用程序成為現(xiàn)實方向邁出的關(guān)鍵一步?!?/p>
lambeq已在GitHub上作為傳統(tǒng)的Python存儲庫發(fā)布,并可在此處獲取:https://github.com/CQCL/lambeq。 迄今為止,lambeq生成的量子電路已在IBM量子計算機和Honeywell Quantum Solutions的H系列設(shè)備上執(zhí)行和實施。
上傳到arxiv上的一份技術(shù)報告對工具包進行了介紹,該技術(shù)報告可在此處獲?。?nbsp;https://arxiv.org/abs/2110.04236。在這里可以找到一個更易訪問的博客帖子:https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2。有關(guān)技術(shù)問題,請聯(lián)系lambeq-support@cambridgequantum.com。
近年來,從客戶服務和消費者技術(shù)到醫(yī)療和廣告,基于NLP的應用已在全球各個行業(yè)普及。行業(yè)分析師表示,預計到2028年,全球NLP市場價值將達到1272.6億美元,復合年增長率接近30%[1]。