北京2024年3月11日 /美通社/ -- IBM(紐約證券交易所代碼:IBM)近日宣布,由Mistral AI公司開發(fā)的廣受歡迎的開源Mixtral-8x7B大型語言模型(LLM)已經(jīng)可在其watsonx人工智能與數(shù)據(jù)平臺上使用。
IBM 提供了 Mixtral-8x7B 的優(yōu)化版本,在內(nèi)部測試中,與常規(guī)模型相比,該版本能夠?qū)⑼掏铝浚丛诮o定時間段內(nèi)可處理的數(shù)據(jù)量)提高50%[i]。這可能可以將時間延遲減少 35-75%,從而加快獲得洞察的時間,具體取決于批處理量的大小。這是通過一個稱為量化的過程來實現(xiàn)的,該過程減少了 LLM 的模型大小和內(nèi)存需求,進而可以加快處理速度,有助于降低成本和能耗。
Mixtral-8x7B 的加入擴展了 IBM 的開放、多模型戰(zhàn)略,隨時隨地滿足客戶的需求,并為他們提供選擇和靈活性,使其可以跨業(yè)務(wù)來擴展其企業(yè)級人工智能解決方案。通過數(shù)十年的人工智能研發(fā)、與 Meta 和 Hugging Face 開放式協(xié)作,以及與模型領(lǐng)導(dǎo)者的合作伙伴關(guān)系,IBM 正在擴展其 watsonx.ai 模型目錄,并引入新的功能、語言和模式。
IBM 的企業(yè)就緒基礎(chǔ)模型選擇及其 watsonx 人工智能和數(shù)據(jù)平臺可幫助客戶利用生成式人工智能獲得新的洞察力和效率,并基于信任原則創(chuàng)建新的業(yè)務(wù)模式。IBM 可幫助客戶根據(jù)所針對的業(yè)務(wù)領(lǐng)域(如金融)的合適用例及性價比目標來選擇合適的模型。
Mixtral-8x7B 結(jié)合了稀疏建模與專家混合技術(shù)來構(gòu)建,"稀疏建模"是只查找和使用數(shù)據(jù)中最重要部分以創(chuàng)建更高效的模型的創(chuàng)新技術(shù);而"專家混合技術(shù)"是把擅長并解決不同部分問題的不同模型("專家")結(jié)合在一起的技術(shù)。Mixtral-8x7B 模型因其能夠快速處理和分析海量數(shù)據(jù)以提供與上下文相關(guān)的見解而廣為人知。
IBM 軟件公司產(chǎn)品管理與增長高級副總裁 Kareem Yusuf 博士表示:"客戶要求在部署最適合其獨特用例和業(yè)務(wù)要求的模型時擁有選擇權(quán)和靈活性。通過在watsonx上提供Mixtral-8x7B和其它模型,我們不僅為客戶提供了部署人工智能的可選性,還為人工智能構(gòu)建者和業(yè)務(wù)領(lǐng)導(dǎo)者提供了一個強大的生態(tài)系統(tǒng),使他們能夠利用工具和技術(shù)推動不同行業(yè)和領(lǐng)域的創(chuàng)新。"
在同一周,IBM還宣布在watsonx上提供由ELYZA公司開源的日本LLM模型ELYZA-japanese-Llama-2-7b。IBM 還在 watsonx 上提供 Meta 的開源模型 Llama-2-13B-chat 和 Llama-2-70B-chat 以及其它第三方模型,未來幾個月還將推出更多模型。
有關(guān) IBM 未來方向和意圖的聲明如有更改或撤回,恕不另行通知,僅代表目標和目的。
關(guān)于IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯(lián)絡(luò)人:
[i] 基于 IBM 在供 IBM 使用的 watsonx 實例上使用內(nèi)部工作負載進行的為期兩天的測試。