鵬城、百度聯(lián)合發(fā)布全球首個知識增強千億大模型鵬城-百度·文心

作為當前人工智能發(fā)展的重要方向,預訓練大模型已成為AI領域的技術新高地。2021年12月8日,鵬城實驗室與百度聯(lián)合召開發(fā)布會,正式發(fā)布雙方共同研發(fā)的全球首個知識增強千億大模型——鵬城-百度·文心(模型版本號:ERNIE 3.0 Titan)。該模型參數(shù)規(guī)模達到2600億,是目前全球最大中文單體模型,在60多項任務上取得最好效果。同時,產(chǎn)業(yè)級知識增強大模型“文心”全景圖首次亮相,從技術自主創(chuàng)新和加速產(chǎn)業(yè)應用兩方面,推動中國AI發(fā)展更進一步。

現(xiàn)場,中國工程院院士、鵬城實驗室主任高文,百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰共同啟動發(fā)布儀式。

image.png

中國工程院院士、鵬城實驗室主任高文(左),百度首席技術官王海峰聯(lián)合發(fā)布鵬城-百度·文心

 

高文院士在致辭中表示,“預訓練模型對整個科學的發(fā)展、社會的發(fā)展、創(chuàng)新的發(fā)展都是非常重要的工具。運用這個工具,可以幫助做很多人工智能的賦能,不局限于某個領域,這對人工智能的發(fā)展都是一個福音?!?/p>

王海峰介紹,此次發(fā)布的鵬城-百度·文心知識增強大模型從大規(guī)模知識和海量數(shù)據(jù)中融合學習,效率更高,效果更好,具有良好的可解釋性。

image.png

值得關注的是,鵬城-百度·文心是全球首個知識增強千億大模型,在機器閱讀理解、文本分類、語義相似度計算等60多項任務取得最好效果,并在30余項小樣本和零樣本任務上刷新基準。為解決大模型應用落地難題,研究團隊還首創(chuàng)了大模型在線蒸餾技術,模型參數(shù)壓縮率可達99.98%。壓縮版模型僅保留0.02%參數(shù)規(guī)模就能與原有模型效果相當,為產(chǎn)業(yè)大規(guī)模應用打開新窗口。

image.png

使用鵬城-百度·文心進行可信、可控文本生成

 

在鵬城-百度·文心的研發(fā)過程中,得益于鵬城實驗室的高性能AI算力系統(tǒng)“鵬城云腦Ⅱ”和飛槳深度學習平臺強強聯(lián)手,解決了超大模型訓練的多個公認技術難題,使鵬城-百度·文心訓練效率大幅提升,模型效果更優(yōu)?!谤i城云腦Ⅱ”是國產(chǎn)自主的首個E級AI算力平臺,曾在多個國際性能測試上獲得冠軍。飛槳是我國首個自主研發(fā)的深度學習開源開放平臺,研制了端到端自適應分布式訓練框架,實現(xiàn)多硬件支持,并行效率高達90%,有效支持鵬城-百度·文心千億大模型高效、穩(wěn)定地訓練。另外,“鵬城云腦II”技術團隊也與華為團隊一同對大模型訓練給予了持續(xù)保障。

為促進產(chǎn)學研協(xié)“多輪驅(qū)動”,鵬城實驗室與百度成立了鵬城-百度自然語言處理聯(lián)合實驗室,并以此為依托,實現(xiàn)資源共享、優(yōu)勢互補,在自然語言處理前沿研究和創(chuàng)新應用方面協(xié)同攻關,助力打造國家戰(zhàn)略科技力量。此次聯(lián)合發(fā)布的鵬城-百度·文心將進一步解決 AI 技術在產(chǎn)業(yè)應用中缺乏領域和場景化數(shù)據(jù)等關鍵難題。本著“開源開放”的理念,該模型相關代碼近期會在OpenI啟智社區(qū)開源,依托“鵬城云腦Ⅱ”對外開放模型服務,聯(lián)合產(chǎn)學研協(xié)各方,充分挖掘AI大模型的賦能能力,助力科技創(chuàng)新,推動產(chǎn)業(yè)發(fā)展。

 

Share this article:

Facebook
Twitter
LinkedIn
WhatsApp