3月16日,百度在北京總部召開新聞發布會,百度創始人、董事長兼首席執行官李彥宏和百度首席技術官王海峰出席,李彥宏展示了新一代知識增強大語言模型文心一言在文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成五個使用場景中的綜合能力,王海峰解讀了文心一言的技術特性及其背后的技術積累。

王海峰 百度供圖
厚積薄發,長期技術積累構建全棧AI技術
在人工智能時代,IT技術棧可分為“芯片層、框架層、模型層、應用層”四層,百度自2010年起開始全面布局人工智能,是全球為數不多、進行全棧布局的人工智能公司。從昆侖芯片、飛槳深度學習平臺、文心大模型到應用,百度在技術棧的各層都有領先業界的關鍵自研技術,實現了層與層反饋,端到端優化,大幅提升效率。
在框架層,飛槳是百度自主研發的中國首個開源開放的產業級深度學習平臺,包括核心框架、產業級模型庫、開發套件、工具組件,以及學習和實訓社區,能夠標準化、自動化地支撐模型生產和應用。在模型層,文心大模型包括NLP、CV、跨模態等基礎大模型,對話、跨語言、搜索、信息抽取等任務大模型,生物計算領域大模型,行業大模型,以及支撐大模型應用的工具平臺,形成了基礎-任務-行業三級大模型技術體系,具備知識增強和產業級兩大特色。
王海峰認為,文心一言是百度多年技術積累和產業實踐的水到渠成,尤其是飛槳深度學習平臺和文心大模型的聯合優化,為文心一言提供了堅實的技術支撐。飛槳有效支撐了大模型的靈活開發、高效訓練和推理部署。文心大模型從2019年發布以來,已經從最初的自然語言理解大模型,發展成了跨語言、跨模態、跨任務、跨行業的大模型平臺。
核心技術加持,新一代知識增強大語言模型水到渠成
文心一言是新一代知識增強大語言模型,也是百度繼文心一格之后的又一個生成式AI產品,具備對話交互、內容創作、知識推理、多模態生成等能力。
王海峰表示,新一代知識增強大語言模型文心一言,是在ERNIE及PLATO系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術,ERNIE和PLATO中已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。
在知識增強方面,文心一言的知識增強主要是通過知識內化和知識外用兩種方式。知識內化,是從大規模知識和無標注數據中,基于語義單元學習,利用知識構造訓練數據,將知識學習到模型參數中;知識外用,是引入外部多源異構知識,做知識推理、提示構建等等。
在檢索增強方面,文心一言的檢索增強,來自以語義理解與語義匹配為核心技術的新一代搜索架構。通過引入搜索結果,可以為大模型提供時效性強、準確率高的參考信息,更好地滿足用戶需求。
在對話增強方面,基于對話技術和應用積累,文心一言具備記憶機制、上下文理解和對話規劃能力,實現更好的對話連貫性、合理性和邏輯性。
百度構建了面向中文、服務應用、富含知識的多樣化訓練數據,對文心一言進行有監督精調,使其掌握的知識更精準,更懂中文和應用場景,并建立起人類反饋、獎勵模型和策略優化之間的飛輪機制,隨著真實用戶的反饋越來越多,文心一言的效果會越來越好,能力越來越強。文心一言融合不同類型數據和知識,自動構造提示,包括實例、提綱、規范、知識點和思維鏈等,提供了豐富的參考信息,激發模型相關知識,生成高質量結果。
王海峰強調,飛槳深度學習平臺支撐文心一言效果更好、效率更高、性能更強。對于開發訓練,飛槳動靜統一的開發范式,以及自適應分布式架構,可以實現大模型的靈活開發和高效訓練。在推理部署方面,飛槳支持大模型高效推理,并提供服務化部署能力,包括計算融合、軟硬協同的稀疏量化、模型壓縮等等。如今,飛槳平臺已凝聚535萬開發者,服務20萬企事業單位,基于飛槳創建了67萬個模型。
文心大模型加上飛槳深度學習平臺,夯實了產業智能化基座。隨著文心一言與飛槳平臺的進一步融合發展,人工智能技術和應用的研發將越來越標準化、自動化和模塊化,加速人工智能的工業大生產,同時也反哺文心一言加速迭代進化,落地更多場景和行業,為千行百業智能化升級帶來不竭動力。
7月29日,第三屆海岸帶大會在山東煙臺召開。中國科學院地理科學與資源研究所研究員、“坤元”大模型首席科學家蘇奮振發布了兩款自主研發的大模型——“坤元·感東南”與“坤元·擬千海”。兩款大模型分別針對陸和......
近日,一項公布于預印本服務器arXiv的研究發現,使用ChatGPT寫論文的人,其大腦活躍度低于被禁止使用任何在線工具寫論文的人。這項調查是評估人工智能(AI)是否正使人們變得“認知懶惰”的更廣泛研究......
近日,由哈爾濱工程大學研發的國內首個船海學科教育專有大模型——“興海”大模型,在國家高教智慧教育平臺正式上線。“興海”教育專有大模型以DeepSeek、文心一言、Kimi三大模型作為支撐。大模型由哈工......
5月18日,由國家腎臟病臨床醫學研究中心(南方醫科大學南方醫院)牽頭研發的“慢性腎臟病綜合管理大模型——智腎”在南方醫科大學南方醫院正式發布。同時宣布將贈送“智腎”大模型給貴州省人民醫院、新疆醫科大學......
近日,中醫藥交叉學科和智能科學大會在中國中醫科學院舉辦,大會主題為“AI創新中醫發展、數智均衡醫療資源”。國家中醫藥管理局副局長、中國中醫科學院院長、中國工程院院士黃璐琦表示,中醫藥傳承數千年,積累了......
今年的政府工作報告提出,支持大模型廣泛應用,并將其作為激發數字經濟創新活力的核心舉措之一。此舉體現了我國對人工智能技術和數字經濟發展的前瞻性布局,大模型成為帶動千行百業生產力提升的新工具,更有望成為推......
2月16日,北京協和醫院與中國科學院自動化研究所共同研發的“協和·太初”罕見病大模型正式進入臨床應用階段。據悉,該模型基于我國罕見病知識庫的多年積累和中國人群基因檢測數據支撐,是國際首個符合中國人群特......
近日,廣東醫科大學健康醫療大數據工程中心攜手華為技術團隊共同打造的“DeepSeek-GDMU”大模型正式落地。記者獲悉,“DeepSeek-GDMU”大模型是國內首個基于昇騰人工智能(AI)生態的醫......
“當前,人工智能技術以驚人的速度發展,如近期DeepSeek引領了低成本開發使用大模型的革新,這既為驅動新的創新提供了更多可能,也帶來了諸多風險挑戰,而在互聯互通時代,加強國際合作至關重要。”2月11......
1月20日,國產AI大模型DeepSeek正式發布新版本DeepSeek-R1,并同步開源模型權重。開發者表示,DeepSeek-R1在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,......