李舟軍教授云分享:DeepSeek R1“有限算力+算法創(chuàng)新+工程優(yōu)化”破局產(chǎn)業(yè)變革
2025-02-24 16:13:55

   2025年2月22日,由北京航空航天大學(xué)校友私募股權(quán)投資協(xié)會主辦、北京基金業(yè)協(xié)會BPEA學(xué)苑全程直播的“人工智能系列主題云分享”首場活動圓滿收官。本次活動以“大模型技術(shù)創(chuàng)新與產(chǎn)業(yè)變革”為核心議題,匯聚學(xué)術(shù)界、投資界、法律界等跨領(lǐng)域?qū)<?,吸引?00位北航校友及行業(yè)精英線上參與?;顒油ㄟ^產(chǎn)學(xué)研深度對話,展現(xiàn)了大模型技術(shù)從實驗室到產(chǎn)業(yè)落地的全景圖。

   本次云分享活動由北航02級21系本碩校友趙哲主持,活動的一大亮點便是匯聚了來自不同領(lǐng)域的專家,組成強(qiáng)大的跨領(lǐng)域?qū)<揖仃?,從多個維度對大模型技術(shù)進(jìn)行深度解讀。



李舟軍教授:DeepSeek的“現(xiàn)象級”技術(shù)突破

   作為智能思創(chuàng)首席科學(xué)家、北航計算機(jī)學(xué)院長聘教授、智能信息處理研究所副所長,李舟軍《DeepSeek那些事兒:技術(shù)原理及其應(yīng)用》為題,對近期引發(fā)行業(yè)震動的DeepSeek R1強(qiáng)推理大模型進(jìn)行了深度解析。他指出,與傳統(tǒng)的聊天型大模型不同,DeepSeek R1通過“規(guī)則驅(qū)動+強(qiáng)化學(xué)習(xí)”創(chuàng)新架構(gòu),首次完美復(fù)現(xiàn)了OpenAI o1的深度推理能力,并在任務(wù)分解與過程監(jiān)督中實現(xiàn)了復(fù)雜問題的精準(zhǔn)求解。

四大核心優(yōu)勢,破解算力困局

李舟軍教授提煉出DeepSeek R1脫穎而出的關(guān)鍵密碼:

  1. 技術(shù)創(chuàng)新:動態(tài)MoE架構(gòu)與知識增強(qiáng)預(yù)訓(xùn)練,支撐近萬億參數(shù)的智能涌現(xiàn);
  2. 成本革命:動態(tài)計算路由+混合精度壓縮技術(shù),推理效率提升5倍;
  3. 中文突破:千億級高質(zhì)量語料構(gòu)建文化認(rèn)知底座,詩詞生成準(zhǔn)確率超95%;
  4. 開源生態(tài):開放訓(xùn)練框架與輕量化模型矩陣,形成20+垂直場景應(yīng)用閉環(huán)。
   這種“有限算力+算法創(chuàng)新+工程優(yōu)化”發(fā)展模式,是突破算力卡脖子限制的關(guān)鍵,對我國人工智能等技術(shù)的創(chuàng)新發(fā)展,具有非常重要的啟發(fā)和借鑒意義。



智能思創(chuàng):賦能數(shù)智時代 創(chuàng)造無限可能

   李舟軍教授強(qiáng)調(diào),大模型的產(chǎn)業(yè)應(yīng)用需以文檔智能技術(shù)為基礎(chǔ),以檢索增強(qiáng)生成技術(shù)為核心,并邁向多模態(tài)多智能體技術(shù)的前沿。
智能思創(chuàng)始終致力于推動人工智能技術(shù)與產(chǎn)業(yè)應(yīng)用的深度融合,并在非結(jié)構(gòu)化數(shù)據(jù)處理、垂直領(lǐng)域大模型、智能文檔Agent等方面取得了諸多突破。智能思創(chuàng)經(jīng)過多年的探索,已建構(gòu)了一套文檔智能+大模型+多智能體框架的新范式與支撐平臺,并實現(xiàn)了大模型在多個行業(yè)領(lǐng)域的創(chuàng)新應(yīng)用落地。

產(chǎn)學(xué)研共振:技術(shù)、資本、合規(guī)的協(xié)同未來

   在此次活動中,通過產(chǎn)學(xué)研各界的深度交流,全方位展現(xiàn)了大模型技術(shù)從理論研究到產(chǎn)業(yè)實踐的蛻變歷程。在活動的圓滿落幕之際,協(xié)會秘書長趙清宣布,將繼續(xù)努力構(gòu)建一個集“技術(shù)創(chuàng)新 - 資本賦能 - 合規(guī)護(hù)航”于一體的互動平臺。該平臺的建立,將全方位助力大型模型技術(shù)的成長,推動技術(shù)、資金和法律等領(lǐng)域的深度融合與共同進(jìn)步。

   技術(shù)的浪潮奔涌向前,智能思創(chuàng)愿與行業(yè)同行者共繪AI新藍(lán)圖。作為人工智能領(lǐng)域的創(chuàng)新實踐者,智能思創(chuàng)始終關(guān)注技術(shù)突破與產(chǎn)業(yè)應(yīng)用的深度融合。我們相信,大模型技術(shù)的未來不僅在于算法迭代,更在于如何通過“技術(shù)賦能+場景深耕”,讓AI真正服務(wù)于千行百業(yè)。我們期待通過更多跨界對話與深度實踐,推動大模型技術(shù)從實驗室走向產(chǎn)業(yè),從概念走向價值。