本報訊 (記者袁傳璽)1月20日,國內兩家備受關注的人工智能大模型創(chuàng)業(yè)公司北京月之暗面科技有限公司(以下簡稱“月之暗面”)(Kimi)和杭州深度求索人工智能基礎技術研究有限公司(以下簡稱“深度求索”)(DeepSeek)均發(fā)布了最新模型。
在月之暗面發(fā)布的k1.5多模態(tài)思考模型中,多模態(tài)思考模型實現(xiàn)了SOTA級別多模態(tài)推理和通用推理能力。在short-CoT模式下,Kimik1.5的數(shù)學、代碼、視覺多模態(tài)和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的數(shù)學、代碼、多模態(tài)推理能力達到了OpenAI o1正式版的水平。月之暗面表示,這應該是全球范圍內,首次有OpenAI之外的公司實現(xiàn)o1正式版的多模態(tài)推理性能。
深度求索發(fā)布的DeepSeek-R1在后訓練階段大規(guī)模使用強化學習技術,在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學、代碼和自然語言推理等任務上,R1的性能也可以比肩o1正式版。同時根據(jù)DeepSeek公布的測試數(shù)據(jù),R1在美國AIME 2024、MATH-500和SWE-bench Verified測試中的比分均高于OpenAI o1。
與OpenAI不同,這兩家公司都公開了原理及技術報告:Kimik1.5發(fā)布原創(chuàng)技術long2short,高效思維鏈+原生多模,DeepSeek-R1則繼續(xù)主打高性價比。
中央民族大學教授郭全中表示:“中國AI公司之前基本都在摸著OpenAI的石頭過河,但從K1.5等國產(chǎn)大模型開始,以硅谷為中心的格局已悄然發(fā)生變動。國產(chǎn)大模型的突破不僅在于技術指標的提升,也展示了中國AI技術正在走向自主創(chuàng)新的新階段。期待看到更多中國企業(yè)在全球AI舞臺上展現(xiàn)實力,推動人工智能技術向著更高水平邁進。”
(編輯 張鈺鵬)
多地召開“新春第一會” 高質量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結束,全國多地在蛇年首個工作……[詳情]
16:21 | 聚焦全球市場 共探航運指數(shù)期貨新... |
16:19 | 莫高股份2024年實現(xiàn)營業(yè)收入3.28億... |
16:14 | 東方嘉盛2025年第一季度營收同比增... |
16:12 | 2024年營收不足3億元 蘭州黃河被實... |
16:10 | 甘肅能化2024年實現(xiàn)凈利潤12.14億... |
16:10 | 坤恒順維2024年超三成營收用于研發(fā)... |
15:49 | 央行最新部署,事關金融“五篇大文... |
15:16 | 西山科技2024年實現(xiàn)營收3.36億元 ... |
15:14 | 醬油業(yè)務穩(wěn)固 ST加加一季度凈利同... |
15:11 | 聯(lián)影醫(yī)療披露2024年ESG報告 強化供... |
15:11 | 今創(chuàng)集團一季度凈利潤同比增長244.... |
15:11 | 供銷大集2024年營收14.24億元 凈利... |
版權所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務許可證 10120180014增值電信業(yè)務經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:[email protected]
安卓
IOS
掃一掃,加關注
掃一掃,加關注