賈麗
近日,在多場重要的科技盛會上,大模型均占C位。數十個大模型悉數登場,相關應用在各行業逐步垂直滲透,數字人、智能艙等“百花齊放”。國內多模態等各類大模型技術路線并行突破,產業鏈芯片、算力等關鍵技術市場蓬勃發展,更多企業聯合探路。
隨著在國內熱度持續上漲,大模型“百軻爭流”,呈現蓬勃發展態勢。科技部新一代人工智能發展研究中心發布報告顯示,上半年我國10億參數規模以上的大模型已發布79個。根據上海市人工智能學會數據,截至目前,我國大模型已近百個,可謂真正進入了“百模大戰”。下半年國內還將進入大模型發布的密集期。
熱鬧之下,國內大模型也必須直面靈魂拷問。
首先,能否燒得起?大模型需要龐大的算力支持,同時也帶來巨大的成本壓力。有專家直言,ChatGPT大模型每訓練一次,相當于報廢了3000輛特斯拉汽車。眾多企業陷入一邊瘋狂燒錢短期內難以覆蓋預訓練成本,一邊模型商業化難以落地的困境之中。
其次,可否規模商用?當下大模型仍有局限性,存在效率低、涉嫌侵犯數據隱私和知識產權、高端人才匱乏等問題。業內認為,大模型效率需得到10倍以上的提高,大規模商用才有可能。
再次,如何避免過度?在龐大的模型數量和種類之下,存在一些過度現象。部分企業追求炫技忽視應用可行性,部分追求模型“規模大”而堆疊參數,更有部分企業或機構追求“參數高”過度訓練,導致大模型過擬合和泛化能力不足。
面對挑戰,國內大模型“航船”該如何順利“渡江”?
其一,注重前端技術,勇攀“芯”高峰,深耕算力。企業在關鍵技術道路上勤耕不輟,探索新的預訓練架構、方法,進一步提升大模型的性能和效率,推動國內大模型與國際接軌,讓大模型真正成為企業參與全球AI大模型競爭的重磅“船票”。鼓勵創新創業,讓開發者設施可以站在巨頭肩膀上創造未來。
其二,推動產業鏈聯動,擴大開放開源生態。大模型熱帶來了算力、國產芯“創新架構+開源生態”的新機會。行業通過共建開放生態,鼓勵產業鏈共享和合作,從而減少重復建模。企業也可通過收購、孵化等方式,擴大自身在行業影響力和市場份額。
其三,加強模型評估和驗證。機構及企業應建立評估標準和機制,規范模型開發和應用過程,避免過度夸大模型的能力,防止炒作,注重大模型可解釋性和可理解性,使其在實際應用中更加可信、可靠。
大模型“百軻爭流”后是大浪淘沙,只有真正的“奮楫者”,才可以勇立潮頭揚帆遠航。
01:54 | 17家A股白酒公司交出2024年成績單... |
01:54 | 貴州茅臺一季度凈利潤同比增長11.5... |
01:54 | 上市車企去年業績“冰火兩重天” ... |
01:54 | 隆基綠能去年研發投入約50億元 加... |
01:54 | 旅游上市公司年報掃描 入境游有望... |
01:53 | 從幕后到臺前 供應鏈企業以技術創... |
01:53 | 技術競賽再升級 動力電池進入“多... |
01:53 | 道恩股份重大并購接連落子 化工新... |
01:53 | 零售行業供應鏈 從效率競爭發展到... |
01:53 | 藍科高新一季度訂單量回升 多舉措... |
01:53 | 期貨公司首季合計實現凈利潤近25億... |
01:53 | 券商“選股”清單揭曉:一季度新晉... |
版權所有證券日報網
互聯網新聞信息服務許可證 10120180014增值電信業務經營許可證B2-20181903
京公網安備 11010202007567號京ICP備17054264號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:[email protected]
掃一掃,即可下載
掃一掃,加關注
掃一掃,加關注