DeepSeek R2模型發表延宕,AI晶片荒加劇中國AI創新壓力
中國人工智能初創公司DeepSeek近期的最新R2模型發表計劃出現變數。據悉,公司原本預定於今年5月推出擁有突破性推理能力的R2模型,但由於行政總裁梁文鋒對R2的效能仍有疑慮,最終決定延遲上市時程。這一決策,連帶牽動整個中國AI產業的發展布局。
R2模型原本被賦予厚望,被視為DeepSeek熱門推理模型R1的升級接班作品。該模型設計的核心任務,是提升自動生成程式碼的能力,同時加強對非英語語言的推理與理解能力。過去數月,DeepSeek的工程團隊持續投入大量資源,針對模型進行優化調整,期盼能達到國際先進水準。然而,R2模型是否足以滿足市場高標期待,最終仍需決策層親自把關。據悉,由於梁文鋒對模型的表現尚未完全滿意,正式上市時間暫未確定。
眼下,除了產品實力本身需再雕琢,外部因素同樣為DeepSeek的發展蒙上陰影。由於美國今年4月起收緊對中國出口人工智能晶片的限制政策,即便R2模型如期問世,DeepSeek在市場推廣與應用部署上也將遭遇重大挑戰。對AI模型運算至關重要的高階硬體——輝達H20晶片,自新政策生效以來正加速在中國市場短缺。原本,這批H20晶片作為僅有的合規渠道,支持DeepSeek R1模型在中國雲端市場大規模部署。如今,隨著出口管制升級,供應商能夠取得晶片的數量急劇銳減,無論是現有用戶還是潛在客戶,對運算資源的需求都將面臨更大壓力。
對中國本地AI雲端服務商來說,這種情勢不可避免地加大系統負荷和排擠效應。市場需求未減,伺服器端卻愈加難以取得所需晶片,相關企業甚至直言,短期內恐難滿足企業客戶對R系列模型的服務需求。據了解,目前DeepSeek的多數企業級客戶主要依賴R1模型,同樣部署於運算能力有限的H20晶片上。晶片來源持續緊縮,意味著新一代R2即使推出,也難以迅速推廣、擴大規模。
總體而言,DeepSeek自身技術的精進與進步固然關鍵,但美國對AI核心硬體的出口限制,如同繫緊的枷鎖,極大影響著中國AI企業的產能與創新步伐。未來,DeepSeek能否突破雙重困境,不僅取決於新技術的研發成效,更需應對國際政經環境的深層變化。
智新聞