AI能力的重要落點是物理世界。今年年初,海外科技圈對中國算力問題給予了極大關注。馬斯克在一月份的播客中提到,中國在AI算力上將遠超世界其他地區。二月份,OpenAI首席執行官奧特曼也表示,中國在人工智能領域的技術進步快得驚人。

2025年可以說是供給端的集結之年。摩爾線程、沐曦股份等國產GPU接連登陸資本市場,進一步加深了國產大模型的產業基礎。2026年,變化向產業鏈下游傳導,四月下旬,多款國產大模型發布了新版本。4月20日,月之暗面推出了擅長長程代碼編寫的Kimi K2.6模型。4月24日,DeepSeek V4發布,隨后美團LongCat-2.0-Preview開放測試,兩者總參數規模均突破萬億,并且都支持1M超長上下文。
值得一提的是,DeepSeek V4完成了從英偉達體系向華為昇騰平臺的遷移與適配;而美團LongCat-2.0則是訓練推理全程基于國產算力的萬億參數大模型,使用了5萬至6萬張國產算力芯片。長期以來,中國AI從業者普遍策略是采用現有成熟方案,現在國內AI企業開始嘗試鋪設自己的軌道。
在荒野修路,科幻作家阿瑟·克拉克的答案是讓不可能本身成為前進的起點。CUDA生態經過十幾年打磨已成為一個功能強大、工具完備的開發平臺。遷移代碼的過程意味著開發團隊需要做大量底層框架的重構工作。最終DeepSeek做到了,V4發布兩天后,摩根大通報告指出,V4成功適配華為昇騰芯片,驗證了國產算力在前沿AI推理上的可行性;通過混合注意力架構等底層技術創新,顯著降低了推理成本。DeepSeek用技術極客的方式降本增效,通過重寫半個大模型的工作量完成硬核遷移。同日開放測試的美團LongCat-2.0-Preview,則直接跑在國產算力之上。




