12月26日晚,網傳幻方量化旗下探索AGI(通用人工智能)的組織“深度求索(DeepSeek)”宣布,人工智能基礎技術研究有限公司發布了全新版本的DeepSeek-V3模型,并同步開源。盡管在“AI六小虎”中相對低調,但憑借其開源特性和顯著的成本優勢,DeepSeek-V3一經推出便迅速贏得了國際專家的高度評價。
著名AI研究者、OpenAI創始成員之一Andrej Karpathy對DeepSeek-V3給予了高度評價。他表示:“今天,一家中國AI公司輕而易舉地發布了一個前沿大語言模型,僅使用2048塊GPU訓練了兩個月,總成本約為600萬美元。相比之下,達到同等水平的其他模型通常需要約1.6萬塊GPU集群的支持,而當前正在部署的集群甚至包含近10萬塊GPU。”他還指出,Llama 3405B模型使用了3080萬GPU/小時的訓練時間,而DeepSeek-V3僅需280萬GPU/小時,計算量減少了約11倍。如果該模型能夠通過各項評估,這將是資源受限條件下研究與工程能力的一次令人印象深刻的展示。
根據深度求索官方公布的信息,DeepSeek-V3在多項評測中超越了Qwen2.5-72B和 Llama-3.1-405B等其他開源模型,并在性能上與世界頂尖的閉源模型GPT-4o及Claude-3.5-Sonnet不相上下。這一成就不僅證明了DeepSeek-V3的技術實力,也展示了其在實際應用中的潛力。
通過算法和工程上的創新,DeepSeek-V3的生成吐字速度從20TPS大幅提升至60TPS,相比V2.5版本實現了三倍的提升。此外,該公司還提供了極具競爭力的定價策略:每百萬輸入tokens的價格為0.5元(緩存命中)/ 2元(緩存未命中),每百萬輸出tokens的價格為8元。這種定價模式使得更多企業和開發者能夠負擔得起先進的AI技術,從而推動大規模應用的發展。
深度求索的成功并非偶然,其背后是團隊對技術的不懈追求和持續的原創性創新。作為一家成立不久的AI創業公司,深度求索憑借其在AI領域的深耕細作,已經逐漸成為業界的佼佼者。未來,隨著AI技術的不斷進步和應用的不斷深化,深度求索將繼續發揮其在技術創新方面的引領作用,推動中國乃至全球的AI產業發展。
DeepSeek-V3的發布標志著國產大模型在全球AI競賽中邁出了堅實的一步。它不僅展示了中國公司在AI領域的強大實力,也為國內外市場提供了高性能、低成本的AI解決方案。我們期待看到更多像深度求索這樣的企業,通過技術創新推動整個行業的進步和發展。
幻方量化 關聯股票信息
$每日互動Sz300766$:幻方二股東,技術負責人是每日互動的聯合創始人,存在合作基礎。
$卓創資訊 sz301299$:幻方作為大型私募,卓創資訊金融語料庫。
$陽光照明sh600261$:購買幻方3億產品,疊加電器出海,外銷占比75%。
$飛利信Sz300287$:飛利信是目前市場采用MLA機制不多的上市公司,Multi-headlatent attention,就是多頭注意力機制,簡稱MLA。
$南威軟件sh603636$:在人工智能方面,基于多頭注意力機制和增強特征金字塔方法,掌握了新型的生物認證技術。