【杜蘭說AI】AI平權 or 給對手送武器? 3分鐘帶你完全理解 DeepSeek五天開源周

2025年03月17日 10:15

DeepSeek真的就這麽放心讓對手抄作業?
全部開源
是不是也在給對手送武器?
自此DeepSeek出來之後,
這樣的問題就一直不少,
尤其是剛剛結束的DeepSeek開源周,
我真的是看著全球的開發者從一開始
眼巴巴等著今天又會開源什麽王炸技術,
到最後忍不住表示:
要不然DeepSeek你還是給自己留個後手吧?

首先我覺得很重要的一點,
雖然這次DeepSeek 是完全面向開發者進行開源的,
但我還是覺得每個人都應該或多或少地了解一點,
現在最前沿的AI,
到底走到了一個什麽階段。

簡單給大家用大白話解釋一下哈,
DeepSeek的開源一共持續了五天,
第一天的高性能計算庫FlashMLA,
大家可以理解成一個GPU的性能榨幹器。
它能讓一塊國內閹割版的H800,
幹出2.4塊旗艦機顯卡A100的活兒。

第二天,開源通信庫DeepEP,
相當於給以前合作只能靠吼的專家模型們拉了個群,
大幅度降低了溝通成本,
讓模型訓練的時間必傳統方案縮短了40%。

第三天的DeepGEMM
本質上是一個AI計算的加速器,
但傳統加速方法可能要上萬行代碼才能實現,
它只用了300行代碼,
對於中小型團隊來說,
又是一次遊戲規則的改寫。

第四天,
DeepSeek直接把自家的底子拿出來了,
公開了V3和R1模型的工業級部署方案,
解決了AI並行計算中有人忙得要死,
有人又在摸魚的情況,
通過計算-通信的重疊,
讓AI模型學會了邊算邊聊,
最終提升了30%的硬件利用率。

第五天,
壓軸的是DeepSeek全系列模型的核心裝備,
3FS文件系統和Smallpond數據框架,
它們主要負責存儲與數據處理,
喝一杯咖啡,
5分鐘左右的時間,
就能處理完人類文明史上所有的書籍。

了解了DeepSeek這五天到底都開源了什麽,
我再來回答開頭的那個問題,
DeepSeek這狂踩牙膏的開源,
到底是不是在給對手送武器?

我覺得這件事,
大家要站在一個更高的維度去看。
在現在的經濟態勢下,
是像Meta、xAI這些不差錢的大廠多,
還是缺錢的中小型團隊多?
肯定是後者,
除了這些中小型團隊,
還有很多根本就沒錢的個人開發者,
所以這五天的開源,
影響的是全世界的科研團隊。
開源,
不僅僅是這次的DeepSeek,
還有開源這個概念誕生之初,
為的就是通過共享來集中大家的智慧,
也就是我們常說的那句老話:
“人多力量大”

相關新聞