【杜蘭說AI】淺讀DeepSeek新論文(下)那些卷起袖子寫代碼的CEO 才是真正的創新密碼
2025年03月04日 10:16
什麽是技術派的明星創始人?
比起大眾認知里的老板,
他們也許並不長袖善舞,
甚至有點不善言辭,
但卻是團隊技術方向的第一指路人。
DeepSeek的CEO梁文鋒就是這樣一個角色。
這位85後出身浙江大學的信息與電子工程學系,
是一個典型的好奇心驅動的技術宅,
在兩年前接受采訪時,
他就提到,
驅動他們整個團隊去做探索的,
就是想去驗證一些猜想:
比如他覺得人的思考過程在本質上
就是在腦子里編織語言的一個過程,
這就意味著,
在語言大模型上真的有可能誕生類人的人工智能。
梁文鋒那時設想中的商業模型,
就是把團隊大部分的訓練結果都公開共享,
讓每一個小APP都能低成本用上大模型。
當然我們現在都知道了,
他已經實現了自己的這個目標。
而在說起創新時,
他直言,創新是一件“昂貴且低效”的東西,
有時候甚至伴隨著浪費,
但這個世界就是存在很多無法用邏輯解釋的事,
就像很多程序員每天那麽累,
還會選擇在空余時間向開源社區貢獻代碼,
這種感覺就像是徒步50公里,
身體癱了,
但精神很滿足。
其實像這樣近乎瘋狂地執著於創新,
一直撲在技術第一線的還有很多人。
比如同樣是國產黑馬大模型的月之暗面,
他們也在同一天發表了一篇論文,
提出的技術路線與DeepSeek相似,
而在論文作者頁,
公司的CEO,楊植麟的名字也是赫然其上;
最近攪得整個白宮腥風血雨,
似乎已經完全轉變成了政治家角色的馬斯克,
曾經也是在SpaceX的星艦發射現場手調火箭發動機代碼,
親自改寫特斯拉自動駕駛算法接口的猛人;
被圈內調侃為“營銷聖手”的Altman,
也在OpenAI初期親自參與GPT-3的上下文長度參數調優;
而英偉達的老板黃仁勳至近仍然在深度參與CUDA架構設計。
可以說,
矽谷的創新密碼,
在某種程度上就藏在這些卷起袖子寫代碼的CEO身上,
它代表著一種技術上的真正平權:
這里沒有什麽“管理者”或者“執行者”,
只有對創新的不斷追求。
而現在,
中國的企業正以更開放的開源生態、
更年輕的人才梯隊、
更猛烈的創新節奏慢慢趕了上來。
中國創新的下一個驚喜,
或許會像大模型湧現出智能般,
在某個清晨再一次驚艷世界。
比起大眾認知里的老板,
他們也許並不長袖善舞,
甚至有點不善言辭,
但卻是團隊技術方向的第一指路人。
DeepSeek的CEO梁文鋒就是這樣一個角色。
這位85後出身浙江大學的信息與電子工程學系,
是一個典型的好奇心驅動的技術宅,
在兩年前接受采訪時,
他就提到,
驅動他們整個團隊去做探索的,
就是想去驗證一些猜想:
比如他覺得人的思考過程在本質上
就是在腦子里編織語言的一個過程,
這就意味著,
在語言大模型上真的有可能誕生類人的人工智能。
梁文鋒那時設想中的商業模型,
就是把團隊大部分的訓練結果都公開共享,
讓每一個小APP都能低成本用上大模型。
當然我們現在都知道了,
他已經實現了自己的這個目標。
而在說起創新時,
他直言,創新是一件“昂貴且低效”的東西,
有時候甚至伴隨著浪費,
但這個世界就是存在很多無法用邏輯解釋的事,
就像很多程序員每天那麽累,
還會選擇在空余時間向開源社區貢獻代碼,
這種感覺就像是徒步50公里,
身體癱了,
但精神很滿足。
其實像這樣近乎瘋狂地執著於創新,
一直撲在技術第一線的還有很多人。
比如同樣是國產黑馬大模型的月之暗面,
他們也在同一天發表了一篇論文,
提出的技術路線與DeepSeek相似,
而在論文作者頁,
公司的CEO,楊植麟的名字也是赫然其上;
最近攪得整個白宮腥風血雨,
似乎已經完全轉變成了政治家角色的馬斯克,
曾經也是在SpaceX的星艦發射現場手調火箭發動機代碼,
親自改寫特斯拉自動駕駛算法接口的猛人;
被圈內調侃為“營銷聖手”的Altman,
也在OpenAI初期親自參與GPT-3的上下文長度參數調優;
而英偉達的老板黃仁勳至近仍然在深度參與CUDA架構設計。
可以說,
矽谷的創新密碼,
在某種程度上就藏在這些卷起袖子寫代碼的CEO身上,
它代表著一種技術上的真正平權:
這里沒有什麽“管理者”或者“執行者”,
只有對創新的不斷追求。
而現在,
中國的企業正以更開放的開源生態、
更年輕的人才梯隊、
更猛烈的創新節奏慢慢趕了上來。
中國創新的下一個驚喜,
或許會像大模型湧現出智能般,
在某個清晨再一次驚艷世界。