【杜兰说AI】浅读DeepSeek新论文(下)那些卷起袖子写代码的CEO 才是真正的创新密码
2025年03月04日 10:16
什麽是技术派的明星创始人?
比起大众认知里的老板,
他们也许并不长袖善舞,
甚至有点不善言辞,
但却是团队技术方向的第一指路人。
DeepSeek的CEO梁文锋就是这样一个角色。
这位85後出身浙江大学的信息与电子工程学系,
是一个典型的好奇心驱动的技术宅,
在两年前接受采访时,
他就提到,
驱动他们整个团队去做探索的,
就是想去验证一些猜想:
比如他觉得人的思考过程在本质上
就是在脑子里编织语言的一个过程,
这就意味着,
在语言大模型上真的有可能诞生类人的人工智能。
梁文锋那时设想中的商业模型,
就是把团队大部分的训练结果都公开共享,
让每一个小APP都能低成本用上大模型。
当然我们现在都知道了,
他已经实现了自己的这个目标。
而在说起创新时,
他直言,创新是一件“昂贵且低效”的东西,
有时候甚至伴随着浪费,
但这个世界就是存在很多无法用逻辑解释的事,
就像很多程序员每天那麽累,
还会选择在空余时间向开源社区贡献代码,
这种感觉就像是徒步50公里,
身体瘫了,
但精神很满足。
其实像这样近乎疯狂地执着於创新,
一直扑在技术第一线的还有很多人。
比如同样是国产黑马大模型的月之暗面,
他们也在同一天发表了一篇论文,
提出的技术路线与DeepSeek相似,
而在论文作者页,
公司的CEO,杨植麟的名字也是赫然其上;
最近搅得整个白宫腥风血雨,
似乎已经完全转变成了政治家角色的马斯克,
曾经也是在SpaceX的星舰发射现场手调火箭发动机代码,
亲自改写特斯拉自动驾驶算法接口的猛人;
被圈内调侃为“营销圣手”的Altman,
也在OpenAI初期亲自参与GPT-3的上下文长度参数调优;
而英伟达的老板黄仁勋至近仍然在深度参与CUDA架构设计。
可以说,
矽谷的创新密码,
在某种程度上就藏在这些卷起袖子写代码的CEO身上,
它代表着一种技术上的真正平权:
这里没有什麽“管理者”或者“执行者”,
只有对创新的不断追求。
而现在,
中国的企业正以更开放的开源生态、
更年轻的人才梯队、
更猛烈的创新节奏慢慢赶了上来。
中国创新的下一个惊喜,
或许会像大模型涌现出智能般,
在某个清晨再一次惊艳世界。
比起大众认知里的老板,
他们也许并不长袖善舞,
甚至有点不善言辞,
但却是团队技术方向的第一指路人。
DeepSeek的CEO梁文锋就是这样一个角色。
这位85後出身浙江大学的信息与电子工程学系,
是一个典型的好奇心驱动的技术宅,
在两年前接受采访时,
他就提到,
驱动他们整个团队去做探索的,
就是想去验证一些猜想:
比如他觉得人的思考过程在本质上
就是在脑子里编织语言的一个过程,
这就意味着,
在语言大模型上真的有可能诞生类人的人工智能。
梁文锋那时设想中的商业模型,
就是把团队大部分的训练结果都公开共享,
让每一个小APP都能低成本用上大模型。
当然我们现在都知道了,
他已经实现了自己的这个目标。
而在说起创新时,
他直言,创新是一件“昂贵且低效”的东西,
有时候甚至伴随着浪费,
但这个世界就是存在很多无法用逻辑解释的事,
就像很多程序员每天那麽累,
还会选择在空余时间向开源社区贡献代码,
这种感觉就像是徒步50公里,
身体瘫了,
但精神很满足。
其实像这样近乎疯狂地执着於创新,
一直扑在技术第一线的还有很多人。
比如同样是国产黑马大模型的月之暗面,
他们也在同一天发表了一篇论文,
提出的技术路线与DeepSeek相似,
而在论文作者页,
公司的CEO,杨植麟的名字也是赫然其上;
最近搅得整个白宫腥风血雨,
似乎已经完全转变成了政治家角色的马斯克,
曾经也是在SpaceX的星舰发射现场手调火箭发动机代码,
亲自改写特斯拉自动驾驶算法接口的猛人;
被圈内调侃为“营销圣手”的Altman,
也在OpenAI初期亲自参与GPT-3的上下文长度参数调优;
而英伟达的老板黄仁勋至近仍然在深度参与CUDA架构设计。
可以说,
矽谷的创新密码,
在某种程度上就藏在这些卷起袖子写代码的CEO身上,
它代表着一种技术上的真正平权:
这里没有什麽“管理者”或者“执行者”,
只有对创新的不断追求。
而现在,
中国的企业正以更开放的开源生态、
更年轻的人才梯队、
更猛烈的创新节奏慢慢赶了上来。
中国创新的下一个惊喜,
或许会像大模型涌现出智能般,
在某个清晨再一次惊艳世界。