【杜兰说AI】AI平权 or 给对手送武器? 3分钟带你完全理解 DeepSeek五天开源周

2025年03月17日 10:15

DeepSeek真的就这麽放心让对手抄作业?
全部开源
是不是也在给对手送武器?
自此DeepSeek出来之後,
这样的问题就一直不少,
尤其是刚刚结束的DeepSeek开源周,
我真的是看着全球的开发者从一开始
眼巴巴等着今天又会开源什麽王炸技术,
到最後忍不住表示:
要不然DeepSeek你还是给自己留个後手吧?

首先我觉得很重要的一点,
虽然这次DeepSeek 是完全面向开发者进行开源的,
但我还是觉得每个人都应该或多或少地了解一点,
现在最前沿的AI,
到底走到了一个什麽阶段。

简单给大家用大白话解释一下哈,
DeepSeek的开源一共持续了五天,
第一天的高性能计算库FlashMLA,
大家可以理解成一个GPU的性能榨干器。
它能让一块国内阉割版的H800,
干出2.4块旗舰机显卡A100的活儿。

第二天,开源通信库DeepEP,
相当於给以前合作只能靠吼的专家模型们拉了个群,
大幅度降低了沟通成本,
让模型训练的时间必传统方案缩短了40%。

第三天的DeepGEMM
本质上是一个AI计算的加速器,
但传统加速方法可能要上万行代码才能实现,
它只用了300行代码,
对於中小型团队来说,
又是一次游戏规则的改写。

第四天,
DeepSeek直接把自家的底子拿出来了,
公开了V3和R1模型的工业级部署方案,
解决了AI并行计算中有人忙得要死,
有人又在摸鱼的情况,
通过计算-通信的重叠,
让AI模型学会了边算边聊,
最终提升了30%的硬件利用率。

第五天,
压轴的是DeepSeek全系列模型的核心装备,
3FS文件系统和Smallpond数据框架,
它们主要负责存储与数据处理,
喝一杯咖啡,
5分钟左右的时间,
就能处理完人类文明史上所有的书籍。

了解了DeepSeek这五天到底都开源了什麽,
我再来回答开头的那个问题,
DeepSeek这狂踩牙膏的开源,
到底是不是在给对手送武器?

我觉得这件事,
大家要站在一个更高的维度去看。
在现在的经济态势下,
是像Meta、xAI这些不差钱的大厂多,
还是缺钱的中小型团队多?
肯定是後者,
除了这些中小型团队,
还有很多根本就没钱的个人开发者,
所以这五天的开源,
影响的是全世界的科研团队。
开源,
不仅仅是这次的DeepSeek,
还有开源这个概念诞生之初,
为的就是通过共享来集中大家的智慧,
也就是我们常说的那句老话:
“人多力量大”

相关新闻