【杜兰说AI】中国开源模型 AI平权的希望-杜兰说AI-现代电视_FinTV

【杜兰说AI】中国开源模型 AI平权的希望

2025年02月21日 10:15

太快了，
又一个国产开源大模型杀出来了，
在各大主流榜单全面超越DeepSeek V3和o1-mini，
着名的AI教母李飞飞，
甚至基於这一基础模型，
50美元成本就做了一个DeepSeek。
它就是国产开源模型的老大哥，
阿里通义千问。
在今年春节前夕，
最新版本Qwen 2.5-Max发布，
又给全球AI圈狠狠加了一把火。

首先给大家辟个谣，
我开头说的李飞飞团队的研究，
号称26分钟，50美元就训练出了媲美DeepSeek R1的模型，
这个看着低得吓人的成本，
应该只是外界预估的云计算费用。
我去翻了下论文，
里面开篇就表明，
他们是在通义千问模型的基础上监督微调得来的，
并不是从零造模型。
所以说，
我们更应该关注的
是这项研究中的那个开源的基础模型。

其实在DeepSeek异军突起之前，
全球的AI开源社区，
一直是以Meta的Llama系列，以及阿里的通义千问（Qwen）系列为首的，
尤其是阿里的通义千问，
可以说是整个开源社区中衍生模型最多的标杆基础模型，
而最新的Qwen 2.5-Max，
更是在外网引发了不低的讨论度，
热度要远高於国内，
在任意一条相关新闻下，
都能看到很多外国工程师在为中国的开源模型辩护。

为什麽？
很简单，
未来的世界是AI的世界，
在这样一个时代中，
“AI民主”就是人类最基本的人权，
为什麽AI的开源闭源一直争论不休？
因为闭源的AI产品本质上，
就是一种AI垄断，
每月200美元的o1，上千美元的o3，
都不是普通人能用得起的，
这个时候，
开源的通义千问和DeepSeek，
就为普通人带来了可能。
我一直在说，
科技是来源於真实世界，
并且要为真实世界去服务的，
人工智能的不平凡，
其实是为了我们每一个平凡的人，
新的一年，
让我们一起为中国AI加油。