热门话题:

【杜兰说AI】中国开源模型 AI平权的希望

2025年02月21日 10:15

太快了,
又一个国产开源大模型杀出来了,
在各大主流榜单全面超越DeepSeek V3和o1-mini,
着名的AI教母李飞飞,
甚至基於这一基础模型,
50美元成本就做了一个DeepSeek。
它就是国产开源模型的老大哥,
阿里通义千问。
在今年春节前夕,
最新版本Qwen 2.5-Max发布,
又给全球AI圈狠狠加了一把火。

首先给大家辟个谣,
我开头说的李飞飞团队的研究,
号称26分钟,50美元就训练出了媲美DeepSeek R1的模型,
这个看着低得吓人的成本,
应该只是外界预估的云计算费用。
我去翻了下论文,
里面开篇就表明,
他们是在通义千问模型的基础上监督微调得来的,
并不是从零造模型。
所以说,
我们更应该关注的
是这项研究中的那个开源的基础模型。

其实在DeepSeek异军突起之前,
全球的AI开源社区,
一直是以Meta的Llama系列,以及阿里的通义千问(Qwen)系列为首的,
尤其是阿里的通义千问,
可以说是整个开源社区中衍生模型最多的标杆基础模型,
而最新的Qwen 2.5-Max,
更是在外网引发了不低的讨论度,
热度要远高於国内,
在任意一条相关新闻下,
都能看到很多外国工程师在为中国的开源模型辩护。

为什麽?
很简单,
未来的世界是AI的世界,
在这样一个时代中,
“AI民主”就是人类最基本的人权,
为什麽AI的开源闭源一直争论不休?
因为闭源的AI产品本质上,
就是一种AI垄断,
每月200美元的o1,上千美元的o3,
都不是普通人能用得起的,
这个时候,
开源的通义千问和DeepSeek,
就为普通人带来了可能。
我一直在说,
科技是来源於真实世界,
并且要为真实世界去服务的,
人工智能的不平凡,
其实是为了我们每一个平凡的人,
新的一年,
让我们一起为中国AI加油。

相关新闻