【杜兰说AI】AI教父深度访谈(下) 现实真的是存在的吗?
2025年03月28日 18:30
这期视频我不知道多少人能看懂啊,
AI教父、图灵奖得主Yan LeCun的最新访谈,
我反覆看了很多遍,
还是决定做一个视频,
来和大家分享一下,
这位AI领域的传奇人物对人工智能,
乃至於对世界本质的这种深层次的思考。
LeCun这个人在我的视频和直播里出现过很多次,
很多人都问,
为什麽总要研究他的观点,
真的就那麽有价值吗?
我可以很肯定地告诉大家,是的。
和马斯克、黄仁勋、奥特曼这些商业大佬相比,
他可能没有那麽高的大众认知,
但毫不夸张的说,
LeCun就是那个最早让AI“睁眼看世界”的人,
你每天都接触的刷脸支付、短视频推荐算法、手机智能助手,
全都离不开他的研究。
首先,
我想请大家想象,
自己的正前方悬浮着一个立方体,
它会绕着垂直轴旋转90°、180°、270°、360°,
那现在,
它看起来还和之前一样吗?
答案是肯定的。
不管是对於人类还是AI,
这个问题都非常简单。
但这其中暗含着一个AI与人类在本质上的不同,
那就是思维方式。
我们会觉得,
一个立方体旋转90°,再加90°,再加90°,
它的视角仍然是相同的,
所以我们看到的当然是一样的。
但AI会生成大量的输出结果,
然後观察、对比,最後从中挑出最好的。
LeCun认为,
人类本质上是在思维空间中进行推理,
而AI本质上是在输出空间中进行挑选。
这两种思考方式有高低之分吗?
也许是有的,
毕竟现在的人工智能,
还是以“达到人类的智慧”为终极目标,
在孜孜不倦地努力。
现在看起来也是成果斐然,
AI学会了创意,
学会了深度推理,
还在写诗作画的路上一路狂奔。
这又不得不提到一个人人都在问,
但至今都好像没有一个权威解答的问题:
我们都希望AI帮我们洗锅刷碗,
好让我们有时间去写诗作画,
可是现在为什麽反过来了?
眼前AI的发展方向是不是错了?
我想结合LeCun这次的访谈
再加上我个人的一点理解,
来尝试完整地回答一下这个问题。
其实啊,
早在50年前,
学界就有一个专门的词语来描述这个问题,
那就是着名的“莫拉维克悖论”(Moravec's paradox),
以自己的名字命名了这一现象的学者莫拉维克说:
要让电脑如成人般下棋是相对容易的,
但是要让电脑有如1岁小孩般的感知和行动能力,
却是相当困难甚至是不可能的。
为什麽?
这其实就是
AI与人类思维方式不同的一个
最直观的体现。
这里我讲得慢一点啊,
在现在这个地球上,
只有人类才能使用语言,
人类通过语言划定了种族、国别,建立了文明,
所以长期以来我们的认知是,
语言是智慧的体现。
但在人工智能领域就恰恰相反,
语言是最简单的,
因为对於计算机来说,
语言本质上就是一系列离散的符号,
“离散”是一个专业概念啊,
我们就从字面意思来理解,
它是“分离”的,“散落”的,
是我们可以用手指一个一个数出来的。
而语言是由有限的单词、字符或者笔画组成的,
每个单词或者笔画都是一个明确的符号。
计算机的核心是芯片,
计算机最底层的语言是1和0,
所以计算机天然就更擅长处理离散符号。
而人类就刚好反了过来,
现在任何先进的计算机都做不到像人类一样
通过丰富的视觉和触觉来感知这个世界。
人类的这个天赋对AI有多降维打击呢?
我举个例子,
一个典型的大语言模型的信息量大约是1014,
1後面跟着14个零,
这也是现在互联网上所有公开可用文本的总量,
我们任何人读完这些材料,
都得花几十万年的时间。
但哪怕是一个刚满4岁的婴儿,
他的视觉系统也能以2MB/s的速度获取信息,
而在生命的头四年里,
他醒着的总时长大概是16000个小时,
计算一下,
也相当於获得了1014字节信息量。
也就是说,
一个婴儿在头四年里所接触到的信息,
和最大的大语言模型所处理的数据量大致相当。
所以为什麽现在的AI就是学不会做家务?
让AI做家务比造火箭还难?
那是因为AI从诞生之初,
就和人类点了两个方向完全不同的科技树。
人类是六边形战士,
啥都会,啥都不突出。
而AI听力极其发达,也相当会说,
但近视,看不清东西,
四肢也不是很灵便。
LeCun一直在搞的世界模型,
其实就是给AI配眼镜,
至於现在的机器人领域,
就一直在致力於给AI造轮椅。
最後再给大家讲一些比较玄学的东西啊。
很多人都听过“熵”这个词,
它本来是信息学里,
用於量化信息的一个概念,
现在已经被推广到了AI、物理、天文学,
甚至是政治领域。
前段时间马斯克就说,
他的政府效率部其实是在对抗“熵增”。
那LeCun这次就提出了一个观点,
他认为,
一条消息中的信息量并非是一个绝对的量,
而是取决於解读这条信息的人。
不同的人,以不同的视角提取出的信息量,
可能是完全不同的。
也就是说,
我们不可能用一种绝对的方式来衡量信息。
有意思的来了,
如果一条消息的“信息量”取决於解读者,
那麽我们可以认为
“现实”在某种程度上
也是由观察者共同构造的。
正如量子物理中的观测效应所暗示的那样,
现实可能并不是一个独立、客观的存在,
而是不断在我们与世界的互动中生成的。
这就像盲人摸象,
有人摸到腿说是柱子,
有人摸到耳朵说是扇子。
同样一份信息,
在不同人眼里会变成完全不同的"真相"。
同一个新闻事件,
不同立场的人会解读出截然相反的结论。
LeCun的这个观点其实在给我们敲黑板:
想要不被信息洪流淹没,
关键不是收集更多信息,
而是培养多维度解构信息的能力。
就像对抗房间里的熵增,不是要拼命打扫,
而是要学会开窗通风。
这种观察者视角的差异,
可能正在塑造我们共同的现实世界。
量子物理学家发现,
连基本粒子的状态都会因为观测而改变,
就像我们刷短视频时,
算法会根据你的每次点赞重构你的"信息宇宙"。
或许整个世界的真相,
就是无数观察者视角叠加而成的全息投影。
所以我们遇到信息爆炸时,不妨记住:
重要的不是世界原本的样子,
而是我们选择用怎样的解码器去理解它。
保持思维系统的开放性,
就像给自己安装了一个抗熵增的"认知空调",
既不被单一视角困住,
又能从混沌中提炼出独特的价值。
这个世界或许就像个不断膨胀的信息宇宙,
我们每个人都是手持不同棱镜的观测者。
重要的不是争论哪块碎片最真实,
而是意识到——
正是无数不同的折射光芒,
才让整个星空显得如此璀璨。
AI教父、图灵奖得主Yan LeCun的最新访谈,
我反覆看了很多遍,
还是决定做一个视频,
来和大家分享一下,
这位AI领域的传奇人物对人工智能,
乃至於对世界本质的这种深层次的思考。
LeCun这个人在我的视频和直播里出现过很多次,
很多人都问,
为什麽总要研究他的观点,
真的就那麽有价值吗?
我可以很肯定地告诉大家,是的。
和马斯克、黄仁勋、奥特曼这些商业大佬相比,
他可能没有那麽高的大众认知,
但毫不夸张的说,
LeCun就是那个最早让AI“睁眼看世界”的人,
你每天都接触的刷脸支付、短视频推荐算法、手机智能助手,
全都离不开他的研究。
首先,
我想请大家想象,
自己的正前方悬浮着一个立方体,
它会绕着垂直轴旋转90°、180°、270°、360°,
那现在,
它看起来还和之前一样吗?
答案是肯定的。
不管是对於人类还是AI,
这个问题都非常简单。
但这其中暗含着一个AI与人类在本质上的不同,
那就是思维方式。
我们会觉得,
一个立方体旋转90°,再加90°,再加90°,
它的视角仍然是相同的,
所以我们看到的当然是一样的。
但AI会生成大量的输出结果,
然後观察、对比,最後从中挑出最好的。
LeCun认为,
人类本质上是在思维空间中进行推理,
而AI本质上是在输出空间中进行挑选。
这两种思考方式有高低之分吗?
也许是有的,
毕竟现在的人工智能,
还是以“达到人类的智慧”为终极目标,
在孜孜不倦地努力。
现在看起来也是成果斐然,
AI学会了创意,
学会了深度推理,
还在写诗作画的路上一路狂奔。
这又不得不提到一个人人都在问,
但至今都好像没有一个权威解答的问题:
我们都希望AI帮我们洗锅刷碗,
好让我们有时间去写诗作画,
可是现在为什麽反过来了?
眼前AI的发展方向是不是错了?
我想结合LeCun这次的访谈
再加上我个人的一点理解,
来尝试完整地回答一下这个问题。
其实啊,
早在50年前,
学界就有一个专门的词语来描述这个问题,
那就是着名的“莫拉维克悖论”(Moravec's paradox),
以自己的名字命名了这一现象的学者莫拉维克说:
要让电脑如成人般下棋是相对容易的,
但是要让电脑有如1岁小孩般的感知和行动能力,
却是相当困难甚至是不可能的。
为什麽?
这其实就是
AI与人类思维方式不同的一个
最直观的体现。
这里我讲得慢一点啊,
在现在这个地球上,
只有人类才能使用语言,
人类通过语言划定了种族、国别,建立了文明,
所以长期以来我们的认知是,
语言是智慧的体现。
但在人工智能领域就恰恰相反,
语言是最简单的,
因为对於计算机来说,
语言本质上就是一系列离散的符号,
“离散”是一个专业概念啊,
我们就从字面意思来理解,
它是“分离”的,“散落”的,
是我们可以用手指一个一个数出来的。
而语言是由有限的单词、字符或者笔画组成的,
每个单词或者笔画都是一个明确的符号。
计算机的核心是芯片,
计算机最底层的语言是1和0,
所以计算机天然就更擅长处理离散符号。
而人类就刚好反了过来,
现在任何先进的计算机都做不到像人类一样
通过丰富的视觉和触觉来感知这个世界。
人类的这个天赋对AI有多降维打击呢?
我举个例子,
一个典型的大语言模型的信息量大约是1014,
1後面跟着14个零,
这也是现在互联网上所有公开可用文本的总量,
我们任何人读完这些材料,
都得花几十万年的时间。
但哪怕是一个刚满4岁的婴儿,
他的视觉系统也能以2MB/s的速度获取信息,
而在生命的头四年里,
他醒着的总时长大概是16000个小时,
计算一下,
也相当於获得了1014字节信息量。
也就是说,
一个婴儿在头四年里所接触到的信息,
和最大的大语言模型所处理的数据量大致相当。
所以为什麽现在的AI就是学不会做家务?
让AI做家务比造火箭还难?
那是因为AI从诞生之初,
就和人类点了两个方向完全不同的科技树。
人类是六边形战士,
啥都会,啥都不突出。
而AI听力极其发达,也相当会说,
但近视,看不清东西,
四肢也不是很灵便。
LeCun一直在搞的世界模型,
其实就是给AI配眼镜,
至於现在的机器人领域,
就一直在致力於给AI造轮椅。
最後再给大家讲一些比较玄学的东西啊。
很多人都听过“熵”这个词,
它本来是信息学里,
用於量化信息的一个概念,
现在已经被推广到了AI、物理、天文学,
甚至是政治领域。
前段时间马斯克就说,
他的政府效率部其实是在对抗“熵增”。
那LeCun这次就提出了一个观点,
他认为,
一条消息中的信息量并非是一个绝对的量,
而是取决於解读这条信息的人。
不同的人,以不同的视角提取出的信息量,
可能是完全不同的。
也就是说,
我们不可能用一种绝对的方式来衡量信息。
有意思的来了,
如果一条消息的“信息量”取决於解读者,
那麽我们可以认为
“现实”在某种程度上
也是由观察者共同构造的。
正如量子物理中的观测效应所暗示的那样,
现实可能并不是一个独立、客观的存在,
而是不断在我们与世界的互动中生成的。
这就像盲人摸象,
有人摸到腿说是柱子,
有人摸到耳朵说是扇子。
同样一份信息,
在不同人眼里会变成完全不同的"真相"。
同一个新闻事件,
不同立场的人会解读出截然相反的结论。
LeCun的这个观点其实在给我们敲黑板:
想要不被信息洪流淹没,
关键不是收集更多信息,
而是培养多维度解构信息的能力。
就像对抗房间里的熵增,不是要拼命打扫,
而是要学会开窗通风。
这种观察者视角的差异,
可能正在塑造我们共同的现实世界。
量子物理学家发现,
连基本粒子的状态都会因为观测而改变,
就像我们刷短视频时,
算法会根据你的每次点赞重构你的"信息宇宙"。
或许整个世界的真相,
就是无数观察者视角叠加而成的全息投影。
所以我们遇到信息爆炸时,不妨记住:
重要的不是世界原本的样子,
而是我们选择用怎样的解码器去理解它。
保持思维系统的开放性,
就像给自己安装了一个抗熵增的"认知空调",
既不被单一视角困住,
又能从混沌中提炼出独特的价值。
这个世界或许就像个不断膨胀的信息宇宙,
我们每个人都是手持不同棱镜的观测者。
重要的不是争论哪块碎片最真实,
而是意识到——
正是无数不同的折射光芒,
才让整个星空显得如此璀璨。