评李飞飞Mirage实验的“视觉幻象”
其实这个问题很简单。这就像人在听评书或脱口秀时,会通过想象自动脑补画面一样。而AI是从海量训练数据中提取高概率的语言-视觉关联模式,然后生成看似合理、绘声绘色的描述和推理链。
因此,AI目前更像一个超级说书人:它能把故事讲得天花乱坠,但它自己其实从未看到任何真正的图像。它只是在高明地模仿观众的脑补(这就是李飞飞团队Mirage实验所揭示的“视觉幻象”)。
AI时代最显著的特点就是强烈的放大效应:它会让愚蠢的人更加愚蠢,也会让聪明的人变得更强。核心区别在于使用心态和信任程度。聪明的人从不把AI当能够提供真理的机器,而是把它当作一个强大但有极大缺陷的工具,只是让它完成检索、整理、碰撞和初稿等工作,自己则是保持最终的判断权和批判权,即完全不需要也不信任Ai提供答案和思考。愚蠢的人则相反,他们把AI的输出当成权威答案,深信不疑,结果是不过是用更精美的语言包装了自己的浅薄和偏见。
正因如此,最近备受关注的杨立昆(Yann LeCun)明确指出:当前纯大语言模型(LLM)+ Scaling的路径是错误的,它无法通往真正的人工智能。他主张转向能构建世界模型的新架构。对AI发展路径提出尖锐批判的,还有语言学大师诺姆·乔姆斯基,以及深度学习早期重要人物、曾发出AI风险警告的Geoffrey Hinton等人。
这些学者(杨立昆、李飞飞、乔姆斯基Geoffrey Hinton等)的共同认识或担忧,指向同一个根本问题——这也是人类自古以来反复追问的核心命题:
只要人类仍然主要依赖语言、文字、逻辑和科学知识来理解和认识世界,就意味着我们依然被困在历史之中。用马克思的话说,这处于人类的“前史”阶段,离真正的人还很远。即人尚未实现真正的感性解放,仍在符号、概念和异化关系中打转,因而从存在论意义上仍是不自由的、未完成的人。
正因如此,他们对当前AI路径的根本批判可以浓缩为以下观点:如果AI不能突破语言符号的根本局限,不能发展出真正的世界模型、具身理解和感性锚定,那么它就只能继续强化人类的“历史异化”,而难以成为帮助人类实现真正解放的工具。相反,它极可能成为语言-符号霸权的超级放大器:让原本就依赖语言的人更加深陷其中,让浅薄的思考包装得更加精致,让感性与理性的撕裂更大,但同时也为人的感性创造着解放条件,即异化和异化的扬弃走的是同一条道路。