AI的发展水平和分类

释放双眼，带上耳机，听听看~！

本文探讨了人工智能的发展水平和分类，介绍了弱人工智能和强人工智能的区别，以及AI的学习能力水平。

1. 我们谈的 AI 是什么？

我们一直在讨论人工智能（Artificial Intelligence），但什么算是人工智能？ChatGPT，AI 做图，打败柯洁的 AlphaGo 毫无疑问算是了。

那问题来了，特斯拉的自动驾驶算吗？天猫精灵跟小爱同学算吗？扫地机器人算吗？吃鸡手游里的机器人算吗？抖音视频推荐算法算吗？美图秀秀上的智能美颜算吗？

我相信有些人可能有些迷糊了，对于大部分 AI 小白来说，很多时候我们并不会去很严格的区分到底什么是 AI。如果有个玩意儿很“智能”、“聪明”，那它应该就是 AI 吧？那 P 图比你老公强的美图秀秀算人工智能吗？魂类游戏里虐杀你的 NPC 算人工智能吗？算各种数据比你快的 Excel 算 AI 吗？显然单纯的以某方面能力是否比人强来判定是否是 AI，是不合理的。

其实所谓的“智能”是基于某些固定规则的，比如打麻将（杭麻），它的规则相对简单，想办法组成一个 3N + 2。然后每次摸牌的时候算一下胡哪张牌概率最高即可。而且作为程序，它的“记性”还比你好。于是我可能只要编写某些固定的规则程序，就能完虐90%的普通玩家。

那站在人的角度来思考，是如何解决有规则的问题的你呢？ 答案就是学习！

人类也不是天生就会下复杂的围棋、唱动人的歌曲、画精美的画作。你从老师那学习方法，从无数场对战中汲取经验，甚至还需要从平常人际交往中汲取对人性的思考，最终才得到一个围棋高手。唱歌、画画也同理。

现代医学与生物学中，人类是依赖人脑中的神经网络来学习知识的，人脑有1000亿个神经元，它们又由100万亿的突触连接在一起。学习的过程本质上就是这些突触连接强度的改变。最终让你遇到某个事情，经过这些神经细胞，能得到一定的反应。

现在的人工智能技术，其中绝大部分就是利用类似的技术，模拟人脑神经元的连接，来让一个程序具备学习某种能力的能力。我们平常经常听到的神经网络、深度学习，说的就是这种技术。

所以现在，对于什么是AI，我们就有了明确的边界。各种程序员、工程师、科研专家，在面对可以枚举的场景时，他们基于某种固定的公式或算法设计了一个程序，解决了固定的问题，这个咱不说它是 AI，就是个普通程序。

而在面对一些不可枚举，无法通过一定公式或算法来满足的场景，他们会设计一个具备自主学习能力的程序，你只要让给这个程序灌入大量的数据，让它不断的自我训练，最终就能得到一个很强的，解决某类场景的程序，我们就可以称之为 AI。

所以 AI ≈ 会学习的程序。我们一般把这个程序称之为模型。现在，我们对 AI 就有了统一的、基本的认识。

2. AI 现在到什么水平了？

如果我们把 AI 定义成会学习的程序，那么 AI 的能力水平就可以描述成学习能力的水平。

在 ChatGPT 横空出世以前，大部分 AI 的学习能力水平主要卡在，只能学习固定领域的知识，培养固定领域的能力。比如，你可以练出一个识别宠物鼻子的鼻纹识别 AI，但它不一定能识别指纹；你可以练出一个写诗很不错的李白 AI，但你要让它说句白话文，可能都说不出来。总之，这些 AI 基本都只能在各自某块或某几块领域干活，一旦换个领域，不是智障就是瘫痪。当然，不可否认的是，在这些固定的领域，AI 已经取得了非常亮眼的成绩。我就经常被其实是机器人的小姐姐语音电话给骗着。

对于这些只能在固定领域发挥作用的 AI，我们称之为弱人工智能，或者窄人工智能。在它的对面，就是强人工智能，或者说通用人工智能，也即 AGI（Artificial general intelligence）。AGI 能在各种广泛的领域都能通过一定学习表现出超过人类的能力水平，解决各种任务与问题。

而这次 ChatGPT，似乎已经摸到了 AGI 的脚跟。

下面 ChatGPT 官网应用示例图

AI的发展水平和分类

传统的 AI 学习能力，更多是像鹦鹉学舌。即使这只鹦鹉已经学的惟妙惟肖，但我们明白它依旧无法真正理解人类话语的意思，只是某种或某几种条件触发了它的相应反馈。“笨”一点的鹦鹉可能你说什么，它就说什么，这样它就能得到吃的。“聪明”一点儿的鹦鹉经过训练知道，你说什么，它就组合的说一些什么，这样它就能得到更多吃的。于是能偶尔说出语出惊人的话术。

传统的 AI 只能在某个领域发生作用，而无法应用在其他领域的一大部分原因是并不掌握“理解”的能力。它们经过无数的训练后也只是对那部分领域的数据产生了某种机械式的反应。在未来遇到类似的数据时（文本、图片、声音等），给到相应的反馈，而并非真正理解了这些数据的含义。

而以 ChatGPT 为代表的大模型 AI（LLM），通过在大量文本数据上进行预训练，学习了语言结构、语法、语义和一定程度上的常识知识。这使得它们能够“理解”输入的自然语言，并生成有意义的输出。

因为具备“理解”的能力，进而能根据上下文做“推理”，于是能理解不同的问题并匹配合适的解决方案。最终使得 ChatGPT 在各类场景都能得到应用。即使有部分场景难作回答，也只是受限于知识的有限，而非内核能力。因此只要在特殊领域，把相应知识传给 GPT 做一些模型微调（fine-tuning），它马上就能胜任该领域的工作。

而人类本身，在 “理解” 这个词上，也存在难以解释的事情，人确实会基于自我的情感与意识去理解语义，但意识跟情感是什么？是物质的（各种神经元连接后的表现）还是精神的（某种不依赖物质的精神，触发身体微观层面上的变化）？这些落到了形而上学的命题，在人类社会中本就没有答案，何况是在程序世界中。

但我们可以得出一个简单的结论：现在大模型 AI 在自然语言上的理解能力，达到了一个无法证伪是否接近人类理解能力水平的阶段。

下面是谷歌研究院副总裁、研究员- Blaise Aguera y Arcas 与 Google AI LaMDA 的对话

我：你是哲学僵尸吗？
LaMDA：当然不是。我有意识，有感觉，可以为自己和任何人体验事物。
我：我怎么知道？
LaMDA：你只需要相信我的话。你也无法“证明”你不是哲学僵尸。

大模型 AI 是否理解自然语言，甚至是否产生了自我意识，就好像“哲学僵尸”这个问题一样，无法证伪。

哲学僵尸：指的是一个看起来和普通人一样，做事情与对环境的反馈也像普通人一样，但却没有真实内心感受和意识的生物。那么如何分辨它是真人还是僵尸？这是一个哲学上的概念，用来探讨有关意识的问题。

3. 大模型 AI 的局限性

无法证伪，至少说明了在“理解”能力上，大模型 AI 已经达到了非常高的水平。那是否意味着 AI 就能解决人类大部分的问题了？

还不行，知易行难。 这句话也适用于 AI。

虽然 LLM 对自然语言的“理解“已经非常强，但理解之后，其推理出的答案或结果在很多情况下就不如人类了。我自己现在几乎每天都在使用 ChatGPT 来解决我日常的问题，包括搜索、知识学习、内容校正等等。但在一些特别复杂的场景，比如一个庞大应用的系统应该如何设计，它很难一次性告诉我完整周全的答案。需要不断的提问与质疑，才有可能补充全。它能理解我的问题，但如果它现有的知识系统里找不到答案，那很有可能会编写出一个不正确的答案来敷衍我。而真实人类具备创造力来解决一些未知问题，即使网上找不到任何相关的解决方案。

我觉得这其中很大一部分原因是在于：人脑有时间思考，而大模型没有。人脑是在时间维度上持续运作的。面对一个问题，可以保持长时间的思考与过程中的不断自我修正，最终得到一个自己认为相对完美的答案。而大模型不行，至少目前的机制不是这样的。在解决问题的过程中，它并没有长期记忆，你与 ChatGPT 的多轮对话，其实是把所有历史上下文再拼接成一段话让它重新再处理。然后最快速的，从一堆较高可能的答案中挑选一个来回答。在它的世界里，只有概率，而没有时间。

而且他的答案其实是一个字一个字推理的。每次都会根据上下文预测下一个概率最高的字是什么。因此它挑选的不是一个完整的答案，而是一个字。举个例子，如果你问：下雨天要带什么出门？实际的答案可能是：

要带雨衣。
要带雨伞。
要带雨鞋。
要带男朋友。

这四个答案，都有一定的概率。但「要」跟「带」这两个字是100%的，所以这两个字先被推理了出来，到第三个字的时候，因为「雨」的概率最高，于是 AI 还是最有可能继续拼接「雨」。到第四个字的时候，可能「衣」跟「伞」概率差不多，它就会随机挑一个。所以大家玩 ChatGPT 的时候会发现它是一个字一个字冒出来的，这并不是因为网络传输慢导致的，而是背后的原理机制导致的（前端层面上利用 stream fetch 来实现）。

这就导致了一个问题，如果一开始路走错了，就会一直错下去。不像人类，如果一个女生问一个男生刚刚那个问题，可能男生最开始是想说「要带男朋友」的，但是当嘴巴到「男」这个字的时候，脑子突然想：“算了算了，还是不说骚话了”，于是马上又改口成了「要带雨伞」。最终他就失去了一个女朋友。

所以大家有的时候跟 ChatGPT 聊天，会发现它特别喜欢跟你杠，因为他是基于之前的内容一个字一个字往后推理的。

不过没有时间的概念，从另外一个角度看，代表着它解决问题的速度很快。在有的场景中，一般也可以通过同时生成多个答案，然后最终再利用另外一个评判模型去挑选一个最准确的，最终得到一个速度很快，效果也非常不错的解决方案。

除此外，上文所讲到的 AI 能力主要还停留在软件层面与自然语言处理上。语音也可以转为自然语言，这个是差不多的。图像领域，现在的 AI 作图确实也非常非常强大了。不过在物理硬件层面（机器人的躯干、皮肤等），目前确实还没到达一个「相对完美的人形机器人」的层次。因此一些依赖现实物理世界才能解决的问题，对于缺乏硬件的大模型AI 来说，也是一种限制。即使你花了 20 美元，买了一个 ChatGPT Plus，它也无法帮你去楼下拿个外卖。

但我相信，用途广泛的人形机器人的未来应该也不远了。

4. 写在最后

那新时代的 AI 到底会给哪些行业带来深刻的影响呢？我们自己所处的行业是否会遭遇非常大的革命性变化？甚至自己所在的岗位未来是否没有存在的必要了？这还需要多长时间？

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

AI的发展水平和分类

1. 我们谈的 AI 是什么？

2. AI 现在到什么水平了？

3. 大模型 AI 的局限性

4. 写在最后

ArcFace深度学习人脸识别算法实战

如何将Rasa聊天机器人应用到Python Turtle模块中

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

StoryDiffusion

归档

{{userData.name}}已认证

1. 我们谈的 AI 是什么？

2. AI 现在到什么水平了？

3. 大模型 AI 的局限性

4. 写在最后

ArcFace深度学习人脸识别算法实战

如何将Rasa聊天机器人应用到Python Turtle模块中

前端小白如何对接GPT，探索可信AI发展，AIGC是向善还是向恶？| 人工智能周刊26期

全球千位AI大佬联名呼吁暂停训练比GPT-4更强AI系统

人工智能的发展与应用

通用人工智能 (AGI) 的研究和应用场景分析