ChatGPT: 人工智能革命的新里程碑

释放双眼，带上耳机，听听看~！

了解ChatGPT，一种革命性的大型语言模型，具有强大的上下文理解能力和多语言支持，可广泛应用于智能家居、智能客服等领域。

一、什么是ChatGPT？

人工智能已成为当今科技领域的一大热门话题。随着深度学习的快速发展，OpenAI团队在其GPT（Generative Pre-trained Transformer）模型的基础上，推出了ChatGPT，这是一种革命性的大型语言模型，为人们提供了一种全新的与计算机进行对话的方式。

ChatGPT从字面上可以分解成两个词Chat+GPT。Chat是聊天的意思，GPT是Generative Pre-trained Transformer的缩写，生成式预训练语言模型，使用Transformer架构来处理自然语言处理（NLP）任务。说人话就是能够通过理解和学习人类的语言来进行对话，使其能够生成与输入语句相匹配的自然语言响应。它使用了海量的文本数据进行预训练，涵盖了互联网上的网页、书籍、论文等丰富资源，从而掌握了丰富的语法、语义、常识和上下文理解能力。可以真正像人类一样来聊天交流，能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

总结一下就是它有大量的训练语料，超大规模的训练参数（上千亿），能自己生成内容（注意这里不是检索，所以你会发现每次向GPT提问同样的问题，得到的答案都是不一样的）。就算一个它不知道的东西，它都可以根据已掌握的数据，生成一个答案，虽然有时候可能在胡说八道，从这个角度，确实已经很像人类了。

二、ChatGPT有什么特性？

ChatGPT具备许多令人兴奋的特性，使得它成为当今领域内备受瞩目的创新。主要的特点有：

根据上下文理解问题

ChatGPT展现了强大的上下文理解能力，可以深入理解对话的背景，并提供准确的回答。这使得对话更加连贯，用户可以轻松进行复杂的交流，无需重复提供背景信息。

提供答案与解决方案

ChatGPT擅长回答各种问题，无论是实际知识、推理还是其他领域的问题，都能给出相应的回答并提供有用的解决方案。

持续学习与进化

ChatGPT具备学习能力，能够从大量数据中不断吸收新知识，并将其应用于对话和问题的回答中。这使得ChatGPT能够跟上时代的发展，逐渐变得更加智能和准确。

多语言支持，全球交流

ChatGPT可以使用多种语言进行对话，包括中文、英文、西班牙语、法语和日语等。它能够流利地进行交流，满足全球用户的需求。

理解复杂问题，简单解释

ChatGPT具备处理复杂问题的能力，并以简单易懂的语言解释和回答。即使是看似复杂或专业的问题，ChatGPT也能够以用户友好的方式解释，使用户更容易理解。

广泛应用

由于其出色的性能和灵活性，ChatGPT适用于各种场景。无论是智能家居、智能客服还是其他领域，ChatGPT都能够帮助人们解决问题，并提供高质量的交互体验。

四、如何与ChatGPT对话，Prompt是什么？

遇事不决，先问GPT。我们先问一下ChatGPT，Prompt是什么？

ChatGPT: 人工智能革命的新里程碑

我们来简单概括一下ChatGPT的回答，Prompt 就是提示工程（Prompt Engineering）是指在使用自然语言处理（NLP）模型（例如 GPT-4）时，设计和优化输入文本（即提示）的过程。这一过程旨在更有效地引导模型生成所需的输出结果。提示工程的关键在于提高模型的表现，使其更准确、有趣或符合特定上下文要求。

好了，那如何才能写出清晰的Prompt呢？让他能理解我们的问题，给出高质量的答案。就像与人沟通其实也是有很多技巧学问的，同样的，其实跟ChatGPT沟通也是有一些规律、模版是可以遵循的。

五、如何写出清晰的Prompt？

用清晰明确的语言表达问题

就像人与人之间的沟通一样，需要用清晰明确的语言表达问题，它就会给我们简明扼要的答案。避免重复含糊不明确的词汇和句子。

对比以下案例：

较差的prompt❌	更好的prompt✅
总结会议记录	总结会议记录，用markdown的格式列出每个发言者和他们的主要观点，并且在最后列出发言者建议的后续步骤或行动
写一篇关于XX产品的种草日记	写一篇关于XX产品的种草日记，要求：从产品使用体验的角度，有哪些优点和缺点，以第一人称写作，让人有购买的欲望

给ChatGPT设定身份

给ChatGPT设定一个相应的回复者身份，它可以模仿这个身份来更好的回答你的提问。设定身份的同时最好包括身份、任务和约束三个元素：

较差的prompt❌	更好的prompt✅
我怎么反驳对方，关于『xxx』	我希望你能担任辩论教练。我将为你提供一个辩论队和他们即将进行的辩论的议题。你的目标是为团队的成功做好准备，组织练习回合，重点是有说服力的演讲，有效的时间策略，反驳对方的论点，并从提供的证据中得出深入的结论。

右边的提示词包含的3个元素分别是：

身份 – 辩论教练

约束 – 一个辩论队和他们即将进行的辩论的议题

任务 – 为团队的成功做好准备，组织练习回合，重点是有说服力的演讲，有效的时间策略，反驳对方的论点，并从提供的证据中得出深入的结论。

提供示例或喂相关数据

比如你想让它用鲁迅的写作风格给你写一段文字，你可以先提供一些鲁迅的文章发送给它。
使用分隔符清晰标示输入的不同部分

如使用 “””三重引号””” 、<XML标记> 、章节标题等有助于划分需要区别对待的文本部分。

示例：

将以下由三重引号包含的文本总结为一句话。 “””在这里插入文本”””
告诉ChatGPT完成任务所需要的步骤

有些任务最好指定为一系列步骤。明确的写出步骤可以使ChatGPT更容易遵循这些步骤。

示例：

按照以下逐步说明来响应用户输入。

第1步 – 用户将用三重引号提供文本，以『总结：』作为前缀，用一句话总结这段文字。

第2步 – 将第1步的摘要翻译成中文，前缀为『翻译：』。
指定ChatGPT回复输出内容的长度

可以要求ChatGPT生成具有给定目标长度的输出。可以根据字数、句子、段落、项目符号等的数量来指定目标输出长度。

💡 注意：指示ChatGPT生成特定数量的单词并不能实现高精度，绝大多数情况下都有误差，我猜可能和Token数有关。

示例：

✅ 将以下由三重引号包含的文本总结为100个字。 “””一段文本”””

相信你掌握了以上6个最佳实践技巧，对ChatGPT的使用已经很熟悉啦~

不过，任何一个技巧、模版都不可能是万能的，很多时候，模版或技巧确实可以帮我们快速的达到及格线的水平，但是如果一直靠这些花里胡哨的东西，你永远也不可能成为一个行业顶尖的人才。很多东西是需要大家下苦功夫，在实战中一点点慢慢摸索出来的。实践才是检验真理的唯一标准。

七、大模型发展这么久，为什么到GPT3.5才具有了真正的智能？

GPT（Generative Pre-trained Transformer）生成式预训练语言模型。也就是这个语言模型是基于Transformer的，Transformer是一种基于注意力机制的神经网络模型，最早由谷歌公司提出，其最初目的是用于自然语言处理任务，如机器翻译、文本摘要、语音识别等。相比于传统的循环神经网络模型，如LSTM和GRU，Transformer模型具有更好的并行化能力和更短的训练时间，在处理长序列任务方面表现出色，因此在自然语言处理领域得到了广泛应用。

其实GPT不是OpenAI公司的原创，而是由谷歌公司发明。是不是跟当年操作系统的图形用户界面其实是施乐公司最新发明的，却被乔布斯窃取到并应用到苹果的系统上一样。包括后来的iphone手机，大家也可以搜一下，其实所有的设计都是借鉴了其他公司的产品，但是乔布斯把他们组合并创新成了一件最伟大的艺术品，从而开启了一个全新的移动互联网时代，所以有时候并不一定什么都要原创，站在巨人的肩膀上来微创新，有时候更容易出成果。

上面扯的有点远了，我们回到为什么GPT3.5才算真正的人工智能这个问题上。

2018 年 OpenAI 采用 Transformer Decoder 结构在大规模语料上训练了 GPT1 模型，揭开了NLP模型预训练+微调的新范式。2019 年，OpenAI 提出了 GPT2，GPT2 拥有和 GPT1 一样的模型结构，但得益于更多和更高的数据质量以及新引入的多任务学习方式，语言生成能力得到大幅提升。之后由于 GPT 采用 Decoder 单向结构天然缺陷是无法感知上下文，Google 很快提出了 Encoder 结构的 Bert 模型可以感知上下文，效果上也明显有提升，同年 Google 采用Encoder-Decoder 结构，提出了 T5 模型，从此大规模预训练语言模型朝着三个不同方向发展。

也就是说在GPT3.0之前，谷歌的Bert 模型是远超OpenAI 的GPT模型的。这里补充一个知识点，GPT3.0之前都是开源的，OpenAI由于一些商业等多方面的考虑，从GPT3.5开始，模型都是闭源的。

直到2020 年 OpenAI 提出了 GPT3 将 GPT 模型提升到全新的高度，其训练参数达到了 1750 亿，训练语料超45TB，自此GPT系列模型的数据飞轮便转动起来，超大模型时代开启， NLP 任务走向了预训练+情境学习新路线。由于 GPT3 可以产生通顺的句子，但是准确性等问题一直存在，于是出现了InstructGPT、ChatGPT 等后续优化的工作，通过加入强化学习模式实现了模型可以理解人类指令的含义，会甄别高水准答案，质疑错误问题和拒绝不适当的请求等。

从GPT3.5，GPT突然涌现出了“乌鸦”能力，之前的都可以理解成量变，一种鹦鹉学舌的能力，并没有真正的智能。

可能是大力出奇迹，我感觉跟人脑是一个道理，一个神经元没啥智慧，一百万个、一百亿个可能也没啥智慧，不过增加到一千亿个神经元连接，突然就有智慧了，涌现出了能力。这是一件很玄学的事情，包括现在世界顶级的人工智能专业也无法解释这种现象，我们只能理解成大力出奇迹。

这里拿出一点篇幅来普及一下什么“鹦鹉学舌”的假人工智障，什么是拥有“乌鸦”能力的真人工智能

所谓鹦鹉学舌，就是东施效颦。没有GPT之前，几乎所有的自然语言处理都遵循着这一范式。他没有真的懂你的意思，只是一种模式匹配，比如之前的语音助手，只能识别有限的场景，比如你问他，帮我导航去天安门，他可以给你答案，但如果你让问他火星怎么去，他可能就回答不了你，因为他的数据库里没有这个问题的答案。也就是说，他只能回答在自己的数据库里有对应答案的问题，一旦你的问题超出了他的数据范围，他是没办法给你回复的。无法做到根据现有的数据生成新的数据，但是世界的问题千千万，不可能穷尽所有的可能把所有的问题答案都事先准备好，这也是之前的人工智能大家感觉并不智能的原因，因为他的底层实际上还是在做匹配。我举一个程序员都能理解的例子，比如你要实现一个不同条件得到不同结果的功能，我相信大部分程序员都是这样实现的。

  if($sex == '男' && $age < 18){
      echo "小男孩";
  }else if($sex == '女' && $age < 18){
      echo "小女孩";
  }else if($sex == '男' && $age >= 18 && $age <= 35){
      echo "小伙子";
  }else if($sex == '女' && $age >= 18 && $age <= 35){
      echo "小姑娘";
  }else{
      echo "老年人";
  }

如果新增了条件，还是要新增一堆的if else才能匹配更多的情况。

而乌鸦不一样，小时候我们读过乌鸦喝水的故事，乌鸦是有真正智慧的，他能真的读懂你要表达的意思。这里我们引用华人最厉害的AI学者之一朱松纯教授，在2017年写的一篇思考人工智能和智能本质的文章，通过这篇文章来理解乌鸦是如何感知、认知、推理、学习、执行的。

ChatGPT: 人工智能革命的新里程碑

乌鸦通过观察，自主串通了

汽车能压碎坚果
红绿灯能控制汽车
车能撞死我

这三件事情，从而利用红绿灯和汽车，来帮自己达到“安全打开坚果”这一任务结果。

如果类比成机器学习模型，过往“鹦鹉学舌”范式的解法，是要求所有乌鸦可以共享一个大脑，它们有很清晰的优化目标，即“保住性命的前提下打开坚果”。它们的方式是，随机尝试所有事件的组合，并向着最优解的方向不断演化。

但现实世界的乌鸦无法共享大脑，也不能去冒着死亡风险去尝试所有可能。乌鸦只有一次机会，把观测到的两个现象，产生了一个新的可能性，并应用在一个全新的场景下。这里最接近的词汇可能是“inference”，是“基于证据和逻辑推演，得到结论”的过程，有的时候，还要加入很多猜测、抽象、泛化。举个例子，这篇文章把朱教授对于乌鸦的比喻，跟ChatGPT最本质的能力联系起来，就是在做inferencing这件事。

但很明显，inferencing不是乌鸦智能的全部。而且在机器学习领域里，inferencing特指使用训练好的深度学习模型来预测新的数据这一件事，会产生误解。其他词汇也有类似问题，所以我们在自己文章里，会直接使用“乌鸦能力”来指代ChatGPT的新能力。在对外交流时，我们没办法每次都把乌鸦能力是什么解释一遍，所以我们会用“理解”能力来进行指代。从“乌鸦”到“理解”，当然是一个信息量损失很大的过度概括。但是好处是可以把ChatGPT的本质能力凸显出来。过往互联网的两次能力跃进一次来自于搜索，一次来自于推荐，现在ChatGPT带来了“理解”，也非常有结构感。

最后，再给大家看一张图，让大家了解ChatGPT是如何一步步演化到目前的水平的：

ChatGPT: 人工智能革命的新里程碑

通过上图，大家可以看到：

GPT-3.5通过InstructGPT的模式 + 阅读代码，涌现了“乌鸦”能力，产生了质变。但是还没找到合适的应用界面，也不符合人类喜好
ChatGPT在RLHF的帮助下，找到了GPT-3.5和人类自然语言的合理接口，解锁了模型应用的前景

（以上关于鹦鹉学舌和乌鸦能力的例子引用自”课代表立正的文章”）

这里解释几个专用名词：

InstructGPT：

ChatGPT的交互模式，让GPT的能力，更加贴近人类真实交互方式。在in-context learning基础之上，进一步降低了prompting的门槛；一定程度解决了GPT-3生成结果与用户期望不一致的非预期输出，大幅降低了有害的、错误或偏差的输出结果，让GPT更符合人类胃口

RLHF

ChatGPT背后的核心技术之一，让模型学习人类的偏好。全称是reinforcement learning from human feedback，通过构建人类反馈数据集，训练一个reward模型，模仿人类偏好对结果打分，是GPT-3后时代LLM越来越像人类对话的核心技术

ChatGPT

InstructGPT的亲戚，但一些优化方式也带来了ChatGPT的更泛化和准确能力，再次引爆了AIGC。ChatGPT总体来说和InstructGPT一样是使用RLHF进行训练，但模型是基于GPT3.5，而且数据设置上也不同。ChatGPT是一个输入，模型给出多个输出，然后人给结果排序，让模型可以学习人类的排序策略，即使是一本正经的胡说八道看起来也很合理的样子

六、结束语

AI时代已来，面对每天海量的信息铺面而来，我想说，不要焦虑、不要担心自己会被替代，最好的方式就是保持一颗平常心，主动的拥抱AI，让AI成为你的个人助理，根据自身的情况，先从能马上提高自己工作生活效率的内容学起，躬身入局，日拱一卒，相信不久的将来，你一定会感谢今天的你的坚持！

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

ChatGPT: 人工智能革命的新里程碑

一、什么是ChatGPT？

二、ChatGPT有什么特性？

四、如何与ChatGPT对话，Prompt是什么？

五、如何写出清晰的Prompt？

七、大模型发展这么久，为什么到GPT3.5才具有了真正的智能？

六、结束语

感知器损失函数及算法原理详解

Python 使用 ChatGPT

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

StoryDiffusion

归档

{{userData.name}}已认证

一、什么是ChatGPT？

二、ChatGPT有什么特性？

四、如何与ChatGPT对话，Prompt是什么？

五、如何写出清晰的Prompt？

七、大模型发展这么久，为什么到GPT3.5才具有了真正的智能？

六、结束语

感知器损失函数及算法原理详解

Python 使用 ChatGPT

ChatGPT: 人工智能的未来和应用领域

ChatGPT: 机器完成数据标注任务的新选择

ChatGPT：人工智能语言模型的灵活性、容量和潜力

ChatGPT：了解这一前沿技术，探索人工智能的新世界