国内大语言模型介绍

释放双眼，带上耳机，听听看~！

本文介绍了国内几个知名的大语言模型，包括百度文心一言、复旦大学MOSS、腾讯HunYuan、阿里通义和华为盘古，介绍了它们的特点和优势。

ChatGPT 是基于 大语言模型 的聊天机器人，而这个大语言模型是一个人工智能领域概念、技术。

大语言模型通常有十亿、百亿级的参数，需要非常强大的算力、和非常多的用于训练的数据资源。它对海量的无标注数据进行预训练、通过微调和零样本学习来变形、应用。

对大模型的“变形”（DIY），不仅能增强 AI 技术的通用性，还能扩展应用场景、人人都可以用“大模型”，这样也利于形成了一个开放的生态，激发大众创新。

GPT 时代，国内学界和企业也相继基于大语言模型推出自研的大模型。比如：

百度的“文心一言”、复旦大学的“MOSS”、腾讯的“HunYuan大模型”、阿里的“通义大模型”、华为的“盘古大模型”等等。

自研单位	大模型
百度	文心一言
复旦大学	MOSS
腾讯	HunYuan
阿里	通义
华为	盘古

本篇就将简要介绍这 5 个国内的这些大语言模型~ <喜欢三连👍👍👍笔芯>

百度-文心一言

以上这么多国内大语言模型，目前，最引人注目的就是“文心一言”，它也可以生成各种类型的文本，比如诗歌、小说、新闻等。同时，它被认为是中国 AI 新旧时代划分里程碑式的产品。

怎样体验？

1.通过百度智能云 API 接口调用文心一言的服务；

2.进入官网 wenxin.baidu.com/ 体验；

国内大语言模型介绍

文本的理解和创作还是“敬请期待”。。

在开放 API 体验 AI 根据文字、风格作画：

国内大语言模型介绍

前的产品中心只有“文心百中”和“文心一格”两个产品。

看下“文心百中” 提供的体验示例：

国内大语言模型介绍

实际用起来，跟 ChatGPT / New Bing / Notion AI 比，感觉差距还很大~ 文心百中还是停留在搜索结果上，没有做到联系上下文整合。

国内大语言模型介绍

文心一格主要提供一些：联想脑洞生成相关图片推荐，试了下，也不够准确。。

用一成语小结：任重道远

复旦大学-MOSS

MOSS 命名上和电影《流浪地球》的 AI MOSS 同名，寓意人和人工智能共同拯救地球。目前，它的参数规模约是 ChatGPT 的十分之一，仍处在内测阶段，预计三月底开源。

国内大语言模型介绍

MOSS 的优势是什么？

MOSS 因为参数规模小，所以更节省计算资源和存储空间，易于部署和应用。

另外，MOSS 在设计时还考虑了人类的伦理道德准则，不会产生有偏见或可能有害的回答，这样可以避免一些潜在的法律风险和商业伦理问题。这点上，ChatGPT 则没有明确地处理。

腾讯-HunYuan

HunYuan 利用了腾讯的研发力量，完整覆盖 NLP 大模型、CV 大模型、多模态大模型及其它行业领域任务模型，可谓是：集大成者。

它的目标是打造行业领先的 AI 预训练大模型，以统一平台，对技术复用，使 AI 技术适用于更多场景，并且降低成本。

HunYuan 的参数量级是万亿！从这点看，腾讯的 HunYuan 格局（画饼）就比文心一言、MOSS 要大的多的多~~

对于公众 HunYuan 目前也是在内测优化中，未来值得期待。

但 HunYuan 的 NLP 部分，HunYuan-NLP 已经在多个腾讯产品中得到应用，一样也是用于生成文本，比如对话生成、小说续写、广告生成等。

国内大语言模型介绍

阿里-通义

阿里的通义模型是一系列基于【自然语言处理和多模态理解与生成】的 AI 模型，旨在打造国内首个 AI 统一底座。

它包括以下几个核心模型：

1.AliceMind-PLUG：语言大模型，能够在多个中文语言理解任务上超越人类水平。

2.AliceMind-mPLUG：多模态理解与生成统一模型，能够处理图文、视频等多种数据类型，并进行跨模态搜索、生成等任务。

3.M6-OFA：多模态统一底座模型，能够根据不同的场景和设备动态调整模型大小和性能。

4.S4：超大模型落地关键技术框架，能够支持百亿级别参数的训练和推理。

国内大语言模型介绍

阿里的这个部署算是最早一批了，值得期待。

目前，我们可以在魔搭社区 modelscope.cn/home 找到通义大模型的部分开源代码。比如你可以体验中文版的GPT-3 等。

华为-盘古

盘古，这个大家也常听到吧？也属于是大名鼎鼎。

盘古大模型是一系列超大规模的预训练模型，包括NLP、CV、多模态和科学计算等。

其中，盘古NLP大模型是 全球最大 的千亿参数中文语言预训练模型，它能够进行内容生成和内容理解等任务。

盘古CV大模型是 全球最大 的30亿参数视觉预训练模型，它能够进行分类、分割和检测等任务。

这两个全球最大是亮点~ 目前，盘古大模型在华为云：www.huaweicloud.com/ 上提供服务。

国内大语言模型介绍

小结

整个看完下来，我的感觉就是：虽然我们现在的大模型 GPT 商用还没有像 ChatGPT 或 New bing 或 Notion AI 那么直接能给到大众去使用，但是国内这些最优秀的一批企业/高校也一直在推进这个事情。

技术存在差距，不承认也不行，就像之前所分享的，ChatGPT 能站到大众面前，也经过了美国各科技公司十多年的沉淀、演进，所以我们可能还是起步有点迟了。

但不怕慢就怕站，我们知道训练 AI 大模型是个方向，就走起来就好了，加油吧~ Maybe 顶峰再见~

OK，以上便是本篇分享，希望各位工友喜欢~ 欢迎点赞、收藏、评论 🤟

我是掘金安东尼 🤠 100 万人气前端技术博主 💥 INFP 写作人格坚持 1000 日更文 ✍ 关注我，安东尼陪你一起度过漫长编程岁月 🌏

_{😹 加我微信 ATAR53，拉你入群，定期抽奖、粉丝福利多多。只学习交友、不推文卖课~}

本文正在参加「金石计划」

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

国内大语言模型介绍

百度-文心一言

复旦大学-MOSS

腾讯-HunYuan

阿里-通义

华为-盘古

小结

GPT-3微调：步骤和指南

一分钟部署个人的ChatGPT站点

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

Kling AI | Sora-Like Video Model

归档

{{userData.name}}已认证

百度-文心一言

复旦大学-MOSS

腾讯-HunYuan

阿里-通义

华为-盘古

小结

GPT-3微调：步骤和指南

一分钟部署个人的ChatGPT站点

天工：国内首个双千亿级大语言模型的能力测试

探索大语言模型技术的最新发展和应用

OpenAI发布GPT-4 Turbo：功能更强大且更便宜

百度文心大模型4.0即将发布，提升逻辑推理、代码和数学等能力