当前位置:首页> AI教程> 国内大语言模型介绍

国内大语言模型介绍

释放双眼,带上耳机,听听看~!
本文介绍了国内几个知名的大语言模型,包括百度文心一言、复旦大学MOSS、腾讯HunYuan、阿里通义和华为盘古,介绍了它们的特点和优势。

ChatGPT 是基于 大语言模型 的聊天机器人,而这个大语言模型是一个人工智能领域概念、技术。

大语言模型通常有十亿、百亿级的参数,需要非常强大的算力、和非常多的用于训练的数据资源。它对海量的无标注数据进行预训练、通过微调和零样本学习来变形、应用。

对大模型的“变形”(DIY),不仅能增强 AI 技术的通用性,还能扩展应用场景、人人都可以用“大模型”,这样也利于形成了一个开放的生态,激发大众创新。

GPT 时代,国内学界和企业也相继基于大语言模型推出自研的大模型。比如:

百度的“文心一言”、复旦大学的“MOSS”、腾讯的“HunYuan大模型”、阿里的“通义大模型”、华为的“盘古大模型”等等。

自研单位 大模型
百度 文心一言
复旦大学 MOSS
腾讯 HunYuan
阿里 通义
华为 盘古

本篇就将简要介绍这 5 个国内的这些大语言模型~ <喜欢三连👍👍👍笔芯>

百度-文心一言

以上这么多国内大语言模型,目前,最引人注目的就是“文心一言”,它也可以生成各种类型的文本,比如诗歌、小说、新闻等。同时,它被认为是中国 AI 新旧时代划分里程碑式的产品。

怎样体验?

1.通过百度智能云 API 接口调用文心一言的服务;

2.进入官网 wenxin.baidu.com/ 体验;

国内大语言模型介绍

国内大语言模型介绍

文本的理解和创作还是“敬请期待”。。

在开放 API 体验 AI 根据文字、风格作画:

国内大语言模型介绍

前的产品中心只有“文心百中”和“文心一格”两个产品。

看下“文心百中” 提供的体验示例:

国内大语言模型介绍

实际用起来,跟 ChatGPT / New Bing / Notion AI 比,感觉差距还很大~ 文心百中还是停留在搜索结果上,没有做到联系上下文整合。

国内大语言模型介绍

文心一格主要提供一些:联想脑洞生成相关图片推荐,试了下,也不够准确。。

用一成语小结:任重道远

复旦大学-MOSS

MOSS 命名上和电影《流浪地球》的 AI MOSS 同名,寓意人和人工智能共同拯救地球。目前,它的参数规模约是 ChatGPT 的 十分之一,仍处在内测阶段,预计三月底开源。

国内大语言模型介绍

MOSS 的优势是什么?

MOSS 因为参数规模小,所以更节省计算资源和存储空间,易于部署和应用。

另外,MOSS 在设计时还考虑了人类的伦理道德准则,不会产生有偏见或可能有害的回答,这样可以避免一些潜在的法律风险和商业伦理问题。这点上,ChatGPT 则没有明确地处理。

腾讯-HunYuan

HunYuan 利用了腾讯的研发力量,完整覆盖 NLP 大模型、CV 大模型、多模态大模型及其它行业领域任务模型,可谓是:集大成者。

它的目标是打造行业领先的 AI 预训练大模型,以统一平台,对技术复用,使 AI 技术适用于更多场景,并且降低成本。

HunYuan 的参数量级是 万亿!从这点看,腾讯的 HunYuan 格局(画饼)就比 文心一言、MOSS 要大的多的多~~

对于公众 HunYuan 目前也是在内测优化中,未来值得期待。

但 HunYuan 的 NLP 部分,HunYuan-NLP 已经在多个腾讯产品中得到应用,一样也是用于生成文本,比如对话生成、小说续写、广告生成等。

国内大语言模型介绍

阿里-通义

阿里的通义模型是一系列基于【自然语言处理和多模态理解与生成】的 AI 模型,旨在打造国内首个 AI 统一底座。

它包括以下几个核心模型:

1.AliceMind-PLUG:语言大模型,能够在多个中文语言理解任务上超越人类水平。

2.AliceMind-mPLUG:多模态理解与生成统一模型,能够处理图文、视频等多种数据类型,并进行跨模态搜索、生成等任务。

3.M6-OFA:多模态统一底座模型,能够根据不同的场景和设备动态调整模型大小和性能。

4.S4:超大模型落地关键技术框架,能够支持百亿级别参数的训练和推理。

国内大语言模型介绍

阿里的这个部署算是最早一批了,值得期待。

目前,我们可以在 魔搭社区 modelscope.cn/home 找到通义大模型的部分开源代码。比如你可以体验中文版的GPT-3 等。

华为-盘古

盘古,这个大家也常听到吧?也属于是大名鼎鼎。

盘古大模型是一系列超大规模的预训练模型,包括NLP、CV、多模态和科学计算等。

其中,盘古NLP大模型是 全球最大 的千亿参数中文语言预训练模型,它能够进行内容生成和内容理解等任务。

盘古CV大模型是 全球最大 的30亿参数视觉预训练模型,它能够进行分类、分割和检测等任务。

这两个全球最大是亮点~ 目前,盘古大模型在华为云:www.huaweicloud.com/ 上提供服务。

国内大语言模型介绍

小结

整个看完下来,我的感觉就是:虽然我们现在的 大模型 GPT 商用还没有像 ChatGPT 或 New bing 或 Notion AI 那么直接能给到大众去使用,但是国内这些最优秀的一批企业/高校也一直在推进这个事情。

技术存在差距,不承认也不行,就像之前所分享的,ChatGPT 能站到大众面前,也经过了美国各科技公司十多年的沉淀、演进,所以我们可能还是起步有点迟了。

但不怕慢就怕站,我们知道训练 AI 大模型 是个方向,就走起来就好了,加油吧~ Maybe 顶峰再见~

OK,以上便是本篇分享,希望各位工友喜欢~ 欢迎点赞、收藏、评论 🤟

我是掘金安东尼 🤠 100 万人气前端技术博主 💥 INFP 写作人格坚持 1000 日更文 ✍ 关注我,安东尼陪你一起度过漫长编程岁月 🌏

😹 加我微信 ATAR53,拉你入群,定期抽奖、粉丝福利多多。只学习交友、不推文卖课~

本文正在参加「金石计划」

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI教程

GPT-3微调:步骤和指南

2023-12-19 18:44:14

AI教程

一分钟部署个人的ChatGPT站点

2023-12-19 18:49:14

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索