MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？

AI教程
23年12月8日
编辑

机器之心

释放双眼，带上耳机，听听看~！

MLPerf基准测试中，英伟达H100 GPU芯片创下新纪录，但是否真的在11分钟内训完GPT-3还存在争议。阅读本文了解详情。

赢了，但没有全赢。

昨天，老黄又「赢麻了」！
为啥呢？原来在最新的 MLPerf 基准测试中，英伟达 H100 GPU 芯片组在以下八项基准测试中全部创下了新纪录，同时成为唯一一个跑完所有测试的硬件平台。
据悉，最新 MLPerf Training v3.0 包含了基于 GPT-3 175B 的大型语言模型（LLM）测试，侧重于生成式 AI 能力。
MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？ 图源：MLPerf benchmarks。
LLM 训练测试中还使用了专注于 GPU 加速的云计算服务提供商 CoreWeave 提供的 NVIDIA HGX H100 基础设施，在多个规模上联合提交了 LLM 工作负载。
出来的结果令人振奋：在 896 个英特尔 Xeon Platinum 8462Y 和 3584 个英伟达 H100 芯片的合作下，仅仅用了 11 分钟就完成了基于 GPT-3 的 LLM 训练任务。
MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？
一时之间，AI 社区响起了老黄赢麻了的欢呼声。
可结果真如此吗？今天有人对此事提出了质疑。
先是 PyTorch 创始人 Soumith Chintala，他认为 GPT-3 并没有在 11 分钟内训练完成。使用 3584 个 H100 GPU，GPT-3 架构在 C4 数据集上训练了 11 分钟，对数概率为 2.69。
这里不要只关注「11 分钟」，因为这就像说「ResNet-50 在 MNIST（其实这里他想说的是 CIFAR100）上，5 秒内训练达到了 80％的准确率。」
MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？
推特用户 @abhi_venigalla 对 Soumith 的观点表示赞同，他是生成式 AI 创业公司 MosaicML 的研究者。他认为 MLPerf 基准测试中训练 GPT-3 的时间更可能是 2 天。
在他看来，该基准测试并不是完整的 GPT-3。MLPerf 的 LLM 基准只提供了一个开始的检查点，然后必须达到目标损失。
因此，该基准 11 分钟跑完 GPT-3 只覆盖 1.2B 的 token，而非完整的 300B token。此外看起来更像是 540 TFLOPs/H100，从配置上看像 FP8，~27% MFU。
不过他也承认，从 H100 在其软件生命周期早期这一点来看，以此规模实现现在这种性能也相当惊人。
MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？
所以，最新 MLPerf 基准测试中 11 分钟训完 GPT-3 是不是被误解呢？评论区的小伙伴也可以发表下自己的观点。
参考链接：developer.nvidia.com/blog/breaki…

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

MLPerf基准测试：11分钟训完GPT-3真的能全赢了吗？

NLP问答任务和BERT模型微调

AGI时代的技术创新范式与思考

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

StoryDiffusion

归档

{{userData.name}}已认证

NLP问答任务和BERT模型微调

AGI时代的技术创新范式与思考

【AI资讯】ChatGPT汇总：Craft、Poe、官方ChatGPT、Bing、Bard、Claude、Monica、文心一言、通义千问、讯飞星火、forefront Chat、AI商城

京东云GPU云主机及AI绘画模型分享平台介绍

ChatGPT最佳实践系列：提供清晰明确的指令

2023云栖大会AI项目分享：AI写诗、AI续写小说、AI作画