-
前端JavaScript执行AI模型详解 – TensorFlow库应用指南
本文详细介绍了在前端环境中利用JavaScript执行AI模型的流程,重点介绍了TensorFlow库的选择和引入方式,帮助开发者更好地集成AI功能到Web应用中。- 102
- 0
-
Llama3.1模型泄露:与GPT-4o比较及性能提升详解
Llama3.1模型在Reddit上泄露,与GPT-4o进行了详细比较,同时展示了性能提升和多语言支持。该模型基于405B参数蒸馏,首次超越了GPT4o等闭源模型,在多个benchmark上达到了SOTA水平。- 345
- 0
-
大语言模型及神经网络工作原理分析
本文分析了大语言模型和神经网络的工作原理,包括大模型训练过程、大模型如何预测下一个词,以及感知器的作用。通过对参数文件和代码文件的介绍,解释了大模型是如何依靠神经网络进行预测的。- 479
- 0
-
NLP大模型在Colab上的应用指南
了解如何在Colab上使用NLP大模型进行机器学习项目开发。Colab提供免费GPU资源和云端集成开发环境,方便用户进行各种NLP任务。同时,探索Hugging Face社区的丰富资源库和合作网络,加速技术创新和知识交流。- 511
- 0
-
从零开始实现GPT-2模型教程 – Karpathy AI大课SEO优化指南
了解如何从零开始实现GPT-2模型,Karpathy AI大课带您深入学习神经网络和深度学习技术。本教程涵盖了GPT-2模型的构建、优化和训练过程,让您轻松搭建自己的人工智能模型。- 818
- 0
-
-
-
-
OpenAI发布GPT-4稀疏自动编码器SAE,控制神经网络生成内容更精准安全
OpenAI在官网发布了GPT-4的稀疏自动编码器SAE,帮助控制神经网络生成内容更精准、更安全。了解如何使用SAE来引入稀疏性约束,让大模型学习更有意义的特征表示。同时探索神经网络生成内容的复杂性和如何在训练过程中优化参数来提高输出质量。- 735
- 0
-
-
华为云MindSpore模型训练全流程指南
本文介绍了在华为云ModelArts上使用MindSpore进行模型训练的全流程,包括环境搭建、数据上传、Notebook编程环境配置等步骤,以及相关的工程目录结构。适合对华为云深度学习平台感兴趣的开发者参考学习。- 235
- 0
-
新一代Mamba-2在ICML 2024夺冠,统一了状态空间模型和注意力机制
Mamba-2在ICML 2024夺冠,作者统一了状态空间模型和注意力机制,性能优越,为深度学习社区带来新思路。- 599
- 0
-
DCMHA:提升Transformer核心机制注意力,让小模型能打两倍大的模型!
ICML 2024高分论文,彩云科技团队构建DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),提出可动态组合的多头注意力(DCMHA),从根本上提升了模型的表达能力。DCMHA即插即用,可在任何Transformer架构中替换MHA,得到通用、高效和可扩展的新架构DCFormer。- 736
- 0
-
人工智能教父Hinton接受采访,揭秘AI发展历程
教父Hinton在采访中分享了他的AI发展历程,揭示了人工智能领域的一些独特见解,对于对人工智能教育和神经网络感兴趣的人士必不可少的一篇文章。- 404
- 0
-
NeRF-Casting: 三维成像与反射建模的新方法
NeRF-Casting是一种新的神经网络方法,结合了光线追踪和反射建模,用于实现准确、详细的三维成像和反射效果。本文介绍了NeRF-Casting的模型细节和工作原理,以及其在三维成像领域的重要性。- 264
- 0
-
EfficientTrain++: 放大神经网络训练效率的新算法
本文介绍了清华大学研究团队提出的EfficientTrain++算法,通过广义课程学习实现神经网络训练加速。该算法通用于不同的训练数据规模和多种网络结构,为计算机视觉领域带来了新的效率优化技术。- 828
- 0
-
-
Anthropic 宣布理解人工智能模型内部运作机制的重大进展
Anthropic 宣布取得重大进展,成功提取了数百万个特征,详细理解了现代生产级大型语言模型的内部运作机制,这将提高人工智能模型的安全性和可靠性。研究论文链接:https://transformer-circuits.pub/2024/scaling-monosemanticity/index.html- 236
- 0
-
大型语言模型(LLM)与3D空间数据(3D LLM)集成方法全面概述
本文全面概述了大型语言模型(LLM)与3D空间数据(3D LLM)之间的集成方法,强调了LLM在嵌入式人工智能(AI)系统中推进空间理解和互动的潜力,提供了对3D数据表示的方法和神经辐射场的分析。- 477
- 0
-
-
SUNDAE: Spectrally Pruned Gaussian Fields with Neural Compensation – 3D 渲染新方法论文发表
最新论文发表:帝国理工学院、北航、北京理工大学等机构的研究者联合发表了一篇关于SUNDAE的论文,介绍了一种内存高效的高斯场渲染方法,采用频谱修剪和神经补偿。论文中详细介绍了SUNDAE的原理和性能,受到了国际上广泛关注。了解更多详情请访问文章链接。- 257
- 0
-
机器学习精炼秘笈:Transformer、RNN、LSTM和复杂度知识推荐清单
这份推荐清单包括了机器学习领域的关键知识,涵盖了Transformer、RNN、LSTM等重要架构和复杂度概念,适合行业从业者和科学研究者快速了解人工智能领域的最新发展。- 763
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!