-
-
最先进的3D重建技术综述及未来发展方向
本文综述了最先进的3D重建技术,包括生成新颖的、看不见的视图,并讨论了未来的发展方向,旨在捕捉和渲染物理场景的逼真3D表示。深度学习的最新进展也被应用于该领域,预计将在未来发挥更重要的作用。- 277
- 0
-
腾讯混元文生图大模型全面开源,Hunyuan-DiT 架构支持中英双语输入及理解
腾讯宣布混元文生图大模型全面升级并全面开源,支持中英文双语输入及理解,具有15亿参数量,在Hugging Face平台及GitHub上发布。Hunyuan-DiT架构的模型效果领先,支持多轮对话生成,并支持最多256字符的内容输入,具有国际领先水平。- 257
- 0
-
-
-
深度学习与人工智能领域的PyTorch核心操作详解
本文详细介绍了PyTorch在深度学习与人工智能领域的核心操作,包括张量的创建和基本操作,以及对应的代码示例,是学习PyTorch的必备指南。- 336
- 0
-
xLSTM: LSTM的扩展版本,解决了原有局限性
xLSTM是LSTM的扩展版本,解决了原有的局限性,并为深度学习方法和语言模型领域带来了新的突破。本文介绍了xLSTM的核心思想和对LSTM的优化,值得深入了解。- 887
- 0
-
大模型与AI发展趋势解析
本文分析了大模型及AI发展趋势,包括LLM、GenAI等相关概念,探讨了大模型领域的发展趋势和新秀企业的崛起。同时解析了大模型领域的模型精准度优化对比软件工程中的代码质量要求的不同。- 715
- 0
-
Deepseek发布了V2版本的模型,技术路线和性能优化详解
深度求索Deepseek近日发布了v2版本的模型,沿袭了1月发布的 Deepseek-MoE(混合专家模型)的技术路线,采用大量的小参数专家进行建模,同时在训练和推理上加入了更多的优化。V2模型在MMLU多选题benchmark上取得第二名,成本效率方面节约了42.5%的训练成本,推理时的KV-cache显存占用减少了93.3%,吞吐量提升到了原来的5.76倍。详情请查看技术报告。- 594
- 0
-
自监督学习在推荐系统中的作用和应用
了解自监督学习在推荐系统中的重要作用和应用,以及如何利用深度学习技术解决数据稀疏性问题。本文深入分析了SSL技术如何提升推荐系统的性能,并提供了超过170篇相关论文的综述。- 499
- 0
-
-
NVIDIA印度招聘AI工程师,要求深度学习和编码技能
NVIDIA正在印度招募经验丰富的AI工程师,要求候选人具有深度学习、自然语言处理和机器学习经验,熟练使用Python、PyTorch和TensorFlow编码。该职位需要工程背景,优先考虑计算机科学、信息技术、电气或电子专业。欢迎对NVIDIA软件平台和GPU开发有经验的候选人。- 608
- 0
-
脑机接口(BCI)的发展及未来应用前景
本文介绍了脑机接口(BCI)在神经-语音解码方面的最新进展,包括深度学习技术和语音合成器的应用,展望了未来在神经障碍患者交流能力恢复方面的潜在应用。同时还涉及了相关研究的突破性发现和开源代码资源。- 841
- 0
-
国产开源MoE大模型DeepSeek-V2火了,性能达GPT-4级别,API价格仅为百分之一
最新国产开源MoE大模型DeepSeek-V2性能达GPT-4级别,开源、可免费商用,API价格仅为GPT-4-Turbo的百分之一。立即体验内测版本,了解其在通用对话、代码助手等方面的强大能力。- 338
- 0
-
微软Start团队发布全新AI天气预测模型
微软Start团队最新发布了一种全新的数据驱动AI天气预测模型,结合了多种人工智能模型和深度学习架构,能够准确预测未来30天的天气情况,同时在计算效率上也实现了巨大突破。这一研究成果将对天气预测服务的发展产生积极影响,为农业生产、交通运输、能源管理等多个领域带来重要进展。- 426
- 0
-
深度学习历史转折:从AlexNet到大模型时代的演进
从2012年AlexNet开启的深度学习革命到如今的大模型时代,知名AI研究科学家Andrej Karpathy的帖子勾起了许多人对深度学习历史的回忆。文章讲述了AlexNet的创新之处以及当时深度学习研究所使用的工具,对深度学习的历史变革进行了回顾。- 590
- 0
-
OpenAI GPT-2模型性能及未来趋势分析
本文分析了OpenAI首席执行官Sam Altman在社交平台分享的GPT-2模型性能及未来趋势,探讨了其在移动设备上的应用潜力以及与其他大型科技公司的竞争关系。同时提出了对于小参数模型在移动设备上的优势和挑战。- 102
- 0
-
KAN:新一代神经网络架构的革命性变革
KAN是一种革命性的神经网络架构,通过将可学习的激活函数放置在边上而非节点上,实现了更高的精度和可解释性。文章介绍了KAN的理论基础、实现方式以及在科学研究和物理领域的潜在应用价值。- 572
- 0
-
扩散模型蒸馏算法:Hyper-SD的优化和加速
本文介绍了一种新型的扩散模型蒸馏框架——Hyper-SD,该框架结合了轨迹保持和重构策略的优点,实现了加速和优化的扩散模型推理过程,显著提升了图像生成和视频生成的性能。同时,该框架还在实验和用户评测中取得了卓越的成果。- 157
- 0
-
-
NeRF-XL: 多GPU扩展神经辐射场(NeRFs)的方法
本文介绍了NeRF-XL方法,通过多GPU高效分配神经辐射场(NeRFs),实现了对大规模和高细节特征场景的重建。论文探讨了方法的原理、设计和有效性,并提供了相关论文链接和项目链接。- 735
- 0
-
微软DeepSpeed团队在A100上成功实现FP6量化,带来显著性能提升
微软DeepSpeed团队在A100上成功实现FP6量化,带来明显的性能提升,大大加速了大模型的推理效果,为深度学习领域带来了重大突破。本文详细介绍了FP6量化的实现技术和其在A100上的性能对比结果。- 849
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!