全部标签

深度学习

长上下文模型LLM能力分析及独立研究结果揭示

本文分析了当前长上下文模型LLM的能力及近期独立研究结果揭示，探讨了其推理能力以及对NoCha数据集的验证。了解LLM在理解长上下文内容上的表现，以及独立研究者如何通过NoCha数据集进行模型评估。
AI资讯
- 238
- 0
新智元7月23日
NeuralGCM: 预测未来天气的新技术

NeuralGCM是一种结合了传统天气和气候模型与机器学习技术的新型神经通用循环模型，能够准确预测未来几天甚至几十年的天气和气候。本文介绍了NeuralGCM的创新之处、应用前景以及对气候科学领域的重要意义。
AI资讯
- 652
- 0
AICMTY7月23日
Fish Speech：开源TTS项目，高效语音转换工具

Fish Speech是一个开源TTS项目，通过深度学习实现高效语音转换，支持多语言、语音克隆技术以及多样的语音模型。与其他TTS模型相比，Fish Speech展现出了稳定性和可用性优势，适合个性化语音需求。
AI教程
- 159
- 0
IT咖啡馆7月22日
2024年微软发布GraphRAG项目论文解决全局理解缺陷

2024年4月，微软发表了一篇论文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》，介绍了一种解决Baseline RAG系统全局理解缺陷的方法。该方法通过文本构建知识图来增强全局理解，并在Github开源了GraphRAG项目代码，展开介绍了项目构建过程并使用Deepseek-chat模型和Zh…
AI教程
- 459
- 0
0xHyde7月21日
OpenAI视频压缩网络：核心技术和技术难点分析

本文介绍了OpenAI开发的视频压缩网络核心技术以及技术难点，包括使用Sora和Transformers模型进行视频生成的方法。与此同时，文章讨论了压缩率、模型结构优化和多模态支持等相关问题。
AI教程
- 732
- 0
前端小凝7月20日
OpenAI最新技术研究：Prover-Verifier-Games详解

OpenAI发布了最新技术研究Prover-Verifier-Games，通过博弈论训练框架提升GPT模型输出质量，进一步提高模型的可控性和准确性。了解Prover-Verifier-Games的核心思想和训练方法，在法律、金融等领域的应用前景广阔。
AI资讯
- 434
- 0
AIGC开放社区7月18日
QLORA微调ChatGLM3-6B模型 – 提高参数效率的新技术

了解QLORA如何通过低秩矩阵和量化技术提高ChatGLM3-6B模型的参数效率，为特定任务调整和专门化提供新方法。
AI教程
- 233
- 0
CodeDevMaster7月16日
OpenAI新项目草莓(Strawberry)揭秘及推理能力分析

OpenAI最新项目草莓(Strawberry)揭秘，据称具有推理能力，能自主浏览网页及进行深度研究。分析其在AI领域的重要性和未来发展。
AI资讯
- 457
- 0
新智元7月14日
Andrej Karpathy发布llm.c项目：用1000行代码实现GPT-2训练，受到热烈关注

前特斯拉Autopilot负责人Andrej Karpathy发布llm.c项目，仅用1000行代码在CPU/fp32上实现GPT-2训练，受到热烈关注。项目旨在简化大型语言模型训练，移除复杂性，使用C语言/CUDA直接与计算机对话，无需PyTorch。
AI教程
- 381
- 0
机器之心7月7日
探索腾讯元宝深度搜索模式：AI的高级功能解析

探索腾讯元宝深度搜索模式，了解AI在研究报告中的高级功能。了解AI技术的新进展，以及腾讯元宝在搜索引擎领域的优化设计。
AI资讯
- 491
- 0
量子位7月3日
大语言模型及神经网络工作原理分析

本文分析了大语言模型和神经网络的工作原理，包括大模型训练过程、大模型如何预测下一个词，以及感知器的作用。通过对参数文件和代码文件的介绍，解释了大模型是如何依靠神经网络进行预测的。
AI教程
- 479
- 0
京东云开发者7月1日
VideoPipe：强大易用的视频分析框架

VideoPipe是一个灵活易用的跨平台视频结构化和分析框架，集成先进的深度学习模型支持目标跟踪与行为分析，适用于监控、安防等领域。欢迎探索这个强大的视频分析工具箱！
AI教程
- 502
- 0
辣码甄源6月23日
DeepFuze

ComfyUI-DeepFuze是一款革命性的深度学习工具，用于面部转换和视频生成。
个性化视频生成器
- 494
- 0
AI应用发布6月21日
Character.ai：AI推理成本降低到1/33的秘密优化技巧

Character.ai是一家处理AI推理请求的独角兽公司，通过内存高效架构设计和精度量化训练等优化技巧，成功将推理成本降低到最初的1/33。了解Character.ai的独门秘诀，实现AI推理成本的革命性优化。
AI资讯
- 548
- 0
量子位6月21日
NLP大模型在Colab上的应用指南

了解如何在Colab上使用NLP大模型进行机器学习项目开发。Colab提供免费GPU资源和云端集成开发环境，方便用户进行各种NLP任务。同时，探索Hugging Face社区的丰富资源库和合作网络，加速技术创新和知识交流。
AI教程
- 511
- 0
July_lly6月19日
如何使用ChatGLM2-6B模型进行大模型操作指南

本文介绍了如何选择和加载ChatGLM2-6B模型进行大模型操作，并提供了详细的指导和代码示例，适合深度学习爱好者和技术研究人员阅读。
AI教程
- 177
- 0
吳YH堅6月19日
AI教父Geoffrey Hinton对AI智能的理解及未来展望

AI教父Geoffrey Hinton在最近的采访中表达了对AI智能的理解，包括其对LLM理解能力的看法以及对ASI安全和飞速发展的关注。文章探讨了Hinton对AI未来发展的预测，以及他与AI技术的斗争和警告。
AI资讯
- 259
- 0
新智元6月18日
YaFSDP

高效的分布式数据并行框架，专为大型语言模型设计。
开发者工具
- 880
- 0
AI应用发布6月15日
从零开始实现GPT-2模型教程 – Karpathy AI大课SEO优化指南

了解如何从零开始实现GPT-2模型，Karpathy AI大课带您深入学习神经网络和深度学习技术。本教程涵盖了GPT-2模型的构建、优化和训练过程，让您轻松搭建自己的人工智能模型。
AI资讯
- 818
- 0
新智元6月12日
ChatGPT Extension

ChatGPT浏览器扩展是一个用于交互性文本响应的扩展，能够提供智能对话体验。
未分类
- 360
- 0
AI应用发布6月11日
Debriefs AI

智能媒体分析，简化复杂话题，深入行业洞见。
投资助手
- 134
- 0
AI应用发布6月11日
实现一个1.2B模型的分词算法探究及实践

本文将探讨实现一个1.2B模型所需的分词算法选择及实践，介绍了基于字词的subword分词算法以及BPE、WordPiece、Unigram等不同算法的特点。
AI教程
- 173
- 0
Pickup6月10日
NopeCHA

NopeCHA是一款由人工智能驱动的CAPTCHA解决器。
未分类
- 803
- 0
AI应用发布6月9日
Colorify

Colorify通过颜色编码语法来增强可读性，使得阅读更加流畅和舒适。
未分类
- 330
- 0
AI应用发布6月7日