slug
summary
tags
icon
password
英伟达韩松团队新作:具有后神经架构搜索的高效语言模型
英伟达韩松团队推出了新型高效语言模型Jet-Nemotron,基于后神经架构搜索,具有显著的性能提升。在多个基准测试中,该模型在准确率和生成吞吐量上超过了Qwen系列模型,并实现了高达53.6倍的加速。Jet-Nemotron的设计包括优化全注意力层的放置、选择最佳线性注意力模块和执行硬件感知架构搜索。团队计划开源代码和模型,进一步推动语言模型的研究与应用。
英伟达通用机器人芯片来了:AI算力提升7.5倍,宇树、银河通用已搭载
英伟达发布了新一代机器人专用芯片Jetson Thor,算力提升7.5倍,支持人形机器人和生成式AI模型。该芯片具备高效能和低功耗,内存和显存带宽也有显著提升,旨在增强机器人自主观察和决策能力。多家国内机器人公司已宣布将搭载该芯片,英伟达在AI和机器人领域的布局将推动未来市场增长。
最新智能体自动操作手机电脑,10个榜单开源SOTA全拿下|通义实验室
通义实验室推出的Mobile-Agent-v3智能体框架在多个核心榜单上取得开源最佳,能够自动操作手机和电脑,执行复杂任务并适应多智能体环境。该框架通过自我进化轨迹生产和强化学习技术,提升了模型的决策能力和任务执行效率,支持知识演进和任务规划,形成闭环自动化流程,显著提高了成功率。
ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术
研究发现最新的ChatGPT模型中文词表中有46.6%的污染词,主要涉及成人内容和在线赌博,导致模型在处理这些词时性能下降约50%。研究团队定义了中文污染词,构建了自动识别模型,并提出了污染数据治理的轻量化方案,以期改善大语言模型的训练语料质量。
教AI「择偶生娃」,复刻自然演化!上交校友提名最佳论文
Sakana AI提出了一种新模型融合方法M2N2,灵感来自自然演化,通过引入竞争和吸引力机制,提升AI模型的融合效果。该方法模仿自然界的择偶机制,允许模型在资源有限的情况下竞争和合作,创造多样化的高性能模型群体。M2N2在多个实验中表现优于传统方法,成功避免了模型微调中的灾难性遗忘,并在大型预训练模型上展现了显著优势。
榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒
中兴通讯与华东师范大学联合开发的Mariana技术,通过细粒度并发控制、定制数据布局和自适应缓存策略,显著提升了大模型推理的KV Cache性能,解决了显存瓶颈问题。该技术能够支持大容量存储、高吞吐和低延迟,适应未来CXL硬件生态,推动大规模分布式推理的应用。随着技术的成熟,百亿参数模型将在普通硬件上高效运行,促进AI算力的普及。
为防AI刷题,Nature等顶刊最新封面被做成数据集,考验模型科学推理能力|上海交通大学
上海交通大学的研究团队提出了MAC基准,通过使用188种顶级期刊的最新封面,评估多模态大模型的科学推理能力。研究发现,尽管顶尖模型在视觉识别方面表现出色,但在理解复杂科学概念时存在局限性。为解决这一问题,团队提出了DAD方法,通过分步思考提高模型表现。此外,MAC基准采用动态数据和问题构建机制,以确保持续的挑战性,未来计划扩展到更多科学期刊和动态科学内容。
上一篇
爆款短视频自动翻拍工作流~ #ai工作流 #aiagents #n8n
下一篇
钉钉推出AI 1.0重构工作方式;Video Ocean接入GPT-5革新视频创作;Yoshua Bengio成历史最高引学者;南大TeleAI突破长视频生成瓶颈;英伟达发布最强迷你PC | 08月25日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/25b629a6-152d-81a2-a061-fa36d90e876e
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。