slug
summary
tags
icon
password
仅0.2B就比GPT-4.1强?加州大学新指标:组合推理基准首次超越人类
加州大学河滨分校的研究团队提出了新的评测指标GroupMatch和算法Test-Time Matching(TTM),使得GPT-4.1在Winoground测试中首次超越人类表现,且仅0.2B参数的SigLIP-B16在MMVP-VLM基准测试中刷新了最佳结果。这表明AI的组合推理能力早已存在,只需合适的方法在测试阶段解锁。TTM通过自我迭代提升模型性能,适用于多种数据集,推动了多模态推理研究的进展。
终结Transformer统治!清华姚班校友出手,剑指AI「灾难性遗忘」
研究人员提出了一种新的「嵌套学习」架构,以解决大模型的「灾难性遗忘」问题。该架构将模型视为多个相互嵌套的优化问题,允许更深层次的学习和自我改进。实验表明,基于这一架构的「Hope」模型在语言建模和长上下文记忆任务中表现优于传统的Transformer模型,标志着机器学习向持续学习的新阶段迈进。
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
UCSD和英特尔的研究人员提出了新的多智能体强化学习框架PettingLLMs,显著提升了大语言模型的训练效率。该框架支持多智能体协作,解决了现有单智能体训练的局限性。实验结果显示,在长规划任务中,任务性能从14%提升至96%,并在代码生成和数学推理任务中也取得了显著进展。通过支持不同模型和智能体的灵活映射,该框架实现了跨任务、跨规模的通用强化学习算法。
ICCV涌现自动驾驶新范式:统一世界模型VLA,用训练闭环迈向L4
在ICCV 2025会议上,特斯拉和理想汽车展示了自动驾驶技术的新趋势,强调从数据闭环转向训练闭环的重要性。理想汽车提出通过构建云端世界模型训练环境,结合强化学习来提升自动驾驶能力,并实现了全球首个将世界模型与强化学习闭环落地于量产系统的架构。此外,理想的星环OS系统通过开源促进了行业发展,提供了高质量的3D数据集3DRealCar,助力自动驾驶技术的进步。
AI六巨头罕见同台!李飞飞激辩LeCun,黄仁勋:你们都错了
六位AI领域顶尖人物因共获伊丽莎白女王工程奖而聚集,展开关于AI革命的激辩。讨论了AI的真实价值与潜在泡沫,分享了各自的顿悟时刻,强调数据和算力的重要性。黄仁勋认为AI正在创造全新行业,而李飞飞和LeCun则探讨了AI的未来与人类智能的关系,提出AI仍有广阔的前沿领域待开拓。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/2a6629a6-152d-8171-bbf6-e0aa34242a59
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。