slug
summary
tags
icon
password
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!
提出了段级策略优化(SPO)框架,通过中等粒度的优势值估计解决大语言模型的信用分配问题,显著提升推理能力。SPO框架灵活且高效,适用于不同推理场景,实验结果表明其在短和长思维链场景下均表现优于传统方法。
苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
苹果最新论文质疑现有推理模型的思考能力,认为它们仅是模式匹配,无法应对高复杂度任务。实验显示,低复杂度下标准模型表现更佳,而高复杂度时所有模型均崩溃,呼吁改进推理机制和评估方法。苹果在AI领域的进展缓慢,面临内部资源不足和管理问题。
Hinton梦想的AI医生要来了!斯坦福哈佛实测:o1以78%正确率超人类
OpenAI的o1-preview在医疗诊断中表现超越人类医生,准确率达到78%。研究显示,AI在急诊室和临床案例中提供的第二意见可靠,未来可能重塑医疗诊断流程。专家建议医生应利用AI作为辅助工具。
打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准
UNITE框架由快手与东北大学联合提出,旨在解决多模态检索中的跨模态干扰问题,通过模态感知对比学习显著提升文本、图像和视频的检索性能。在多个评测中,UNITE表现优异,超越现有模型,展现了强大的通用性和细粒度检索能力。
告别「失忆」AI!首个大模型记忆操作系统开源框架来了!
北邮百家 AI 团队推出开源的记忆操作系统 MemoryOS,旨在解决大语言模型在长期对话中的记忆问题,通过三级存储架构和四大核心模块实现高效的记忆管理,显著提升上下文连贯性和个性化交互体验。该系统在基准测试中表现优异,推动 AI 向更深层次的认知智能发展。
上一篇
硅基流动获阿里云数亿元融资;首创像素空间推理7B模型领先GPT-4o;Meta百亿美元投资Scale AI;华为昇腾万卡集群揭秘;Time-R1模型超越DeepSeek | 06月09日AI资讯
下一篇
北京智源大会发布悟界系列大模型;全球数学家对决OpenAI AI接近天才水平;小红书开源大模型dots.llm1;Claude 4推动AGI革命;Mary Meeker报告AI推理成本暴跌 | 06月07日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/20c629a6-152d-817a-b02f-c03be114201b
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。