SPO新范式提升大模型推理能力；苹果质疑推理模型能力；OpenAI o1医疗诊断超人类；UNITE框架横扫多模态检索基准；MemoryOS解决大模型记忆问题 | 06月08日AI资讯

slug

summary

提出了段级策略优化（SPO）框架，通过中等粒度的优势值估计解决大语言模型的信用分配问题，显著提升推理能力。SPO框架灵活且高效，适用于不同推理场景，实验结果表明其在短和长思维链场景下均表现优于传统方法。

苹果最新论文质疑现有推理模型的思考能力，认为它们仅是模式匹配，无法应对高复杂度任务。实验显示，低复杂度下标准模型表现更佳，而高复杂度时所有模型均崩溃，呼吁改进推理机制和评估方法。苹果在AI领域的进展缓慢，面临内部资源不足和管理问题。

OpenAI的o1-preview在医疗诊断中表现超越人类医生，准确率达到78%。研究显示，AI在急诊室和临床案例中提供的第二意见可靠，未来可能重塑医疗诊断流程。专家建议医生应利用AI作为辅助工具。

UNITE框架由快手与东北大学联合提出，旨在解决多模态检索中的跨模态干扰问题，通过模态感知对比学习显著提升文本、图像和视频的检索性能。在多个评测中，UNITE表现优异，超越现有模型，展现了强大的通用性和细粒度检索能力。

北邮百家 AI 团队推出开源的记忆操作系统 MemoryOS，旨在解决大语言模型在长期对话中的记忆问题，通过三级存储架构和四大核心模块实现高效的记忆管理，显著提升上下文连贯性和个性化交互体验。该系统在基准测试中表现优异，推动 AI 向更深层次的认知智能发展。

AI学长小林