slug
summary
tags
icon
password
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
阿里巴巴通义实验室推出WebSailor,通过创新的后训练方法显著提升开源模型在复杂网页推理任务中的表现,成功挑战BrowseComp基准,缩小了开源与闭源模型之间的能力差距。该模型在高不确定性任务中展现出强大的推理能力,未来有望在更多领域应用。
彻底戳穿AI「失忆症」!超越OpenAI全局记忆,中国队开源LLM记忆操作系统
中国团队开发了MemOS,一个开源的AI记忆管理框架,旨在解决大语言模型的记忆缺失问题,实现长期记忆和个性化交互,提升AI助手的智能化水平。该框架通过三种记忆类型的统一调度,显著提高了模型的效率和准确性。
AI 上新|这款 AI 浏览器,让我惊喜,又有点「后怕」
Dia是一款重新定义浏览器的AI工具,能够直接理解和处理网页内容,帮助用户高效完成任务。它通过对话框与用户互动,自动提取信息并生成总结,改变了传统浏览器的使用方式,提升了上网体验,但也引发了对依赖AI的担忧。
伯克利最强代码Agent屠榜SWE-Bench!用Scaling RL打造,配方全公开
DeepSWE是一个开源软件工程模型,通过纯强化学习实现了59%的准确率,显著刷新了现有基准。该模型使用模块化的训练框架和独特的算法,支持高效的SWE环境管理,并开源了所有训练代码和数据集。研究人员通过扩展上下文长度和代理部署提升了模型性能,展示了在AI编程领域的重大进展。
Stream-Omni:同时支持各种模态组合交互的文本-视觉-语音多模态大模型
Stream-Omni是一个支持文本、视觉和语音的多模态大模型,能够实现灵活的模态组合和高效的模态对齐,特别是在语音交互中同步输出中间文本结果,提升用户的交互体验。该模型通过创新的语音建模方式,减少对大规模数据的依赖,展现出在多模态交互中的优势。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/229629a6-152d-819c-bccf-ef2d254830b3
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。