发布于: 2025-7-7最后更新: 2025-7-7字数 00 分钟

slug
summary
tags
icon
password

刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3

阿里巴巴通义实验室推出WebSailor,通过创新的后训练方法显著提升开源模型在复杂网页推理任务中的表现,成功挑战BrowseComp基准,缩小了开源与闭源模型之间的能力差距。该模型在高不确定性任务中展现出强大的推理能力,未来有望在更多领域应用。

彻底戳穿AI「失忆症」!超越OpenAI全局记忆,中国队开源LLM记忆操作系统

中国团队开发了MemOS,一个开源的AI记忆管理框架,旨在解决大语言模型的记忆缺失问题,实现长期记忆和个性化交互,提升AI助手的智能化水平。该框架通过三种记忆类型的统一调度,显著提高了模型的效率和准确性。

AI 上新|这款 AI 浏览器,让我惊喜,又有点「后怕」

Dia是一款重新定义浏览器的AI工具,能够直接理解和处理网页内容,帮助用户高效完成任务。它通过对话框与用户互动,自动提取信息并生成总结,改变了传统浏览器的使用方式,提升了上网体验,但也引发了对依赖AI的担忧。

伯克利最强代码Agent屠榜SWE-Bench!用Scaling RL打造,配方全公开

DeepSWE是一个开源软件工程模型,通过纯强化学习实现了59%的准确率,显著刷新了现有基准。该模型使用模块化的训练框架和独特的算法,支持高效的SWE环境管理,并开源了所有训练代码和数据集。研究人员通过扩展上下文长度和代理部署提升了模型性能,展示了在AI编程领域的重大进展。

Stream-Omni:同时支持各种模态组合交互的文本-视觉-语音多模态大模型

Stream-Omni是一个支持文本、视觉和语音的多模态大模型,能够实现灵活的模态组合和高效的模态对齐,特别是在语音交互中同步输出中间文本结果,提升用户的交互体验。该模型通过创新的语音建模方式,减少对大规模数据的依赖,展现出在多模态交互中的优势。

Loading...
懒人客服-将ChatGPT轻松接入各种平台

懒人客服-将ChatGPT轻松接入各种平台

懒人客服是一个基于 LLM 大语言模型的知识库的集成客服系统,支持多种平台接入,包括微信、企业微信、千牛、哔哩哔哩、抖音企业号、抖音、抖店、微博聊天、小红书专业号运营、小红书、知乎等。它提供预设回复内容、智能生成回复、发送图片和二进制文件、知识库功能以及插件系统访问操作系统和互联网等外部资源的功能。


Meta高薪挖角AI人才;Veo 3生成气泡水广告走红;RoboRefer提升机器人空间理解;HarmoniCa框架加速扩散模型;AI梦之队战力飙升30% | 07月06日AI资讯

Meta高薪挖角AI人才;Veo 3生成气泡水广告走红;RoboRefer提升机器人空间理解;HarmoniCa框架加速扩散模型;AI梦之队战力飙升30% | 07月06日AI资讯

Meta通过高薪挖角AI人才,而OpenAI则注重培养新人才;Veo 3的AI广告走红,展示了音画同步功能;RoboRefer提升机器人空间理解能力;HarmoniCa框架加速扩散模型训练与推理;AI梦之队的多模型组合显著提升推理能力,解决超过30%问题。