AI日报
Kimi开源线性注意力架构推理速度提升6倍;OpenAI发布Atlas浏览器重定义AI交互;1X发布14万家用机器人Neo;港科大ROVER算法革新LLM推理;范浩强团队VLA模型单卡4090跑30fps | 11月01日AI资讯
00 分钟
2025-11-1
2025-11-1
slug
summary
tags
icon
password

Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

Kimi开源的线性注意力架构首次在相同训练条件下超越全注意力模型,推理速度提升6倍,同时减少75%的KV缓存需求。其核心创新Kimi Delta Attention(KDA)通过细粒度遗忘门控和改进的增量学习规则,确保在超长上下文中稳定运行。模型采用混合层设计,结合线性和全注意力机制,且无需改变缓存管理即可与现有系统无缝对接,展现出在多个基准测试中的优越性能,预示着AI架构向多元创新时代迈进。

OpenAI 公开 Atlas 架构:为 Agent 重新发明浏览器

OpenAI 发布了 Atlas,一个为 Agent 设计的浏览器,能够完整渲染界面而无需逐个点击元素。Atlas 采用独立的 Swift 应用与后台运行的 Chromium 通过 IPC 通信,确保快速启动和不崩溃。该架构支持高效开发,允许新员工迅速提交代码,同时实现了多会话隔离和安全性。Atlas 通过合成弹窗回主页面,提供完整的屏幕截图,满足 AI 的需求。整体上,Atlas 重新定义了浏览器架构,以适应 AI 的使用场景。

花14万,请一个远在美国的人替你操控家里的机器人

1X Technologies推出了家用人形机器人Neo,售价约14万人民币,预计2026年发货。尽管具备一定的自动化能力,但大部分操作仍需依赖远程操作者控制,导致隐私问题。Neo的设计强调安全与灵活性,目标是通过家庭环境收集真实数据以提升智能水平。尽管面临竞争,1X希望借此抢占家用机器人市场的先机。

港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」

香港科技大学提出了一种新算法ROVER,通过对完全随机策略进行价值评估,显著提升大语言模型在数学推理任务中的表现。该方法避免了传统强化学习的复杂性,提升了推理的质量和多样性,实验结果显示ROVER在多个基准测试中超越现有方法,尤其在pass@1和pass@256指标上有显著提高,同时策略多样性也提升了17.6%。ROVER的成功表明,在某些结构化任务中,简化方法可能更有效。

单张4090跑到30fps,范浩强团队让VLA大模型实时跑起来了

VLA大模型在单张RTX 4090显卡上实现了30fps的实时运行,研究者通过优化模型结构将推理时间显著缩短,解决了机器人实时控制中的延迟问题。未来计划构建一个围绕GPU的机器人控制框架,支持超快反应、视觉反应和智能思考,展望更高的处理速度和更大的模型规模,以实现更智能的机器人控制系统。

奥特曼豪赌万亿算力,OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

OpenAI正在以巨额投资争夺全球算力,尤其是GPU,以支持其AI模型的快速增长。随着GPT-5的发布,OpenAI的估值飙升至5000亿美元,周活跃用户超过8亿,API调用量激增20倍。中国的开源模型表现出色,多个国产模型进入前20名。AI的未来竞争将聚焦于算力的高效和经济性,OpenAI的合作伙伴关系和芯片设计将进一步推动其在行业中的领导地位。
上一篇
AI资讯-11月02日
下一篇
字节发布通用游戏智能体Game-TARS;OpenAI支付微软2500亿美元分手费;腾讯开源FlashWorld单GPU秒级生成3D场景;Anthropic发现Claude具备内省能力;阿里Wan2.5-Preview推动AI视频质变 | 10月31日AI资讯