Kimi开源线性注意力架构推理速度提升6倍；OpenAI发布Atlas浏览器重定义AI交互；1X发布14万家用机器人Neo；港科大ROVER算法革新LLM推理；范浩强团队VLA模型单卡4090跑30fps | 11月01日AI资讯

slug

summary

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

Kimi开源的线性注意力架构首次在相同训练条件下超越全注意力模型，推理速度提升6倍，同时减少75%的KV缓存需求。其核心创新Kimi Delta Attention（KDA）通过细粒度遗忘门控和改进的增量学习规则，确保在超长上下文中稳定运行。模型采用混合层设计，结合线性和全注意力机制，且无需改变缓存管理即可与现有系统无缝对接，展现出在多个基准测试中的优越性能，预示着AI架构向多元创新时代迈进。

🔗访问原文

OpenAI 公开 Atlas 架构：为 Agent 重新发明浏览器

OpenAI 发布了 Atlas，一个为 Agent 设计的浏览器，能够完整渲染界面而无需逐个点击元素。Atlas 采用独立的 Swift 应用与后台运行的 Chromium 通过 IPC 通信，确保快速启动和不崩溃。该架构支持高效开发，允许新员工迅速提交代码，同时实现了多会话隔离和安全性。Atlas 通过合成弹窗回主页面，提供完整的屏幕截图，满足 AI 的需求。整体上，Atlas 重新定义了浏览器架构，以适应 AI 的使用场景。

🔗访问原文

花14万，请一个远在美国的人替你操控家里的机器人

1X Technologies推出了家用人形机器人Neo，售价约14万人民币，预计2026年发货。尽管具备一定的自动化能力，但大部分操作仍需依赖远程操作者控制，导致隐私问题。Neo的设计强调安全与灵活性，目标是通过家庭环境收集真实数据以提升智能水平。尽管面临竞争，1X希望借此抢占家用机器人市场的先机。

🔗访问原文

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

香港科技大学提出了一种新算法ROVER，通过对完全随机策略进行价值评估，显著提升大语言模型在数学推理任务中的表现。该方法避免了传统强化学习的复杂性，提升了推理的质量和多样性，实验结果显示ROVER在多个基准测试中超越现有方法，尤其在pass@1和pass@256指标上有显著提高，同时策略多样性也提升了17.6%。ROVER的成功表明，在某些结构化任务中，简化方法可能更有效。

🔗访问原文

单张4090跑到30fps，范浩强团队让VLA大模型实时跑起来了

VLA大模型在单张RTX 4090显卡上实现了30fps的实时运行，研究者通过优化模型结构将推理时间显著缩短，解决了机器人实时控制中的延迟问题。未来计划构建一个围绕GPU的机器人控制框架，支持超快反应、视觉反应和智能思考，展望更高的处理速度和更大的模型规模，以实现更智能的机器人控制系统。

🔗访问原文

奥特曼豪赌万亿算力，OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

OpenAI正在以巨额投资争夺全球算力，尤其是GPU，以支持其AI模型的快速增长。随着GPT-5的发布，OpenAI的估值飙升至5000亿美元，周活跃用户超过8亿，API调用量激增20倍。中国的开源模型表现出色，多个国产模型进入前20名。AI的未来竞争将聚焦于算力的高效和经济性，OpenAI的合作伙伴关系和芯片设计将进一步推动其在行业中的领导地位。

🔗访问原文

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

OpenAI 公开 Atlas 架构：为 Agent 重新发明浏览器

花14万，请一个远在美国的人替你操控家里的机器人

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

单张4090跑到30fps，范浩强团队让VLA大模型实时跑起来了

奥特曼豪赌万亿算力，OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

AI学长小林

交流频道

加入我们的社群讨论分享