slug
summary
tags
icon
password
Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍
Kimi开源的线性注意力架构首次在相同训练条件下超越全注意力模型,推理速度提升6倍,同时减少75%的KV缓存需求。其核心创新Kimi Delta Attention(KDA)通过细粒度遗忘门控和改进的增量学习规则,确保在超长上下文中稳定运行。模型采用混合层设计,结合线性和全注意力机制,且无需改变缓存管理即可与现有系统无缝对接,展现出在多个基准测试中的优越性能,预示着AI架构向多元创新时代迈进。
OpenAI 公开 Atlas 架构:为 Agent 重新发明浏览器
OpenAI 发布了 Atlas,一个为 Agent 设计的浏览器,能够完整渲染界面而无需逐个点击元素。Atlas 采用独立的 Swift 应用与后台运行的 Chromium 通过 IPC 通信,确保快速启动和不崩溃。该架构支持高效开发,允许新员工迅速提交代码,同时实现了多会话隔离和安全性。Atlas 通过合成弹窗回主页面,提供完整的屏幕截图,满足 AI 的需求。整体上,Atlas 重新定义了浏览器架构,以适应 AI 的使用场景。
花14万,请一个远在美国的人替你操控家里的机器人
1X Technologies推出了家用人形机器人Neo,售价约14万人民币,预计2026年发货。尽管具备一定的自动化能力,但大部分操作仍需依赖远程操作者控制,导致隐私问题。Neo的设计强调安全与灵活性,目标是通过家庭环境收集真实数据以提升智能水平。尽管面临竞争,1X希望借此抢占家用机器人市场的先机。
港科提出新算法革新大模型推理范式:随机策略估值竟成LLM数学推理「神操作」
香港科技大学提出了一种新算法ROVER,通过对完全随机策略进行价值评估,显著提升大语言模型在数学推理任务中的表现。该方法避免了传统强化学习的复杂性,提升了推理的质量和多样性,实验结果显示ROVER在多个基准测试中超越现有方法,尤其在pass@1和pass@256指标上有显著提高,同时策略多样性也提升了17.6%。ROVER的成功表明,在某些结构化任务中,简化方法可能更有效。
单张4090跑到30fps,范浩强团队让VLA大模型实时跑起来了
VLA大模型在单张RTX 4090显卡上实现了30fps的实时运行,研究者通过优化模型结构将推理时间显著缩短,解决了机器人实时控制中的延迟问题。未来计划构建一个围绕GPU的机器人控制框架,支持超快反应、视觉反应和智能思考,展望更高的处理速度和更大的模型规模,以实现更智能的机器人控制系统。
奥特曼豪赌万亿算力,OpenAI估值万亿美元 | 新智元ASI产业图谱10月号
OpenAI正在以巨额投资争夺全球算力,尤其是GPU,以支持其AI模型的快速增长。随着GPT-5的发布,OpenAI的估值飙升至5000亿美元,周活跃用户超过8亿,API调用量激增20倍。中国的开源模型表现出色,多个国产模型进入前20名。AI的未来竞争将聚焦于算力的高效和经济性,OpenAI的合作伙伴关系和芯片设计将进一步推动其在行业中的领导地位。
上一篇
AI资讯-11月02日
下一篇
字节发布通用游戏智能体Game-TARS;OpenAI支付微软2500亿美元分手费;腾讯开源FlashWorld单GPU秒级生成3D场景;Anthropic发现Claude具备内省能力;阿里Wan2.5-Preview推动AI视频质变 | 10月31日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/29e629a6-152d-8144-be79-eba4b924e6a1
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。