slug
summary
tags
icon
password
GPT-5.4 全整理:非常好用,非常贵
OpenAI发布了最新模型GPT-5.4,分为标准版和Pro版,分别针对不同用户群体。GPT-5.4整合了代码能力、通用推理和计算机使用能力,具有更高的准确性和处理复杂任务的能力。模型在多个评测中表现优异,尤其在电子表格和演示文稿生成方面有显著提升。定价方面,标准版API为$2.50/M输入,$15/M输出,Pro版则为标准版的12倍。新模型逐步取代旧版,预计在未来几个月内全面上线。
基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁
腾讯混元团队提出了HY-WU范式,解决了大模型微调中的「灾难性遗忘」问题,打破了静态权重的限制。该范式引入功能性记忆,允许模型在推理时实时生成个性化参数,以适应不同任务和样本。HY-WU在图像编辑任务中表现出色,提升了内容理解和生成质量,同时具备高效的训练和推理能力。未来的研究将探索功能性记忆在其他领域的应用及其在线持续学习的潜力。
水滴公司首推「水守 AI 助手」ClawSquare 构建 Agent 协同办公新范式
水滴公司推出了「水守 AI 助手」ClawSquare,旨在通过分布式的 Agent 网络重构组织的协作方式,打破 AI 孤岛,实现无摩擦的24小时协作。该系统允许不同功能的 Agent 独立工作并动态协作,提升了工作效率,减少了传统沟通中的低技术含量损耗。未来,水滴希望通过这种 AI 原生的协作模式,解决知识断层问题,实现组织的数字化转型。
不同灵巧手,终于可以共用「一套大脑」了
研究团队提出了一种规范化的灵巧手表示框架,旨在解决不同灵巧手之间的控制策略共享与迁移问题。通过统一的参数空间与动作空间,该方法能够有效支持跨手型的策略学习,实现零样本泛化。实验结果表明,规范化表示在真实环境中保持了原始手部模型的动力学特性,显示出良好的跨形态泛化能力,具有广泛的应用潜力。
YC总裁转发、登顶Hacker News:SkillsBench揭开Agent技能扩展的残酷真相
一篇关于Agent技能扩展的论文引发了广泛关注,揭示了人工构建的技能能显著提升智能体的成功率,而AI自生成的技能则可能导致性能下降。研究表明,最佳实践是使用2-3个高质量技能,并强调聚焦而非详尽的文档。随着各大平台的跟进,技能标准化正在形成,未来AI应用的成功在于将行业知识转化为标准化的Agent技能。
GPU时代落幕?硅谷巨头集体「叛逃」,英伟达1500亿疯狂自救
随着去GPU化的趋势加速,英伟达面临客户流失,OpenAI和Anthropic等公司转向谷歌的TPU以提高能效和降低延迟。英伟达的市场份额受到威胁,未来的竞争焦点将转向能效比和响应速度,而非单纯的算力规模。谷歌TPU的商业化成功和新兴公司如Groq的技术创新,标志着算力市场的格局正在发生根本性变化。
小鹏加速冲向L4终局:对VLA架构「动刀」成关键一环
小鹏汽车通过第二代VLA实现了从视觉信号到动作指令的端到端生成,解决了传统架构中语言转译带来的信息损失问题。新技术提升了驾驶安全性和效率,支持全场景辅助驾驶,并在复杂环境中表现出色。小鹏的底层技术架构经过重构,结合了多模态感知、超密集视觉推理和高效算力,推动了物理AI的发展,预计在未来三年内将成为汽车行业的重要突破。
上一篇
Vozo-根据文案自动配音并编辑视频
下一篇
03月06日AI资讯 | OpenAI筹备2026年IPO;GPT-5.4将具备极限推理能力;博通AI业务收入达84亿美元;Seedance 2.0视频生成成本降至1秒1元;阿里通义实验室换帅
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/31c629a6-152d-8194-bf64-e83ad936639a
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。


