slug
summary
05月07日AI资讯汇总了多项行业突破:Meta与斯坦福的极限基准测试让主流模型得分为零,显示复杂推理仍受限;Anthropic推出“做梦”功能提升Agent性能,并租用22万张GPU大幅提升Claude算力;13人团队提出SSA架构宣称算力降千倍、成本仅为Opus的5%;月之暗面完成20亿美元新融资,估值超过200亿美元,豆包发布首个全模态理解模型;周衔团队发布首个具身基础模型,实现烹饪、实验、弹琴等多任务;OpenAI公开大规模训练技术细节,惠及芯片厂商;G²RPO-A方法提升小模型推理能力;机器人团队获1亿美元种子轮,展示单模型多精细操作的突破。
tags
icon
password
刷榜AI全挂了!Meta斯坦福地狱级测试,GPT/Claude/Gemini交出0分
Meta和斯坦福联合推出了一项极其严苛的AI基准测试,目前包括GPT、Claude、Gemini在内的主流AI模型全部得分为0,这表明当前AI在复杂推理任务上仍存在重大局限,揭示了AI发展的关键瓶颈。
Anthropic 上线「做梦」功能,让 Agent 越睡越聪明
Anthropic推出了一项创新功能,让AI Agent在类似'睡眠'的状态下进行自我改进和知识整合,大幅提升Agent性能,一夜之间能力暴涨6倍,代表了AI Agent自我进化方向的重要突破。
13人干翻Transformer!新架构SSA算力暴减千倍,成本仅Opus 5%
仅13人的团队提出全新SSA架构,声称算力需求暴减千倍,成本仅为Opus模型的5%,有望颠覆Transformer主导地位,是AI架构领域的重大突破性进展。
Anthropic 刚刚租下马斯克22万张GPU,Claude 限额翻倍、速度大提升
Anthropic从马斯克手中租用22万张GPU,显著提升Claude的计算能力,将实现限额翻倍和速度大幅提升,显示了AI领域算力军备竞赛的白热化态势。
传月之暗面新融 20 亿美元,估值超 200 亿美元;豆包曝光首个全模态理解模型
月之暗面(Moonshot AI)传出融资20亿美元,估值超200亿美元,同时豆包曝光首个全模态理解模型,反映了中国AI创投市场的火热和全模态AI的发展趋势。
蛰伏一年,周衔团队带来首个具身基础模型,烹饪做实验弹琴,效果炸场
前商汤研究院院长周衔团队发布首个具身智能基础模型,在烹饪、实验操作、弹琴等多任务上表现出色,代表具身智能领域的重要进展。
OpenAI公开大规模稳定训练的秘密,英伟达AMD英特尔都受益
OpenAI公开了大规模AI模型稳定训练的关键技术细节,英伟达、AMD、英特尔等芯片厂商均能从中受益,对AI训练基础设施发展有重要指导意义。
GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」
针对GRPO方法的局限,研究者提出G²RPO-A方法,通过自适应指导显著提升小模型的推理能力,对推理模型和RL领域有重要贡献。
一年磨一剑,今年最炸机器人Demo来了!1亿美元种子轮团队出手,单个模型解锁单手打蛋解魔方弹钢琴
获得1亿美元种子轮的机器人团队发布最新Demo,单个模型实现单手打蛋、解魔方、弹钢琴等精细操作,代表了具身智能和机器人领域的重大突破。
上一篇
05月08日AI资讯 | Anthropic估值冲爆1.2万亿反超OpenAI;Claude接入Office全家桶;Redis之父为DeepSeek V4造推理引擎
下一篇
05月06日AI资讯 | Anthropic与OpenAI同日成立合资公司;GPT-5.5 Instant全员免费;Claude狂揽亚马逊250亿刀
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/359629a6-152d-8171-b5b4-ea8216a3960e
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。

