AI日报
Meta高薪挖角AI人才;Veo 3生成气泡水广告走红;RoboRefer提升机器人空间理解;HarmoniCa框架加速扩散模型;AI梦之队战力飙升30% | 07月06日AI资讯
00 分钟
2025-7-6
2025-7-6
slug
summary
tags
icon
password

半数清华,8位华人AI天团集体投奔Meta!奥特曼:砸钱抢人不如培养死忠

Meta通过高额薪酬挖角顶尖AI人才,而OpenAI则推出驻留计划培养新人才,强调内在动机和企业文化的建设。两者在硅谷的人才争夺战中,展现出不同的战略和理念,可能影响未来AGI时代的发展。

一个气泡水广告,为何几十万人围观?原来整个都是Veo 3生成的

一个由AI生成的广告在社交媒体上走红,展示了Veo 3的音画同步功能,提升了视频创作的质量和一致性。创作团队通过超精细提示确保角色一致性,尽管AI仍面临细节生成的挑战。AI被视为创意的催化剂,具有巨大的潜力。

复杂空间指令也能秒懂?RoboRefer 让机器人理解推理空间,开放世界也能精准行动!

RoboRefer是一个多模态大模型,具备三维空间理解与推理能力,能够精准执行复杂的空间指代任务,成功率达89.6%。通过全参数微调和强化学习微调,RoboRefer在开放世界中表现优异,超越现有模型,适用于多种机器人平台。

Diffusion约2倍无损加速!训练-推理协同的缓存学习框架来了| HKUST & 北航 & 商汤

HKUST、北航和商汤提出了HarmoniCa框架,通过逐步去噪训练和图像质量优化机制,显著提升扩散模型的推理速度和图像质量,实现高性能无损加速,适用于多种模型和设备。该框架在训练和推理中展现出优越的效率和适应性。

OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

Sakana AI提出的Multi-LLM AB-MCTS方法通过整合o4-mini、Gemini-2.5-Pro和DeepSeek-R1-0528模型,显著提升了AI的推理能力,实验结果显示多模型组合在ARC-AGI-2基准测试中表现优于单一模型,成功解决超过30%的问题。
上一篇
阿里通义开源WebSailor挑战DeepSeek;中国团队开源MemOS提升AI记忆;AI浏览器Dia改变上网体验;伯克利开源代码Agent屠榜SWE-Bench;多模态大模型Stream-Omni支持灵活交互 | 07月07日AI资讯
下一篇
上交大开源MOSS-TTSD突破AI播客恐怖谷;华为诺亚推出HLCE编程基准;苹果港大发布DiffuCoder颠覆代码生成;DeepSeek流量暴跌引关注;Grok4跑分曝光引争议 | 07月05日AI资讯