AI日报
昆仑万维发布六款多模态AI模型;谷歌推出Genie 3世界模型;上海交大揭示LLM裁判机制缺陷;Qwen3 Coder市场份额破20%;OpenAI估值达5000亿美元 | 08月17日AI资讯
00 分钟
2025-8-17
2025-8-17
slug
summary
tags
icon
password

一周六连发!昆仑万维将多模态AI卷到了新高度

昆仑万维在一周内发布六款多模态AI模型,涵盖视频生成、世界模型和AI音乐创作等热门领域,且大部分模型均为开源。SkyReels-A3模型能够让数字人自然开口说话,Matrix-Game 2.0模型实现高帧率实时交互,Skywork UniPic 2.0则优化了图像生成与编辑。公司持续在AI核心技术领域投入,致力于在垂直领域深耕,推动开源生态发展,展现出强大的技术实力和商业潜力。

刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

Genie 3是谷歌DeepMind最新的世界模型,能够实时生成动态、可互动的虚拟世界,标志着通向通用人工智能的重要一步。它具备特殊记忆功能,可以记住过去的细节,并在生成过程中保持物理一致性。Genie 3的应用潜力巨大,能够支持游戏世界创建、智能体训练等,同时在模拟现实世界的能力上有显著提升。未来的目标是进一步增强真实感和交互性,推动机器人领域的发展。

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)作为裁判的能力存在严重缺陷,特别是在角色身份识别方面。上海交通大学的研究表明,顶尖模型的准确率仅为68.8%,远低于人类的90.8%。研究提出了PersonaEval基准测试,旨在评估LLM的角色识别能力,并发现模型在推理能力上存在不足。通过微调角色知识并未提升模型表现,反而可能导致性能下降,强调了提升推理引擎的重要性。未来的研究应关注模型的思考路径,以构建更符合人类判断的AI系统。

Qwen3 Coder强势崛起,OpenRouter市场份额破20%

Qwen3 Coder在OpenRouter上的市场份额已达到20.5%,显示出开源模型的快速崛起,尽管GPT-5的市场份额仅为5%。开发者对Qwen3 Coder的评价良好,尽管其他模型如Sonnet 4也受到关注。OpenRouter的数据未涵盖所有市场参与者,表明开发者的选择受速度和价格的影响。

OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」 | 极客早知道

OpenAI计划出售近60亿美元股份,估值将达5000亿美元;SpaceX将于8月25日进行第10次星舰试飞;巴菲特减持苹果2000万股,但仍是其最大持仓;小米即将推出性能超预期的玄戒O2芯片;苹果手表明年将进行大幅重新设计;OpenAI ChatGPT语音模式新增可调语速功能;福特烈马1966复古SUV开启预售;康奈尔大学研发全球首款微波大脑芯片;原道与小岛秀夫工作室联名推出《死亡搁浅2》耳机。
上一篇
华人团队提出Memory Decoder;英伟达研究小模型;OpenAI发布gpt-oss;D2F模型跑赢自回归;4DNeX生成动态场景 | 08月18日AI资讯
下一篇
奥特曼分享AI愿景;谷歌开源Gemma 3;北大提出复数大模型iFairy;腾讯发布混元3D世界模型;阶跃星辰推出形式化证明新范式 | 08月16日AI资讯