英伟达开源9B小模型比Qwen3快6倍；阿里Qwen-Image-Edit图像编辑大杀器上线；OpenAI高管离职加入新创企；中美AI竞争格局生变 | 08月19日AI资讯

slug

summary

英伟达开源9B参数小模型，比Qwen3快6倍

英伟达推出了新型小型语言模型Nemotron Nano v2，该模型在复杂推理基准测试中的准确率与Qwen3-8B相当，但速度快6倍。模型支持思考预算控制，允许用户指定推理过程中的token数量。英伟达还开源了用于创建该模型的大部分数据，包括包含66万亿个优质数据的预训练数据库，显示出其在开源领域的积极态度。

🔗访问原文

凌晨战神Qwen又搞事情！新模型让图像编辑「哪里不对改哪里」

Qwen-Image-Edit是最新的图像编辑工具，支持精准的文字修改、元素增删、视角转换和风格迁移等功能。它能够在保持图像语义不变的前提下进行原创IP编辑，并在多种场景下展示出色的编辑效果。该工具还具备强大的双语文字编辑能力和SOTA性能，满足各种图像编辑需求。

🔗访问原文

4o-mini华人领队也离职了，这次不怪小扎

Kevin Lu离开OpenAI，加入了新创立的Thinking Machine Lab，该公司由前OpenAI CTO Mira Murati创办，已获得120亿美元估值。Kevin在OpenAI期间负责4o-mini等模型的开发，专注于强化学习和小模型。他认为当前对Transformer架构的关注过高，未来的研究应聚焦于数据和产品开发。

🔗访问原文

美国专家来中国转了一圈：AI比赛已经结束了

美国专家Rui Ma在中国考察后认为，中美在AI领域的竞争已趋于结束，主要原因是中国在电力供应方面的优势。中国的能源基础设施稳定且成本低，而美国面临电网老化和审批缓慢的问题，导致无法满足日益增长的电力需求。Hinton也批评了硅谷科技公司的短视行为，认为这将阻碍AGI的发展。

🔗访问原文

相信大模型成本会下降，才是业内最大的幻觉

许多AI创业者相信模型成本会下降，从而改善收入状况，但实际上，只有旧版模型的成本在下降，而市场需求始终集中在最好的语言模型上，这些模型的成本保持不变。此外，随着模型能力的提升，token消耗量也在激增，导致企业面临资金链危机。固定费率的商业模式难以持续，行业需要探索按使用量计费等新模式。

🔗访问原文

首个3D动作游戏专用VLA模型，打黑神话 & 只狼超越人类玩家 | ICCV 2025

CombatVLA是首个专为3D动作角色扮演游戏设计的视觉-语言-动作模型，成功率超越GPT-4o和人类玩家，能够在复杂环境中实现实时战斗决策。该模型通过动作追踪器收集数据，并采用渐进式学习优化动作生成，实验结果显示其在战斗理解基准上表现优异，实现50倍速度提升。

🔗访问原文

图生视频新玩法刷爆外网：图上画两笔就能动起来，终于告别文本提示

Higgsfield AI推出了新功能Draw-to-Video，用户只需上传静态图像并绘制简单图形，即可生成动态视频，迅速引起广泛关注。此外，该公司还推出了Product-to-Video功能，允许用户通过拖拽操作生成广告视频。Higgsfield AI持续更新功能，致力于为内容创作者提供个性化的视频工具。

🔗访问原文

英伟达开源9B参数小模型，比Qwen3快6倍

凌晨战神Qwen又搞事情！新模型让图像编辑「哪里不对改哪里」

4o-mini华人领队也离职了，这次不怪小扎

美国专家来中国转了一圈：AI比赛已经结束了

相信大模型成本会下降，才是业内最大的幻觉

首个3D动作游戏专用VLA模型，打黑神话 & 只狼超越人类玩家 | ICCV 2025

图生视频新玩法刷爆外网：图上画两笔就能动起来，终于告别文本提示

AI学长小林

交流频道

加入我们的社群讨论分享