slug
summary
tags
icon
password
英伟达开源9B参数小模型,比Qwen3快6倍
英伟达推出了新型小型语言模型Nemotron Nano v2,该模型在复杂推理基准测试中的准确率与Qwen3-8B相当,但速度快6倍。模型支持思考预算控制,允许用户指定推理过程中的token数量。英伟达还开源了用于创建该模型的大部分数据,包括包含66万亿个优质数据的预训练数据库,显示出其在开源领域的积极态度。
凌晨战神Qwen又搞事情!新模型让图像编辑「哪里不对改哪里」
Qwen-Image-Edit是最新的图像编辑工具,支持精准的文字修改、元素增删、视角转换和风格迁移等功能。它能够在保持图像语义不变的前提下进行原创IP编辑,并在多种场景下展示出色的编辑效果。该工具还具备强大的双语文字编辑能力和SOTA性能,满足各种图像编辑需求。
4o-mini华人领队也离职了,这次不怪小扎
Kevin Lu离开OpenAI,加入了新创立的Thinking Machine Lab,该公司由前OpenAI CTO Mira Murati创办,已获得120亿美元估值。Kevin在OpenAI期间负责4o-mini等模型的开发,专注于强化学习和小模型。他认为当前对Transformer架构的关注过高,未来的研究应聚焦于数据和产品开发。
美国专家来中国转了一圈:AI比赛已经结束了
美国专家Rui Ma在中国考察后认为,中美在AI领域的竞争已趋于结束,主要原因是中国在电力供应方面的优势。中国的能源基础设施稳定且成本低,而美国面临电网老化和审批缓慢的问题,导致无法满足日益增长的电力需求。Hinton也批评了硅谷科技公司的短视行为,认为这将阻碍AGI的发展。
相信大模型成本会下降,才是业内最大的幻觉
许多AI创业者相信模型成本会下降,从而改善收入状况,但实际上,只有旧版模型的成本在下降,而市场需求始终集中在最好的语言模型上,这些模型的成本保持不变。此外,随着模型能力的提升,token消耗量也在激增,导致企业面临资金链危机。固定费率的商业模式难以持续,行业需要探索按使用量计费等新模式。
首个3D动作游戏专用VLA模型,打黑神话 & 只狼超越人类玩家 | ICCV 2025
CombatVLA是首个专为3D动作角色扮演游戏设计的视觉-语言-动作模型,成功率超越GPT-4o和人类玩家,能够在复杂环境中实现实时战斗决策。该模型通过动作追踪器收集数据,并采用渐进式学习优化动作生成,实验结果显示其在战斗理解基准上表现优异,实现50倍速度提升。
图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
Higgsfield AI推出了新功能Draw-to-Video,用户只需上传静态图像并绘制简单图形,即可生成动态视频,迅速引起广泛关注。此外,该公司还推出了Product-to-Video功能,允许用户通过拖拽操作生成广告视频。Higgsfield AI持续更新功能,致力于为内容创作者提供个性化的视频工具。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/254629a6-152d-81a5-a420-f431a0685a43
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。