特斯拉豪掷200亿美元转向AI机器人；苹果20亿美元收购Q.ai开发无声语音控制；Vidu Q3以16秒声画同出超越Sora2；OpenAI计划四季度IPO估值8300亿美元；谷歌开放世界模型降低AI游戏门槛 | 01月31日AI资讯

slug

summary

特斯拉计划投资200亿美元转向人形机器人和无人车，苹果以20亿美元收购Q.ai推动无声语音控制技术，Vidu Q3推出16秒声画同出视频创作新方式，OpenAI预计估值8300亿美元，谷歌推出Project Genie允许用户创建虚拟世界，AI4S亟需迈向2.0时代以推动科学智能进步，LingBot-VA实现机器人未来预测能力，Minimax推出高真实感的AI音乐模型。

豪掷 200 亿美金，特斯拉悄悄开始新一轮「创业」

特斯拉在汽车业务下滑的情况下，计划投资200亿美元于新生产线和AI算力建设，重点转向人形机器人和无人车，而非传统汽车销售。尽管面临竞争，特斯拉的汽车毛利率保持稳定，能源业务也实现显著增长。马斯克对未来的技术发展持乐观态度，认为算力提升将推动自动驾驶和机器人技术的进步。

🔗访问原文

20 亿美元收 Q.ai，苹果想让你「无声」地控制 AI

苹果以近20亿美元收购以色列AI初创公司Q.ai，旨在推动无声语音识别技术的发展，以提升用户隐私和交互体验。这项技术将可能集成到未来的AirPods和智能眼镜中，允许用户通过面部动作进行指令输入。此次收购反映了苹果在AI硬件竞争中的紧迫性，标志着AI交互方式的转变，未来将更注重无缝、自然的用户体验。

🔗访问原文

超越 Sora2，Vidu Q3 以 16 秒声画同出开创视频创作新范式

Vidu Q3通过一次性生成16秒的声画同出视频，改变了视频创作的方式，提供了完整的叙事能力和镜头控制，允许创作者像导演一样调度叙事节奏。这种技术的进步使得视频生成不仅限于视觉效果，还包括与之匹配的声音，极大地降低了制作成本并提升了效率，推动了短剧和广告等内容形式的发展。

🔗访问原文

谁是8300亿美元OpenAI的「金主爸爸」？

OpenAI正在进行一轮1000亿美元的融资，预计将估值提升至8300亿美元。软银计划追加300亿美元投资，微软、英伟达和亚马逊等也在谈判中。软银的持股比例将从27%稀释至24.95%，并在星门计划中与OpenAI等合作，致力于在美国建立「纯美系」数据中心。

🔗访问原文

谷歌开放世界模型一夜刷屏，AI游戏门槛归零时刻来了？

谷歌DeepMind推出的Project Genie允许用户创建和探索虚拟世界，结合了Genie 3、Nano Banana Pro和Gemini模型的技术支持。用户可以通过文本和图像生成动态环境，进行角色创建和世界探索。尽管目前仍处于早期阶段，生成的世界可能不够逼真，用户体验良好，已有用户分享了他们的创作和反馈。

🔗访问原文

顶尖模型离「科学家」还差得远？AI4S亟待迈向2.0时代

科学智能（AI for Science）在特定领域取得了显著成就，但过度依赖现有模型可能限制创新。最新研究显示，前沿模型在专业推理任务中表现不足，亟需推动科学智能从1.0向2.0迭代，整合通用与专业能力。上海人工智能实验室提出「智者」SAGE架构，旨在实现深度专业化通用模型，推动科学发现与推理能力的进化。

🔗访问原文

大事不好！机器人学会预测未来了

LingBot-VA是全球首个用于通用机器人控制的因果视频-动作世界模型，能够在执行动作前预测未来的视觉状态，打破传统的观察-反应模式。它具备长期记忆和高效泛化能力，能够适应新任务并执行高精度操作。通过视频与动作的自回归交错序列和逆向动力学，LingBot-VA实现了更高效的决策过程，标志着通用机器人进入视频时代，推动了行业的技术进步。

🔗访问原文

我宣布，这就是现在人声最真实的AI音乐模型

Minimax推出的音乐模型2.5展现出极强的人声真实感，特别是在中文演唱方面表现出色。用户可以通过一个小工具提取曲风提示词，结合Minimax进行创作，体验到丰富的音乐风格和细节。尽管模型功能尚有不足，但其在音质和表达上的进步令人惊喜，带来了愉快的音乐创作体验。

🔗访问原文

豪掷 200 亿美金，特斯拉悄悄开始新一轮「创业」

20 亿美元收 Q.ai，苹果想让你「无声」地控制 AI

超越 Sora2，Vidu Q3 以 16 秒声画同出开创视频创作新范式

谁是8300亿美元OpenAI的「金主爸爸」？

谷歌开放世界模型一夜刷屏，AI游戏门槛归零时刻来了？

顶尖模型离「科学家」还差得远？AI4S亟待迈向2.0时代

大事不好！机器人学会预测未来了

我宣布，这就是现在人声最真实的AI音乐模型

AI学长小林

交流频道

加入我们的社群讨论分享