slug
summary
tags
icon
password
豪掷 200 亿美金,特斯拉悄悄开始新一轮「创业」
特斯拉在汽车业务下滑的情况下,计划投资200亿美元于新生产线和AI算力建设,重点转向人形机器人和无人车,而非传统汽车销售。尽管面临竞争,特斯拉的汽车毛利率保持稳定,能源业务也实现显著增长。马斯克对未来的技术发展持乐观态度,认为算力提升将推动自动驾驶和机器人技术的进步。
20 亿美元收 Q.ai,苹果想让你「无声」地控制 AI
苹果以近20亿美元收购以色列AI初创公司Q.ai,旨在推动无声语音识别技术的发展,以提升用户隐私和交互体验。这项技术将可能集成到未来的AirPods和智能眼镜中,允许用户通过面部动作进行指令输入。此次收购反映了苹果在AI硬件竞争中的紧迫性,标志着AI交互方式的转变,未来将更注重无缝、自然的用户体验。
超越 Sora2,Vidu Q3 以 16 秒声画同出开创视频创作新范式
Vidu Q3通过一次性生成16秒的声画同出视频,改变了视频创作的方式,提供了完整的叙事能力和镜头控制,允许创作者像导演一样调度叙事节奏。这种技术的进步使得视频生成不仅限于视觉效果,还包括与之匹配的声音,极大地降低了制作成本并提升了效率,推动了短剧和广告等内容形式的发展。
谁是8300亿美元OpenAI的「金主爸爸」?
OpenAI正在进行一轮1000亿美元的融资,预计将估值提升至8300亿美元。软银计划追加300亿美元投资,微软、英伟达和亚马逊等也在谈判中。软银的持股比例将从27%稀释至24.95%,并在星门计划中与OpenAI等合作,致力于在美国建立「纯美系」数据中心。
谷歌开放世界模型一夜刷屏,AI游戏门槛归零时刻来了?
谷歌DeepMind推出的Project Genie允许用户创建和探索虚拟世界,结合了Genie 3、Nano Banana Pro和Gemini模型的技术支持。用户可以通过文本和图像生成动态环境,进行角色创建和世界探索。尽管目前仍处于早期阶段,生成的世界可能不够逼真,用户体验良好,已有用户分享了他们的创作和反馈。
顶尖模型离「科学家」还差得远?AI4S亟待迈向2.0时代
科学智能(AI for Science)在特定领域取得了显著成就,但过度依赖现有模型可能限制创新。最新研究显示,前沿模型在专业推理任务中表现不足,亟需推动科学智能从1.0向2.0迭代,整合通用与专业能力。上海人工智能实验室提出「智者」SAGE架构,旨在实现深度专业化通用模型,推动科学发现与推理能力的进化。
大事不好!机器人学会预测未来了
LingBot-VA是全球首个用于通用机器人控制的因果视频-动作世界模型,能够在执行动作前预测未来的视觉状态,打破传统的观察-反应模式。它具备长期记忆和高效泛化能力,能够适应新任务并执行高精度操作。通过视频与动作的自回归交错序列和逆向动力学,LingBot-VA实现了更高效的决策过程,标志着通用机器人进入视频时代,推动了行业的技术进步。
我宣布,这就是现在人声最真实的AI音乐模型
Minimax推出的音乐模型2.5展现出极强的人声真实感,特别是在中文演唱方面表现出色。用户可以通过一个小工具提取曲风提示词,结合Minimax进行创作,体验到丰富的音乐风格和细节。尽管模型功能尚有不足,但其在音质和表达上的进步令人惊喜,带来了愉快的音乐创作体验。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/2f9629a6-152d-819c-bdc8-d4d3440b926e
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。




