OpenAI发布Sora 2视频模型及APP；字节跳动Seed推出PXDesign蛋白设计方法；蚂蚁港大联合发布PromptCoT 2.0推理框架；滴滴推出AI出行助手小滴；Thinking Machines发布LoRA微调研究 | 10月01日AI资讯

slug

summary

OpenAI推出了新一代视频模型Sora 2，提升了生成质量和音画同步；字节跳动的PXDesign蛋白设计方法效率提升十倍；蚂蚁与香港大学联合发布PromptCoT 2.0推理框架；滴滴推出AI出行助手小滴，提升用户打车体验；研究者总结了强化学习在大语言模型中的应用；英伟达市值突破4.5万亿美元，特斯拉预计推出第三代人形机器人。

OpenAI Sora 2 登场！同步推出APP，Altman称这是创意领域的「ChatGPT 时刻」

OpenAI发布了新一代AI视频模型Sora 2，显著提升了物理准确性和生成质量，首次实现音画同步。Sora 2允许用户将自己融入生成的视频场景，带来全新的社交互动体验。该模型在生成复杂动作和环境细节方面表现出色，能够真实模拟物理现象。OpenAI强调安全性，设立多重审核机制以保护用户隐私和防止不当内容生成。

🔗访问原文

字节Seed发布PXDesign：蛋白设计效率提升十倍，进入实用新阶段

字节跳动Seed团队推出的PXDesign蛋白设计方法在效率上提升了约10倍，能够在24小时内生成数百个高质量候选蛋白，并在多个靶点上实现20%–73%的实验成功率。该方法结合了生成与过滤的技术，提供了公开免费的在线设计服务，旨在加速科学研究并降低蛋白设计的成本和复杂性。

🔗访问原文

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁与香港大学联合推出PromptCoT 2.0，旨在通过强化学习和任务合成提升大模型的推理能力。新框架在问题合成方面进行了全面升级，生成了更难且多样化的合成问题数据，显著提高了弱模型的表现。未来将探索环境合成和多模态任务合成，以推动大模型的发展。

🔗访问原文

首次实现第一视角视频与人体动作同步生成！新框架攻克视角-动作对齐两大技术壁垒

EgoTwin是一个新框架，首次实现第一视角视频与人体动作的联合生成，攻克了视角-动作对齐和因果耦合的技术难题。该框架基于扩散模型，采用以头部为中心的动作表征和控制论启发的交互机制，显著提高了生成视频和动作的匹配度，适用于可穿戴计算、AR和具身智能等领域。

🔗访问原文

Thinking Machines曝LoRA终极指南：10倍学习率，媲美全参微调

LoRA通过低秩适配实现与全参数微调相似的性能，关键在于应用于所有层，尤其是MLP/MoE层，并在不受容量约束时表现良好。研究表明，LoRA的最佳学习率是全参数微调的10倍，且在小到中等规模的数据集上表现相当，但在大批量训练时容忍度较低。

🔗访问原文

AI改造出行体验：滴滴的试验能否开启行业范式转变？

滴滴推出了AI出行助手小滴，旨在提升用户打车体验。用户只需表达需求，AI便能智能匹配司机并推荐车辆，支持个性化需求和多种出行方案。小滴还提供历史查询和预约功能，确保用户出行更便捷。通过结合时空理解和多轮对话，滴滴实现了更高的订单准确率，推动了出行行业的创新和变革。

🔗访问原文

复旦、同济和港中文等重磅发布：强化学习在大语言模型全周期的全面综述

强化学习显著提升了大语言模型的推理能力和对齐性能，尤其在理解人类意图和遵循用户指令方面。研究者们总结了强化学习在大语言模型全生命周期中的应用，包括预训练、对齐微调和强化推理，探讨了当前面临的挑战与未来发展方向。重点介绍了基于可验证奖励的强化学习技术，分析了其在数学推理和编程任务中的应用效果，并提出了相应的分类体系和关键研究资源。

🔗访问原文

OpenAI 深夜重磅推出新视频模型和独立 App；英伟达市值突破4.5万亿美元；特斯拉预计推出第三代人形机器人 | 极客早知道

OpenAI推出了短视频生成模型Sora 2和关联社交应用Sora，提升了视频生成的真实感。英伟达市值突破4.5万亿美元，计划投资1000亿美元于AI基础设施。特斯拉预计2025年底推出第三代人形机器人，2026年开始量产。OpenAI上半年营收达43亿美元，腾讯优化了微信朋友圈照片显示效果。DoorDash推出自主配送机器人Dot，具备32km/h的速度。豆包大模型1.6-vision发布，具备工具调用能力。

🔗访问原文

OpenAI Sora 2 登场！同步推出APP，Altman称这是创意领域的「ChatGPT 时刻」

字节Seed发布PXDesign：蛋白设计效率提升十倍，进入实用新阶段

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

首次实现第一视角视频与人体动作同步生成！新框架攻克视角-动作对齐两大技术壁垒

Thinking Machines曝LoRA终极指南：10倍学习率，媲美全参微调

AI改造出行体验：滴滴的试验能否开启行业范式转变？

复旦、同济和港中文等重磅发布：强化学习在大语言模型全周期的全面综述

OpenAI 深夜重磅推出新视频模型和独立 App；英伟达市值突破4.5万亿美元；特斯拉预计推出第三代人形机器人 | 极客早知道

AI学长小林

交流频道

加入我们的社群讨论分享