slug
summary
tags
icon
password
OpenAI Sora 2 登场!同步推出APP,Altman称这是创意领域的「ChatGPT 时刻」
OpenAI发布了新一代AI视频模型Sora 2,显著提升了物理准确性和生成质量,首次实现音画同步。Sora 2允许用户将自己融入生成的视频场景,带来全新的社交互动体验。该模型在生成复杂动作和环境细节方面表现出色,能够真实模拟物理现象。OpenAI强调安全性,设立多重审核机制以保护用户隐私和防止不当内容生成。
字节Seed发布PXDesign:蛋白设计效率提升十倍,进入实用新阶段
字节跳动Seed团队推出的PXDesign蛋白设计方法在效率上提升了约10倍,能够在24小时内生成数百个高质量候选蛋白,并在多个靶点上实现20%–73%的实验成功率。该方法结合了生成与过滤的技术,提供了公开免费的在线设计服务,旨在加速科学研究并降低蛋白设计的成本和复杂性。
全新合成框架SOTA:强化学习当引擎,任务合成当燃料,蚂蚁港大联合出品
蚂蚁与香港大学联合推出PromptCoT 2.0,旨在通过强化学习和任务合成提升大模型的推理能力。新框架在问题合成方面进行了全面升级,生成了更难且多样化的合成问题数据,显著提高了弱模型的表现。未来将探索环境合成和多模态任务合成,以推动大模型的发展。
首次实现第一视角视频与人体动作同步生成!新框架攻克视角-动作对齐两大技术壁垒
EgoTwin是一个新框架,首次实现第一视角视频与人体动作的联合生成,攻克了视角-动作对齐和因果耦合的技术难题。该框架基于扩散模型,采用以头部为中心的动作表征和控制论启发的交互机制,显著提高了生成视频和动作的匹配度,适用于可穿戴计算、AR和具身智能等领域。
Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
LoRA通过低秩适配实现与全参数微调相似的性能,关键在于应用于所有层,尤其是MLP/MoE层,并在不受容量约束时表现良好。研究表明,LoRA的最佳学习率是全参数微调的10倍,且在小到中等规模的数据集上表现相当,但在大批量训练时容忍度较低。
AI改造出行体验:滴滴的试验能否开启行业范式转变?
滴滴推出了AI出行助手小滴,旨在提升用户打车体验。用户只需表达需求,AI便能智能匹配司机并推荐车辆,支持个性化需求和多种出行方案。小滴还提供历史查询和预约功能,确保用户出行更便捷。通过结合时空理解和多轮对话,滴滴实现了更高的订单准确率,推动了出行行业的创新和变革。
复旦、同济和港中文等重磅发布:强化学习在大语言模型全周期的全面综述
强化学习显著提升了大语言模型的推理能力和对齐性能,尤其在理解人类意图和遵循用户指令方面。研究者们总结了强化学习在大语言模型全生命周期中的应用,包括预训练、对齐微调和强化推理,探讨了当前面临的挑战与未来发展方向。重点介绍了基于可验证奖励的强化学习技术,分析了其在数学推理和编程任务中的应用效果,并提出了相应的分类体系和关键研究资源。
OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道
OpenAI推出了短视频生成模型Sora 2和关联社交应用Sora,提升了视频生成的真实感。英伟达市值突破4.5万亿美元,计划投资1000亿美元于AI基础设施。特斯拉预计2025年底推出第三代人形机器人,2026年开始量产。OpenAI上半年营收达43亿美元,腾讯优化了微信朋友圈照片显示效果。DoorDash推出自主配送机器人Dot,具备32km/h的速度。豆包大模型1.6-vision发布,具备工具调用能力。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/27f629a6-152d-8187-a442-c8432ba25f90
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。