发布于: 2025-5-13最后更新: 2025-5-13字数 00 分钟

slug
summary
tags
icon
password

o3完爆人类医生,OpenAI基准直击AGI!

OpenAI推出HealthBench基准,显示o3模型在医疗AI评估中超越人类医生,提升诊断准确率近4倍,推动AGI在医疗领域的应用,强调模型的实用性和安全性。

首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源

腾讯与多家机构联合推出UnifiedReward-Think,这是首个具备长链式推理能力的多模态奖励模型,能够准确评估复杂视觉任务,提升推理可解释性和跨任务泛化能力。该模型通过三阶段训练框架显著增强了推理能力,并已全面开源供研究者使用。

文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”

港中文MMLab发布了T2I-R1,这是第一个基于强化学习的推理增强文生图模型,采用双层级CoT推理框架,显著提高了图像生成的质量和准确性,展示了在复杂场景下的鲁棒性,并为未来的多模态生成任务奠定了基础。

生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界

昆仑万维开源的Matrix-Game是一个交互式世界基础模型,能够生成完整的可交互游戏世界,具有高保真视觉和物理一致性,支持细粒度用户控制,适用于游戏开发及其他领域,标志着空间智能的重要进展。

GPT-5研发内幕首曝!OpenAI首席研究官:AGI指日可待

GPT-5的研发面临推理与聊天能力的平衡挑战,OpenAI首席研究官强调AGI的多元化目标,团队通过用户反馈优化模型性能,并计划推出开源语言模型以促进开发者的创新。

Loading...
ICML 2025提出Token-Level Editing方法;DanceGRPO统一视觉生成框架;北大发布人形机器人通用大模型;腾讯推出CodeBuddy 3.0插件;OpenAI计划2025年大规模应用AI智能体 | 05月14日AI资讯

ICML 2025提出Token-Level Editing方法;DanceGRPO统一视觉生成框架;北大发布人形机器人通用大模型;腾讯推出CodeBuddy 3.0插件;OpenAI计划2025年大规模应用AI智能体 | 05月14日AI资讯

研究提出Token-Level Editing方法以避免模型崩溃;DanceGRPO框架支持多种视觉生成任务;北大和人大联合发布人形机器人通用大模型;腾讯推出CodeBuddy 3.0插件;OpenAI计划在2025年大规模应用AI智能体。

红杉AI峰会转向收益模式;SakanaAI推出连续思维机器;蚂蚁&人大开源ViLAMP-7B;字节北大联合发布DreamO框架;CMU华人开发LegoGPT | 05月12日AI资讯

红杉AI峰会转向收益模式;SakanaAI推出连续思维机器;蚂蚁&人大开源ViLAMP-7B;字节北大联合发布DreamO框架;CMU华人开发LegoGPT | 05月12日AI资讯

AI行业正在转向基于成果的收益模式,Sakana AI推出的连续思维机器提升了决策能力,蚂蚁与人大联合发布的ViLAMP模型可高效处理长视频,字节跳动与北大推出的DreamO框架实现快速图像生成,CMU开发的LegoGPT确保乐高模型的物理稳定性。

公告
分享AI实战与落地的知识,高效探索ChatGPT的使用方法、技巧与行业应用场景,让AI成为你手中真正的生产力!