slug
summary
tags
icon
password
o3完爆人类医生,OpenAI基准直击AGI!
OpenAI推出HealthBench基准,显示o3模型在医疗AI评估中超越人类医生,提升诊断准确率近4倍,推动AGI在医疗领域的应用,强调模型的实用性和安全性。
首个多模态统一CoT奖励模型来了,模型、数据集、训练脚本全开源
腾讯与多家机构联合推出UnifiedReward-Think,这是首个具备长链式推理能力的多模态奖励模型,能够准确评估复杂视觉任务,提升推理可解释性和跨任务泛化能力。该模型通过三阶段训练框架显著增强了推理能力,并已全面开源供研究者使用。
文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”
港中文MMLab发布了T2I-R1,这是第一个基于强化学习的推理增强文生图模型,采用双层级CoT推理框架,显著提高了图像生成的质量和准确性,展示了在复杂场景下的鲁棒性,并为未来的多模态生成任务奠定了基础。
生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界
昆仑万维开源的Matrix-Game是一个交互式世界基础模型,能够生成完整的可交互游戏世界,具有高保真视觉和物理一致性,支持细粒度用户控制,适用于游戏开发及其他领域,标志着空间智能的重要进展。
GPT-5研发内幕首曝!OpenAI首席研究官:AGI指日可待
GPT-5的研发面临推理与聊天能力的平衡挑战,OpenAI首席研究官强调AGI的多元化目标,团队通过用户反馈优化模型性能,并计划推出开源语言模型以促进开发者的创新。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/1f2629a6-152d-81e0-b8d7-ecba482ae681
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。