AI日报
MIT研究AGI失控风险超90%;Video-XL-Pro突破长视频理解极限;OpenAI推出MRCR基准测试;谷歌NotebookLM支持中文;中兴通讯突破大模型推理上限 | 05月04日AI资讯
00 分钟
2025-5-4
2025-5-4
slug
summary
tags
icon
password

AGI失控率>90%!MIT教授算出「康普顿常数」,AI地球「夺权率」已锁定?

MIT研究表明,尽管有监督机制,人类成功控制AGI的概率仅为52%,而失控风险超过90%。研究提出嵌套可扩展监督(NSO)模型,强调较弱的AI可以监督更强的AI,确保AI系统对人类有益。

3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限,大海捞针准确率超98%

Video-XL-Pro模型通过重构式token压缩技术实现超长视频理解,准确率超过98%,在多个评测基准中超越了Meta的7B模型,展现出强大的性能和广泛的应用潜力。模型和数据已开源。

让GPT-4.1「头皮发麻的考试」!OpenAI给大模型上强度,AI能赢吗?

OpenAI推出了MRCR基准测试,旨在评估AI模型在长上下文中区分多个目标的能力,挑战性显著提升。GPT-4.1在处理复杂信息时表现出色,能够有效提取关键信息,推动AI技术的进步和应用。

谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品

NotebookLM现已支持中文播客,用户可将音频源转化为对话式播客,功能包括音频概览和互动脑图。谷歌即将推出移动App,支持多语言,提升用户体验。高阶功能可能仅对付费用户开放。

大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升

中兴通讯无线研究院提出了一种基于模型自适应难度分级的蒸馏方法,显著提升小模型的长链推理能力,尤其在数学推理和代码生成任务中表现优异。该方法通过动态匹配模型能力与题目难度,优化了高质量思维链数据的生成效率与效果。
上一篇
DeepSeek-R1复现研究推动推理语言模型;港科广分层建模突破3D人体生成;苹果原生多模态Scaling Law性能飙升;LUFFY强化学习即学即用;AI自我复制能力引安全警示 | 05月05日AI资讯
下一篇
Gemini 2.5 Pro通关《宝可梦蓝》;Perception-R1超越YOLOv3;阿里云通义点金发布DianJin-R1;微软Phi-4数学推理称王;伯克利提出睡眠时计算技术 | 05月03日AI资讯