AI日报MIT研究AGI失控风险超90%;Video-XL-Pro突破长视频理解极限;OpenAI推出MRCR基准测试;谷歌NotebookLM支持中文;中兴通讯突破大模型推理上限 | 05月04日AI资讯MIT研究显示AGI失控风险超过90%;Video-XL-Pro模型在长视频理解上突破98%准确率;OpenAI推出MRCR基准测试提升AI性能;谷歌NotebookLM支持中文播客;中兴通讯提出自适应难易度蒸馏方法提升小模型推理能力。
AI日报Gemini 2.5 Pro通关《宝可梦蓝》;Perception-R1超越YOLOv3;阿里云通义点金发布DianJin-R1;微软Phi-4数学推理称王;伯克利提出睡眠时计算技术 | 05月03日AI资讯Gemini 2.5 Pro成功通关《宝可梦蓝》,Perception-R1在多模态感知上超越YOLOv3,阿里云推出DianJin-R1金融推理模型,微软的Phi-4在数学推理上表现优异,伯克利提出的“睡眠时计算”技术显著提升LLM推理效率。
AI日报ICML 2025录用结果引争议;微软与OpenAI合作前景不明;DeepSeek推理性能提升20%;全球首个AI科学家天团出道;InfiGUI-R1强化学习提升GUI智能体 | 05月02日AI资讯ICML 2025的录用结果引发争议,审稿质量受到质疑;微软与OpenAI关系紧张,合作前景不明;全球首个AI科学家团队发布,超越人类博士;DeepSeek通过LoRA和强化学习提升推理性能20%;浙大与港理工提出InfiGUI-R1,增强GUI智能体的推理能力。
AI日报北大推出PHYBench测试AI物理能力;DeepSeek-Prover-V2刷新数学推理记录;英伟达UIUC扩展模型上下文至400万token;Meta被曝作弊刷分;OpenAI增强tool use能力 | 05月01日AI资讯北大推出PHYBench基准测试AI物理能力,DeepSeek的新模型Prover-V2在数学定理证明上取得突破,英伟达与UIUC合作将模型上下文扩展至400万token,Meta被指控操控排行榜,OpenAI增强tool use能力,o3模型在任务完成上表现优异但仍有不足。
AI日报Meta推出独立AI助手融合社交元素;DeepSeek开源671B参数模型;清华吸引前DeepMind科学家;阿里妈妈发布世界知识大模型;Qwen 3开源战略破局 | 04月30日AI资讯Meta推出结合社交元素的独立AI助手,DeepSeek开源671B参数模型,清华吸引前DeepMind科学家,阿里妈妈发布世界知识大模型以提升电商推荐效果,Qwen 3开源战略为中国大模型公司提供新机遇。
AI日报百度智能云推动AI产业化;阿里云发布Qwen3开源模型;无问芯穹开源推理加速神器;AI操控舆论能力引争议;UC伯克利研究无思考推理模型 | 04月29日AI资讯百度智能云推动AI产业化,阿里云发布Qwen3开源模型,AI在操控舆论方面的能力引发伦理争议,无问芯穹推出推理加速系统,UC伯克利研究显示无思考推理模型的优势。
AI日报阿里Qwen3登顶全球最强开源模型;谷歌Gemini 2.5 Pro技术揭秘;DeepSeek V3推理能力突破;AI工具DFloat11无损压缩;麦肯锡推出内网版ChatGPT | 04月29日AI资讯阿里发布Qwen3模型,超越DeepSeek R1,支持119种语言;谷歌Gemini 2.5 Pro优化计算资源和推理效率;DeepSeek V3引入深度思考,推理速度显著提升;DFloat11无损压缩框架可将模型压缩至70%大小,保持100%准确率;麦肯锡推出内网版ChatGPT,推动AI在咨询行业的应用。
AI日报Perplexity推出Comet浏览器;谷歌Gemini 2.5 Pro突破;DeepSeek V3推理速度提升;麦肯锡内网版ChatGPT普及;阶跃星辰开源Step1X-Edit | 04月28日AI资讯Perplexity推出Comet浏览器以实现深度个性化;谷歌Gemini 2.5 Pro在模型训练中取得突破;DeepSeek V3推理速度提升至101秒;麦肯锡内部版ChatGPT被70%员工使用;阶跃星辰发布开源图像编辑模型Step1X-Edit,支持多种高频编辑任务。
AI日报夸克推出拍照问夸克功能;纳米AI发布MCP万能工具箱;清华朱军组提出DBIM算法;马斯克xAI寻求200亿美元融资;ThinkLite-VL模型超越GPT | 04月27日AI资讯夸克推出拍照问夸克功能提升用户体验,纳米AI发布MCP万能工具箱简化AI使用,清华朱军组提出DBIM算法加速图像翻译,马斯克寻求200亿美元融资推动X与xAI整合,ThinkLite-VL模型在视觉推理任务中超越GPT。
AI日报莱斯大学无损压缩LLM性能提升39倍;Kimi开源音频模型横扫基准测试;全球首个异步强化学习32B模型发布;美国政府AI行动计划引争议;阿里高德重构强化学习框架 | 04月26日AI资讯莱斯大学开发的无损压缩技术DFloat11使LLM性能提升39倍;Kimi发布的开源音频模型在多项基准测试中表现优异;全球首个异步强化学习32B模型INTELLECT-2问世;美国政府AI行动计划引发争议;阿里高德推出新强化学习训练方法GPG,显著提高训练效率。
AI日报百度发布沧舟OS和文心X1/4.5 Turbo;OpenAI推出轻量版DeepResearch;DeepMind果蝇登Nature;北航开源TinyLLaVA-Video-R1;清华推出视觉微调框架Mona | 04月25日AI资讯百度发布沧舟OS以推动AI应用,文心X1/4.5 Turbo模型推理能力提升并降低成本,OpenAI推出轻量版Deep Research,DeepMind模拟果蝇飞行,北航开源TinyLLaVA-Video-R1模型,清华推出视觉微调框架Mona以提升性能。
AI日报达摩院开源DyDiT架构;微软推出AI同事Copilot;OpenAI发布图像生成API;北大团队突破3D生成技术;Magi-1开源自回归视频模型 | 04月24日AI资讯达摩院开源DyDiT架构显著提升视觉生成效率,微软推出AI同事Copilot重塑工作方式,OpenAI发布低成本图像生成API,北大团队突破3D生成技术,Magi-1开源自回归视频模型具备高真实性和因果推理能力。