发布于: 2025-5-2最后更新: 2025-5-2字数 00 分钟

slug
summary
tags
icon
password

刚刚,ICML 2025录用结果公布!好评论文惨遭拒,审稿人敷衍引全网怒喷

ICML 2025录用结果公布,共3260篇论文被接收,录用率为26.9%。然而,审稿质量引发争议,许多论文因审稿人敷衍而被拒,导致学术界对评审公正性产生质疑。

微软CEO和奥特曼失了和,OpenAI被“断粮”

OpenAI与微软之间的关系日益紧张,主要因计算资源需求、AGI进展和内部竞争等问题。微软暂停部分AI数据中心项目,可能影响OpenAI的算力支持,双方合作前景不明。

68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩

一项研究揭示了大模型竞技场存在的系统性问题,包括少数大厂私下测试多个模型版本并只公开最佳成绩、数据访问不平等以及模型被静默弃用等,质疑排行榜的可信度,并提出了改进建议。

全球首个AI科学家天团出道!007做实验碾压人类博士,生化环材圈巨震

FutureHouse发布了全球首个公开可用的AI科学家团队,具备超越人类博士的科研能力,能够进行文献检索、假设生成和实验设计,预计将显著提升科学研究效率。

只要9美元!LoRA+强化学习,DeepSeek 1.5B推理性能暴涨20%

南加州大学团队通过LoRA和强化学习,仅用9美元实现了在AIME 24数学基准测试中超过20%的推理性能提升,展示出高性价比的模型训练方法,且在多个推理任务中表现优异。

浙大 & 港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误

浙大与港理工等机构提出InfiGUI-R1,通过Actor2Reasoner框架提升GUI智能体的推理能力,使其从反应式行动者转变为深思熟虑的推理者,增强规划和反思能力,成功在多个基准测试中表现优异,推动GUI自动化工具的发展。

Loading...
Gemini 2.5 Pro通关《宝可梦蓝》;Perception-R1超越YOLOv3;阿里云通义点金发布DianJin-R1;微软Phi-4数学推理称王;伯克利提出睡眠时计算技术 | 05月03日AI资讯

Gemini 2.5 Pro通关《宝可梦蓝》;Perception-R1超越YOLOv3;阿里云通义点金发布DianJin-R1;微软Phi-4数学推理称王;伯克利提出睡眠时计算技术 | 05月03日AI资讯

Gemini 2.5 Pro成功通关《宝可梦蓝》,Perception-R1在多模态感知上超越YOLOv3,阿里云推出DianJin-R1金融推理模型,微软的Phi-4在数学推理上表现优异,伯克利提出的“睡眠时计算”技术显著提升LLM推理效率。

北大推出PHYBench测试AI物理能力;DeepSeek-Prover-V2刷新数学推理记录;英伟达UIUC扩展模型上下文至400万token;Meta被曝作弊刷分;OpenAI增强tool use能力 | 05月01日AI资讯

北大推出PHYBench测试AI物理能力;DeepSeek-Prover-V2刷新数学推理记录;英伟达UIUC扩展模型上下文至400万token;Meta被曝作弊刷分;OpenAI增强tool use能力 | 05月01日AI资讯

北大推出PHYBench基准测试AI物理能力,DeepSeek的新模型Prover-V2在数学定理证明上取得突破,英伟达与UIUC合作将模型上下文扩展至400万token,Meta被指控操控排行榜,OpenAI增强tool use能力,o3模型在任务完成上表现优异但仍有不足。