slug
summary
tags
icon
password
一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」
在一周内,AlphaEvolve与人类数学家合作,刷新了18年的数学纪录,展示了AI与人类协作的潜力。AI通过广度扫描发现新思路,人类则进行深度优化,推动数学研究的进展。
360开源高质量图文对齐数据集!收纳1200万张图像+1000万组细粒度负样本,让模型告别“图文不符”
FineHARD数据集包含1200万张图像和1000万组细粒度难负样本,旨在提升CLIP模型的细粒度特征学习能力,显著改善模型对图文细节的理解与区分能力,适用于多模态大模型训练和具身智能系统开发等领域。
Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了
Claude团队推出了开源的“电路追踪”工具,通过生成归因图帮助用户理解大模型的思维过程,支持在主流模型上快速生成图表,促进对AI内部机制的研究和探索。该工具已在GitHub获得400+星标,引发广泛讨论和关注。
阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升
阿里通义实验室推出的MaskSearch框架在推理与搜索能力上显著提升,允许小模型媲美大模型。通过检索增强型掩码预测任务,模型能有效学习使用搜索工具,提升多领域任务的适应性和泛化能力,实验结果显示其在多个开放域问答数据集上表现优异。
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
斯坦福大学的研究发现,AI生成的CUDA内核在性能上超越了人类专家优化的版本,某些操作性能提升近400%。研究团队采用自然语言生成优化思想,结合多分支探索策略,意外实现了高效内核生成,展示了AI在深度学习优化中的巨大潜力。
上一篇
DeepSeek R1更新性能接近OpenAI;微软推出原生4bit量化BitNet v2;北大校友发布通用AI Agent Fairies;Ubiquant提出无监督熵最小化方法;哈工大ACL最高分研究汉字输入技术 | 06月01日AI资讯
下一篇
DeepSeek-R1升级幻觉率降50%;可灵AI季度收入1.5亿;GPT-4o-Image任务完成率28.9%;全球首个AI智能体自进化开源框架发布;美团开放AI代码工具 | 05月30日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/204629a6-152d-810f-b330-f5cbeff5f944
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。