AI日报
DeepSeek R1更新性能接近OpenAI;微软推出原生4bit量化BitNet v2;北大校友发布通用AI Agent Fairies;Ubiquant提出无监督熵最小化方法;哈工大ACL最高分研究汉字输入技术 | 06月01日AI资讯
00 分钟
2025-6-1
2025-6-1
slug
summary
tags
icon
password

玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?

DeepSeek R1更新显著降低了幻觉率并提升了性能,接近OpenAI和Google的旗舰模型,用户反馈积极,尤其在编程和数学方面表现突出,开源特性受到赞赏,但仍有对其能力和上下文窗口的讨论。

微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

微软推出了BitNet v2,首次实现原生4比特激活值量化,显著降低内存和计算成本,同时保持几乎零损失的性能,解决了激活值分布不均的问题,提升了大规模模型的计算效率。

北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用

北大校友推出的通用AI Agent Fairies,能够执行1000个操作,无需邀请码即可使用,支持多种模型,具备良好的用户体验和人机协作模式,但在复杂任务上偶尔会出现兼容性问题。用户可免费体验基本功能,专业版需订阅。

挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化

Ubiquant团队提出了一种无监督的熵最小化方法,仅需一条无标签数据和10步训练即可显著提升大语言模型的性能,超越传统强化学习方法,尤其适合数据稀缺的场景。研究表明,熵最小化通过优化模型的自信度,有效改善数学推理能力,但需注意过度自信的风险。未来研究可探索其在其他领域的应用及与现有技术的结合。

独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

哈工大的研究团队在ACL 2025会议上获得最高分,提出了一种基于传感器的汉字书写输入技术,结合中文字形编码,使AI能更深入理解汉字形态,推动中文人机交互和文化传播。该技术显著提升了汉字识别准确率,展示了汉字的文化和美学价值。
上一篇
Mary Meeker报告揭示AI新周期;AI学会自我改进代码;西北大学谷歌新框架提升数学推理;微软提出模型链新范式;LeCun质疑AGI派 | 06月02日AI资讯
下一篇
AlphaEvolve刷新数学纪录;360开源图文对齐数据集;Claude开源思维可视化工具;阿里通义开源推理搜索框架;斯坦福AI生成CUDA内核性能翻倍 | 05月31日AI资讯