AI日报
微软开源三进制LLM BitNet b1.58;OpenAI承认新模型幻觉率暴增;昆仑万维推出无限时长视频生成模型;Jürgen团队开源WriteHERE框架;AI设计引力波探测工具 | 04月21日AI资讯
00 分钟
2025-4-21
2025-4-21
slug
summary
tags
icon
password

RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起

人工智能的发展依赖于多领域合作,而非单一技术或个别天才。微软副总裁强调,AI的进步需要成千上万人的共同努力,避免过度神化某一技术,如强化学习。历史教训表明,科学进步是不断创新和代际更迭的结果。

百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板

Jürgen Schmidhuber团队开源的WriteHERE框架实现了单次生成超4万字的长文写作能力,采用异质递归规划技术,显著超越现有AI写作工具,支持动态任务管理和实时反馈,已在小说和技术报告生成中表现优异,推动长文写作的自动化革命。

用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析

任务向量方法在视觉和语言任务中展现出效率与可迁移性优势。研究分析了其在模型编辑中的有效性,提出了任务运算的理论框架,并探讨了任务间关系对任务运算系数的影响。研究结果为多任务学习和机器遗忘提供了理论保证。

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当

微软发布了开源的2B参数“原生1bit”LLM BitNet b1.58,单CPU运行仅需0.4GB内存,性能与全精度模型相当,具备高效的计算能力和低能耗,采用三进制存储权重,避免了训练后量化的性能衰减。该模型在多个基准测试中表现优异,具有显著的训练和推理优势。

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

OpenAI的新模型o3和o4-mini的幻觉率显著上升,o3的幻觉率是o1的两倍,o4-mini更是三倍,导致模型在编程辅助中产生虚假代码和不实解释。研究表明,推理能力强的模型反而更容易出现幻觉现象,OpenAI承认需要更多研究以理解原因。

全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源

昆仑万维推出SkyReels-V2,全球首个无限时长视频生成模型,具备电影级理解和全面开源特性,解决了AI视频生成领域的时长限制、专业度缺失和质量妥协等核心问题,重塑创意内容产业的未来。

AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行

AI设计出全新的引力波探测工具,扩大可观测宇宙体积50倍,并推动物理学进入新领域,研究者发现AI创造的策略超越人类理解,开启未来科学的新视角。
上一篇
Sand AI开源全球首个自回归视频生成大模型MAGI-1;北大与UCLA团队实现AI零样本迁移3D游戏;金山推出政务大模型降本90%;DeepMind提出「生成幽灵」概念;字节跳动内测扣子空间Agent | 04月22日AI资讯
下一篇
Mechanize计划自动化取代人类;Gemini 2.5 Flash编码超越OpenAI;OpenAI o3模型幻觉率狂飙;Transformer+Mamba组合性能飙升;扩散LLM推理框架d1开源 | 04月20日AI资讯