slug
summary
tags
icon
password
⏩世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「鹦鹉学舌」。研究者通过对随机参考程序进行采样来构建训练示例,然后对5个随机输入进行采样并执行程序,以获得相应的5个输出。LM由交错输入和输出组成的示例语料库上进行下一个token预测训练,然后是参考程序。在测试时,研究者向LM提供看不见的输入输出规范,并使用贪婪解码来预测程序在超过100万个随机谜题上进行训练后,研究人员发现,模型自发地形成了对底层模拟环境的概念!
⏩首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist
Sakana AI推出了AI Scientist,这是首个全自动科学发现AI系统,能够独立进行科学研究、生成新颖的研究想法、撰写完整论文并进行同行评审。该系统展示了在机器学习领域的多功能性,成本低至每篇论文约15美元,标志着人工智能在科学研究中的潜力和创新能力的重大进展。
⏩DeepSeek开源数学大模型,高中、大学定理证明新SOTA
DeepSeek-Prover-V1.5通过引入新的树搜索算法和蒙特卡洛树搜索技术,在高中和大学定理证明中实现了新的SOTA。评估显示,DeepSeek-Prover-V1.5在miniF2F数据集上的通过率达到63.5%,在ProofNet数据集上分别为25.4%和25.3%。该模型通过强化学习和监督微调进一步提升性能,采用RMaxTS算法优化探索过程,显著提高了证明生成的效率和准确性。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/fef48606-eacd-4424-b65d-66e2213859f1
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。