AI日报
【AI资讯】7月22日
00 分钟
2024-7-22
2024-7-22
slug
summary
tags
icon
password

⏩可「自主进化」的Agent?首个端到端智能体符号化训练框架开源了

这篇文章介绍了一个开源的端到端智能体符号化训练框架,该框架通过将AI Agent和神经网络进行类比,使用文本和大模型建模损失函数、梯度和优化器,实现对智能体的端到端符号化训练。作者认为,将AI Agent从以专家经验为核心转变为以数据为核心是基于大模型的智能体的重要发展方向。该框架的代码已经在GitHub上开源。

⏩机器人版的「斯坦福小镇」来了,专为具身智能研究打造

这篇文章介绍了上海人工智能实验室等机构打造的一个虚拟小镇,专为各种机器人设计的模拟互动3D社会。这个小镇包含10万个交互式场景和89种不同的场景类别,旨在解决具身智能领域的数据稀缺问题。作者希望这项工作能缓解该领域高质量数据稀缺的问题,并为具身AI研究提供更全面的评估。
 

⏩挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2

Meta最近发布的MobileLLM系列,规模甚至降低到了1B以下,两个版本分别只有125M和350M参数,但却实现了比更大规模模型更优的性能。论文地址:https://arxiv.org/abs/2402.14905 LeCun也亲自发推为这项研究背书,称赞了其中一系列精简参数量的操作。MobileLLM不仅在同等大小的模型中达到了SOTA性能,而且提出,架构的深度比宽度更重要。一个「深而窄」的「瘦长」小模型同样可以学习到抽象概念。作者还提出了一种块间层共享(block-wise layer-sharing)方法,能够在不引入额外内存开销的情况下进一步提高模型准确率,但代价是增加解码过程的推理延迟。
 

⏩爆火免费书《深入理解深度学习》终于出中文版了

这篇文章介绍了一本名为《深入理解深度学习》的中文版书籍的发布。该书由麻省理工学院出版社出版,共有21个章节,涵盖了深度学习领域的关键概念。作者提供了书籍的GitHub链接和电子版下载量。文章还介绍了作者Simon J.D. Prince的背景和他在计算机视觉和计算机图形学领域的研究成果。该文章提供了对于想要深入了解深度学习的读者来说非常有价值的信息。
上一篇
【AI资讯】7月23日
下一篇
【AI资讯】7月21日