AI日报
【AI资讯】9月27日
00 分钟
2024-9-27
2024-9-27
slug
summary
tags
icon
password

⏩完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

本文介绍了Google DeepMind的SCoRe方法,该方法通过在线多轮强化学习显著提升了大型语言模型(LLM)的自我修正能力,尤其是在没有外部输入的情况下。研究表明,SCoRe在MATH和HumanEval基准测试中分别提高了15.6%和9.1%的自我修正性能。与传统的有监督微调方法相比,SCoRe只需训练一个模型,利用自生成数据进行自我纠正,避免了多模型依赖和训练数据分布不匹配的问题。文章详细探讨了SCoRe的训练过程及其在Gemini 1.0 Pro和1.5 Flash模型上的应用,强调了自我纠正能力在大模型推理中的重要性,展示了该方法在AI领域的创新性和实用性。
 

⏩英伟达RTX 5090功耗高达600W,32G显存,核心比5080多一倍

本文讨论了英伟达即将发布的RTX 50系列显卡的初步规格,特别是RTX 5090和RTX 5080的性能差异。RTX 5090预计将拥有600W的功耗和32GB显存,CUDA核心数量达到21760,性能可能是RTX 4080的两倍。文章分析了英伟达可能采用的多芯片设计和技术背景,指出RTX 50系列可能会在AI计算领域产生影响。尽管目前信息尚未得到官方确认,但文章提供了对未来显卡市场的深刻见解,尤其是在AI产业快速发展的背景下,英伟达的产品策略可能会有所调整。
 

⏩Layout工程师危,谷歌自动芯片设计AlphaChip问世,开放权重可外部定制

谷歌推出了名为AlphaChip的自动芯片设计工具,利用深度强化学习技术显著提升芯片布局设计的效率。该工具基于2020年和2021年发表的研究成果,能够在数小时内完成复杂的芯片布局,超越传统人工设计所需的数周或数月时间。AlphaChip的开放预训练模型使外部用户能够更容易地进行芯片设计,推动了AI芯片设计的自动化进程。谷歌的首席科学家Jeff Dean和DeepMind的CEO Demis Hassabis均表示,AlphaChip将改变微芯片设计的方式,并形成了一个良性循环,促进AI模型和芯片的相互提升。该技术已被应用于谷歌的TPU芯片设计,推动了AI服务的核心能力。
 

⏩OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?

本文探讨了OpenAI最新模型o1在医学领域的初步研究,评估其在医学任务中的表现。研究显示,o1在理解、推理和多语言能力方面的提升,使其在37个医学数据集中的准确率显著高于之前的GPT-4。研究团队采用了思维链技术和强化学习,旨在增强模型的推理能力。尽管o1在复杂的医学任务中表现出色,但仍存在解码时间较长和在某些简单任务中表现不佳的问题。未来的研究需要改进评估指标,以更好地捕捉模型的能力并解决其局限性。

⏩百度谢广军:百模大战和价格战之后,大模型下一个战场在工具平台

本文讨论了百度谢广军对大模型发展的看法,指出在经历了百模大战和价格战后,未来的竞争将转向工具平台的建设。文章强调,企业不应仅仅关注算力和模型训练,而应探索如何将大模型应用于实际场景,提升工具的实用性和用户体验。这一观点反映了当前AI领域的趋势,尤其是在大模型应用的多样化和工具化方面,具有较高的前瞻性和实用价值。
上一篇
【AI资讯】9月28日
下一篇
【AI资讯】9月26日