AI日报
【AI资讯】7月8日
00 分钟
2024-7-8
2024-7-8
slug
summary
tags
icon
password

⏩北大千问团队推出数学专用版CriticGPT,找茬让大模型进步更快

北大千问团队推出数学专用版CriticGPT,提升了数学验证器的性能,为自然语言处理领域提供了一种新的训练范式。

⏩AI 青年,执掌未来十年的钥匙,2024 WAIC·云帆奖得主揭晓

该文章是机器之心发布的一篇关于2024 WAIC·云帆奖得主揭晓的报道。文章介绍了最新一届的「WAIC·云帆奖」颁奖典礼,共收到来自全球的近200份有效报名和提名,最终遴选出10位璀璨明星和15位明日之星。文章详细介绍了其中几位得主的背景和研究成果,涉及的领域包括大模型、具身智能、AI for Science、可信AI和数据安全等。该文章对AI领域的重大发展和青年人才的贡献进行了深度分析,具有较高的相关性、深度和质量。

⏩Anthropic CEO:大模型训练成本暴涨,2027年将达1000亿美元!

Anthropic首席执行官表示,当前AI模型训练成本是10亿美元,未来三年,这个数字可能会上升到100亿美元甚至1000亿美元。文章讨论了AI行业巨大的收支鸿沟以及训练成本的指数级增长。

⏩哈佛DeepMind开辟「虚拟神经科学」新领域!在世界模拟器驯养「赛博老鼠」

哈佛大学与谷歌DeepMind人工智能实验室合作创造了一只搭载了AI大脑的「虚拟大鼠」,能够模仿真实啮齿动物的所有动作,开辟了「虚拟神经科学」新领域。研究团队通过训练一个人工神经网络,控制虚拟老鼠的身体在物理模拟器中进行动作,实现了从现实到虚拟的模拟。这项研究对脑科学和机器人学具有重大意义,可以为研究神经回路提供方便、透明的模型,并有可能用于设计改进的机器人控制系统。

⏩更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

这篇文章介绍了国内一家初创公司智象未来(HiDream.ai)自主研发的视觉多模态基础模型,该模型采用了Diffusion Transformer(DiT)架构,实现了图像和视频的生成转换。文章详细介绍了智象未来的AI图像和视频生成平台「Pixeling 千象」的功能和升级,包括更具美感和艺术性的图像生成、图像中文字嵌入、分钟级视频生成等。智象未来的模型在图像生成领域迎来了全方位加强,并为多模态大模型创作提供了一站式的AI生成平台。

⏩红杉:重金购入GPU后,AI行业收入缺口达到5000亿美元

红杉资本的一篇文章指出,AI行业购买GPU的投资需要产生6000亿美元的收入才能证明合理。文章分析了GPU的能源成本、利润要求以及各大公司的预计收入,得出了AI行业收入缺口达到5000亿美元的结论。作者提出了一些问题,包括资本支出与终端客户需求的关系以及如何将创新转化为付费产品。文章还讨论了供应短缺、GPU库存增长、OpenAI的市场份额等因素对收入缺口的影响。

⏩中山大学联合字节智创数字人团队提出MMTryon虚拟试穿框架,效果优于现有SOTA

中山大学联合字节智创数字人团队提出了一种多模态多参考虚拟试穿框架MMTryon,可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。该框架有效地解决了虚拟试穿方案中的技术难点,包括单图换装和组合换装,以及对服装精细分割的依赖。通过预训练服装编码器和增强的数据构建链路,MMTryon实现了高质量的虚拟换装效果。实验证明,MMTryon在合成效果上优于现有方法。

⏩Adam有了mini版:内存占用少一半,吞吐量提升50%

该文章介绍了一种名为Adam-mini的优化器,通过减少内存占用和提高吞吐量来改进Adam优化器。Adam优化器在训练大型语言模型时内存消耗较大,而Adam-mini通过降低学习率的数量来减少内存占用,并且在保持性能的同时提高了训练速度。该方法基于Transformer的Hessian结构来分配学习率,相比于传统的Adam优化器,Adam-mini在预训练LLama2-7B模型时内存占用大幅降低,并且带来了33%的速度提升。该方法的实现代码已经发布。

⏩更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅

这篇文章介绍了国内一家初创公司智象未来(HiDream.ai)自主研发的视觉多模态基础模型,以及他们推出的AI图像和视频生成平台「Pixeling 千象」。文章提到他们的模型基于中文原生的独有DiT架构,实现了更强大、更稳定、对用户更友好的图像和视频生成能力,包括更具美感和艺术性的图像生成、图像中文字嵌入、分钟级视频生成等。文章还展示了一些生成的图像示例,并介绍了模型在图像生成相关性和复杂逻辑理解方面的提升。

⏩WAIC上,高通这一波生成式AI创新,让我们看到了未来

该文章介绍了高通在WAIC上展示的一系列终端侧生成式AI能力,包括AI PC和AI手机芯片。文章详细介绍了高通芯片的性能和特点,以及其在AI计算方面的优势。同时,文章还提到了生成式AI对计算资源的需求和挑战,以及高通在解决这些挑战方面的努力。该文章对AI领域的发展趋势和技术创新进行了深入分析,对读者了解AI领域的最新进展具有重要参考价值。

⏩开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军

该文章介绍了一种针对长视频流的在线理解多模态大模型Flash-VStream。该模型具有快速记忆重要信息和实时回答用户提问的能力,能够处理极长的视频流数据,并在多个长视频问答benchmark上达到了SOTA。此外,该模型还在CVPR'24长视频问答竞赛中获得了冠军。

⏩全尺寸通用人形机器人青龙亮相WAIC,加速迈入具身智能时代

本文报道了2024 WAIC世界人工智能大会人形机器人与具身智能发展论坛的举办情况。论坛邀请了国内外人形机器人与具身智能领域的学者、企业代表以及开发者代表进行了主旨报告、技术分享和圆桌讨论,并发布了人形机器人创新成果。文章介绍了全尺寸通用人形机器人“青龙”的发布,该机器人具备全尺寸设计和高算力的具身智能控制器,能够深度感知并融合周围环境信息,实现更为智能的自主决策与控制。此外,文章还介绍了其他专家的演讲和技术分享,展示了人形机器人和具身智能领域的最新技术前沿与成果。

⏩达摩院发布一站式AI视频创作平台"寻光",打造全新AI工作流

达摩院发布了一站式AI视频创作平台“寻光”,旨在提升AI视频创作的效率。该平台可以辅助用户创作剧本、分镜图等,并通过工作流整合提升创作全流程的效率。它提供了丰富的AI编辑功能,包括人物控制、场景控制、风格迁移等,让视频中的元素和对象精准可控。此外,该平台还首次推出了基于图层的视频编辑功能,用户可以通过文本输入生成具有透明背景的视频,并将其融合到其他背景视频中。达摩院希望通过寻光平台重塑传统视频制作的整个流程,打造AI时代的全新视频工作流。

⏩从智算到密算,大模型数据困境新解法 | 智者访谈

该文章讨论了大模型产业发展中的数据供给问题以及数据安全和隐私保护的挑战。文章介绍了蚂蚁密算发布的隐语 Cloud 大模型密算平台,该平台通过可信隐私计算技术实现了数据密态流转和模型资产、数据安全以及用户隐私的保护。文章提到了大模型在垂直行业应用中的私有化部署成本高和更新迭代慢的问题,并介绍了隐语 Cloud 大模型密算平台提供的公有云和专有云交付方案。

⏩单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速

微软的研究提出了一种名为MInference的稀疏计算方法,可以加速长序列处理预填充阶段,从而在单卡机器上以10倍的速度处理超过1M的输入文本。该方法无需对预训练设置进行修改或额外的微调,通过评估多个下游任务和模型,实验证明MInference可以有效降低A100上的预填充推理延迟,同时保持准确性。使用MInference 1.0,长上下文LLM在单个A100上的推理速度实现了10倍提升,并且准确度更高。

⏩像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了

这篇文章介绍了哥本哈根信息技术大学的研究团队提出的一种自组织神经网络LNDP,该网络具有类似于生物神经网络的高度可塑性。研究团队通过扩展神经发育程序(NDP)模型,提出了一种能够实现可塑性和结构变化的机制。LNDP通过局部计算、局部活动和全局奖励函数来实现突触和结构的可塑性。研究团队还展示了LNDP在强化学习任务中的应用,并证明了其在非平稳环境下具有更好的适应性。该研究对于人工神经网络的可塑性和自组织性具有重要意义。

⏩理财AI勇闯「无人区」:理解专家、成为专家

这篇文章介绍了蚂蚁财富推出的AI理财助理支小宝,以及其在意图理解和投顾服务方面的技术发展。支小宝通过引入大模型技术和专业智能体框架,实现了更准确的意图理解和更专业的投顾服务。文章提到支小宝的用户已超过四千万,说明其在市场上的影响力。这篇文章对AI在理财领域的应用进行了深入分析,对于了解AI在金融领域的发展趋势具有一定的参考价值。

⏩支付宝医疗大模型亮相!中英文考试超GPT-4,已落地江浙沪一线医院

支付宝医疗大模型亮相,中英文考试超GPT-4,已落地江浙沪一线医院。该模型在识别报告、药品、毛发等图像方面准确率达到90%以上。

⏩Nature子刊,优于AlphaFold,全原子采样,一种预测肽结构的AI方法

这篇文章介绍了一种名为PepFlow的AI方法,用于预测肽的结构。PepFlow是一种可转移生成模型,可以从输入肽的允许构象空间中直接进行全原子采样。研究人员使用深度学习在几分钟内捕捉到肽的精确构象。该方法可以准确预测肽结构,并有效重现实验肽集合。PepFlow的应用前景包括指导药物开发和肽对接方法的改进。然而,该方法仍有一些局限性,需要进一步改进。

⏩上交大洪亮课题组&上海AI实验室团队发布FSFP,基于语言模型的蛋白质功能小样本预测方法,登Nature子刊

上海交通大学洪亮课题组与上海AI实验室团队发布了一种基于语言模型的蛋白质功能小样本预测方法FSFP。该方法利用元学习、排序学习和参数高效的微调方法,在只利用少量湿实验数据的情况下,能够训练蛋白质预训练模型,并大幅提高对蛋白质突变-性质预测的效果。该研究成果发表在Nature子刊《Nature Communications》上。该方法对解决蛋白质工程的高实验周期和降低实验成本具有重要意义。
上一篇
【AI资讯】7月9日
下一篇
【AI资讯】7月7日