AI日报
百度数字人直播爆卖5500万;DeepMind强化学习微调缩小知行差距;华为发布盘古大模型5.5;苹果或140亿美元收购Perplexity;上海交大7B智能体超越Deepseek-R1 | 06月21日AI资讯
00 分钟
2025-6-21
2025-6-21
slug
summary
tags
icon
password

假老罗打败真老罗?618一夜爆卖5500万!真相揭穿网友傻眼

罗永浩的数字人直播在618活动中创下5500万的销售记录,超越了他的真人直播。背后是百度的多模协同数字人技术,使得数字人具备高度拟真性和互动能力,预计未来数字人直播将广泛应用于电商等领域,市场规模将在2026年突破百亿。

知识储备≠模型能力!DeepMind强化学习微调:大幅缩小「知行差距」

研究表明,强化学习微调(RLFT)可以通过优化自我生成的推理链来提升大语言模型的决策能力,缩小知行差距,但仍需改进探索策略。模型在决策时常因贪婪性和频率偏差而未能充分利用其知识,导致探索不足。实验结果显示,尽管模型在推理上表现良好,但在实际行动中仍偏向于贪婪选择,影响了决策效果。

刚刚,华为盘古大模型5.5问世!推理、智能体能力大爆发

华为发布了盘古大模型5.5,强调自然语言处理和多模态能力,包含多个基础模型,推动产业智能化升级,具备高效推理和深度研究能力,适用于科学计算、工业预测和智能驾驶等领域。

外媒:苹果内部讨论买Perplexity,140亿美元史上最大收购?

苹果公司高管正在讨论收购AI初创公司Perplexity,可能成为其历史上最大规模的收购,估值高达140亿美元。Perplexity在AI搜索领域具有强大的技术优势,能够整合多种信息源,帮助苹果改进Siri和Safari浏览器,减少对谷歌的依赖。尽管有收购传闻,Perplexity表示目前没有相关谈判。

7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式

上海交通大学的研究表明,7B参数的AI智能体通过“经验学习”在仅9个任务上训练,成功超越了671B的Deepseek-R1,标志着AI自主学习的新范式,减少了人类干预,加速了AGI的发展进程。
上一篇
2025中国AGI创新机构TOP50发布;Minimax海螺新模型爆火;英伟达ProRL训练逆袭7B模型;苹果拟300亿收购Perplexity;清华英伟达联合提出NFT算法 | 06月22日AI资讯
下一篇
华为发布HarmonyOS 6.0;Karpathy提出软件3.0时代;清华发布日晷时序大模型;腾讯开源音乐生成模型;字节跳动开源AI编程项目 | 06月20日AI资讯