AI日报
黄仁勋密会MiniMax交流AI技术;OpenAI发布ChatGPT Agent;腾讯Qwen2.5-7B模型情感对话得分翻5倍;微软推出无污染LLM基准;苹果发布2025基础模型技术报告 | 07月18日AI资讯
00 分钟
2025-7-18
2025-7-18
slug
summary
tags
icon
password

独家|继雷军之后,黄仁勋还“密会”了MiniMax,深度交流两小时

黄仁勋与MiniMax创始人闫俊杰会面,深入交流AI技术与市场动态,MiniMax近期发布多款新模型并申请IPO,显示出其在中国AI创新中的重要地位。黄仁勋强调与创新企业的合作将推动技术进步,并表示英伟达将恢复H20在中国的销售,标志着其在中国市场的进一步深化。

OpenAI 发布 ChatGPT Agent:已向付费用户开放,与 Manus 相似

OpenAI推出的Agent模式允许用户直接对ChatGPT下达任务,如购物和信息查询,AI能在虚拟环境中自动执行复杂任务,提升效率并引发对隐私和安全的新挑战。此模式与之前的Manus相似,标志着AI进入“动手”时代。

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

腾讯的RLVER框架通过构建用户模拟器解决了多轮对话中的环境、奖励和训练困境,使得Qwen2.5-7B模型在情感对话基准上得分显著提升,表现与顶级商用模型相当,同时避免了“灾难性遗忘”现象。该模型在理解用户情感和提供个性化回应方面表现出色。

「0污染」LLM理解基准来了!20000道题14个学科全覆盖,来自微软

微软推出的MMLU-CF是一个无污染的多任务语言理解基准,包含20,000道题目,涵盖14个学科,旨在提供更公平、准确的评估大语言模型能力,避免数据污染和泄露问题。该基准测试显示,OpenAI o1在MMLU-CF上的得分显著低于MMLU,表明其严格性。

庞若鸣交班陈智峰,苹果发布2025基础模型技术报告

苹果发布了2025年基础语言模型技术报告,介绍了新一代多语言、多模态模型的架构和优化技术,强调了用户价值与功能扩展的平衡,同时提升了设备端和私有云计算的效率。新模型支持图像理解和工具调用,遵循负责任的人工智能理念,确保用户隐私安全。庞若鸣将接力棒交给新负责人陈智峰。
上一篇
AI资讯-07月19日
下一篇
黄仁勋谈中美芯片与AI发展;谷歌MoR架构挑战Transformer;人类险胜OpenAI编程竞赛;普林斯顿开源数学定理证明模型;Anthropic夺回核心编程大将 | 07月17日AI资讯