黄仁勋密会MiniMax交流AI技术；OpenAI发布ChatGPT Agent；腾讯Qwen2.5-7B模型情感对话得分翻5倍；微软推出无污染LLM基准；苹果发布2025基础模型技术报告 | 07月18日AI资讯

slug

summary

黄仁勋与MiniMax创始人会面，强调合作推动技术进步；OpenAI推出ChatGPT Agent，提升任务执行效率；腾讯Qwen2.5-7B模型在情感对话基准上得分翻5倍；微软发布无污染LLM理解基准；苹果发布2025基础模型技术报告，强调用户隐私与功能扩展的平衡。

黄仁勋与MiniMax创始人闫俊杰会面，深入交流AI技术与市场动态，MiniMax近期发布多款新模型并申请IPO，显示出其在中国AI创新中的重要地位。黄仁勋强调与创新企业的合作将推动技术进步，并表示英伟达将恢复H20在中国的销售，标志着其在中国市场的进一步深化。

OpenAI推出的Agent模式允许用户直接对ChatGPT下达任务，如购物和信息查询，AI能在虚拟环境中自动执行复杂任务，提升效率并引发对隐私和安全的新挑战。此模式与之前的Manus相似，标志着AI进入“动手”时代。

腾讯的RLVER框架通过构建用户模拟器解决了多轮对话中的环境、奖励和训练困境，使得Qwen2.5-7B模型在情感对话基准上得分显著提升，表现与顶级商用模型相当，同时避免了“灾难性遗忘”现象。该模型在理解用户情感和提供个性化回应方面表现出色。

微软推出的MMLU-CF是一个无污染的多任务语言理解基准，包含20,000道题目，涵盖14个学科，旨在提供更公平、准确的评估大语言模型能力，避免数据污染和泄露问题。该基准测试显示，OpenAI o1在MMLU-CF上的得分显著低于MMLU，表明其严格性。

苹果发布了2025年基础语言模型技术报告，介绍了新一代多语言、多模态模型的架构和优化技术，强调了用户价值与功能扩展的平衡，同时提升了设备端和私有云计算的效率。新模型支持图像理解和工具调用，遵循负责任的人工智能理念，确保用户隐私安全。庞若鸣将接力棒交给新负责人陈智峰。

AI学长小林