Thinking Machines攻克LLM推理不确定性；OpenAI ChatGPT支持MCP全自动化；英伟达推出Rubin CPX百万token GPU；Qwen助力全球最快开源模型；复旦字节发布AgentGym-RL强化学习框架 | 09月11日AI资讯

slug

summary

Thinking Machines Lab发布文章探讨LLM推理不确定性，OpenAI推出ChatGPT的MCP功能实现全自动化，英伟达推出Rubin CPX GPU以支持百万token推理，Qwen推出全球最快开源模型K2 Think，复旦与字节推出AgentGym-RL框架以提升智能体训练能力，NVIDIA的SATLUTION框架在SAT竞赛中超越人类设计的求解器。

Mira Murati 创业公司首发长文，尝试解决 LLM 推理的不确定性难题

Mira Murati创办的Thinking Machines Lab发布了关于解决大语言模型推理不确定性问题的文章，探讨了浮点数非结合性和并发执行对结果一致性的影响。文章强调可复现性的重要性，并提出了实现批次不变性的策略，以确保在推理中获得一致的结果，从而推动在策略强化学习的有效性。

🔗访问原文

刚刚，ChatGPT支持MCP了！一句Prompt即可全自动化

OpenAI正式推出ChatGPT的MCP功能，允许通过一句Prompt实现全自动化，提升了自动化程度。MCP（模型上下文协议）简化了不同AI模型和工具之间的交互，支持上下文管理和可扩展性。用户可以在ChatGPT中开启开发者模式，连接MCP服务器，进行如查询余额和处理退款等操作。

🔗访问原文

刚刚，英伟达祭出下一代GPU！狂飙百万token巨兽，投1亿爆赚50亿

英伟达推出了专为大规模上下文AI设计的Rubin CPX GPU，具备超高性能和效率，能够处理数百万个Token的推理。该GPU的投资回报率高达30-50倍，重写了推理经济，适用于软件开发和视频生成等复杂任务。Rubin CPX与NVIDIA的其他产品紧密协作，预计将于2026年底上市。

🔗访问原文

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

全球最快的开源大模型K2 Think由阿联酋的穆罕默德·本·扎耶德人工智能大学与G42 AI合作推出，速度达到每秒2000个tokens，尽管参数仅为320亿。该模型在数学推理方面表现出色，已通过多项基准测试，并采用了多种技术创新以提升性能。

🔗访问原文

交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL，昇腾加持，开创智能体训练新范式

复旦、创智、字节的研究者们推出了AgentGym-RL框架，这是首个无需监督微调的多环境强化学习智能体训练框架，旨在通过扩展交互轮次提升智能体的决策能力。该框架结合ScalingInter-RL方法，允许智能体在训练中逐步增加与环境的交互，显著提高了在复杂任务中的表现。

🔗访问原文

英伟达的AI已经开始接管整个项目了？SATLUTION自主进化代码库登顶SAT竞赛

NVIDIA Research推出的SATLUTION框架能将AI的代码进化能力扩展至完整代码库，成功在2025年SAT竞赛中超越人类设计的求解器。该系统通过双智能体架构和动态规则系统，进行代码的迭代优化，并在严格的验证流程下确保代码质量。

🔗访问原文

Mira Murati 创业公司首发长文，尝试解决 LLM 推理的不确定性难题

刚刚，ChatGPT支持MCP了！一句Prompt即可全自动化

刚刚，英伟达祭出下一代GPU！狂飙百万token巨兽，投1亿爆赚50亿

Qwen又立功，全球最快开源模型诞生，超2000 tokens/秒！

交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL，昇腾加持，开创智能体训练新范式

英伟达的AI已经开始接管整个项目了？SATLUTION自主进化代码库登顶SAT竞赛

AI学长小林

交流频道

加入我们的社群讨论分享