slug
summary
tags
icon
password
Mira Murati 创业公司首发长文,尝试解决 LLM 推理的不确定性难题
Mira Murati创办的Thinking Machines Lab发布了关于解决大语言模型推理不确定性问题的文章,探讨了浮点数非结合性和并发执行对结果一致性的影响。文章强调可复现性的重要性,并提出了实现批次不变性的策略,以确保在推理中获得一致的结果,从而推动在策略强化学习的有效性。
刚刚,ChatGPT支持MCP了!一句Prompt即可全自动化
OpenAI正式推出ChatGPT的MCP功能,允许通过一句Prompt实现全自动化,提升了自动化程度。MCP(模型上下文协议)简化了不同AI模型和工具之间的交互,支持上下文管理和可扩展性。用户可以在ChatGPT中开启开发者模式,连接MCP服务器,进行如查询余额和处理退款等操作。
刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
英伟达推出了专为大规模上下文AI设计的Rubin CPX GPU,具备超高性能和效率,能够处理数百万个Token的推理。该GPU的投资回报率高达30-50倍,重写了推理经济,适用于软件开发和视频生成等复杂任务。Rubin CPX与NVIDIA的其他产品紧密协作,预计将于2026年底上市。
Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
全球最快的开源大模型K2 Think由阿联酋的穆罕默德·本·扎耶德人工智能大学与G42 AI合作推出,速度达到每秒2000个tokens,尽管参数仅为320亿。该模型在数学推理方面表现出色,已通过多项基准测试,并采用了多种技术创新以提升性能。
交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式
复旦、创智、字节的研究者们推出了AgentGym-RL框架,这是首个无需监督微调的多环境强化学习智能体训练框架,旨在通过扩展交互轮次提升智能体的决策能力。该框架结合ScalingInter-RL方法,允许智能体在训练中逐步增加与环境的交互,显著提高了在复杂任务中的表现。
英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛
NVIDIA Research推出的SATLUTION框架能将AI的代码进化能力扩展至完整代码库,成功在2025年SAT竞赛中超越人类设计的求解器。该系统通过双智能体架构和动态规则系统,进行代码的迭代优化,并在严格的验证流程下确保代码质量。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/26b629a6-152d-818f-bdf8-c75297420c86
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。