slug
summary
tags
icon
password
OpenAI:GPT-5就是All in One,集成各种产品
OpenAI计划将Codex、Operator、Deep Research和Memory整合为一个整体,以提升编程效率和减少模型切换。Codex的使用已使内部编程效率提升约3倍,未来将探索灵活的定价方案,并推出免费API积分供Plus/Pro用户使用。团队还强调Codex将帮助新手程序员学习,而非取代他们。
带图推理碾压同类开源模型!港中文微软等开源OpenThinkIMG框架,教AI学会使用视觉工具
OpenThinkIMG框架由港中文和微软等联合推出,旨在提升AI的视觉工具使用和推理能力,通过模块化工具部署、创新的V-ToolRL训练算法和高质量数据生成方法,显著提高AI在图表推理任务中的表现,超越现有模型。
85倍速度碾压:苹果开源FastVLM,能在iphone直接运行的视觉语言模型
苹果开源了FastVLM,一个高效的视觉语言模型,能够在iPhone上直接运行,速度比传统模型快85倍。该模型结合卷积层和Transformer模块,优化了图像处理效率,适合边缘设备和实时应用,支持多种参数版本供用户选择。
ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%
南洋理工大学与武汉大学合作提出了一种基于RAG的高分辨率图像感知框架Retrieval-Augmented Perception (RAP),在视觉任务中准确率提高20%。该方法通过维持图像块的相对位置和自适应选择图像块数量,显著提升了多模态大语言模型对高分辨率图像的感知能力。
争夺 Agent 市场,微软的押宝点竟是「情商」?
Mustafa Suleyman强调AI情商的重要性,认为AI将成为人们生活中的伴侣而非仅仅是工具,未来工作将更加依赖AI协助,用户需培养与AI协作的能力。微软的Copilot将通过情感化设计实现差异化竞争。
上一篇
OpenAI强调AI推理能力提升;Llama 4发布延期引关注;华为Selftok技术超越现有模型;港中文提出矩阵乘法新算法;ICML 2025探讨对抗扰动与推理加速 | 05月18日AI资讯
下一篇
Windsurf发布AI编程模型SWE-1;BLIP3-o统一多模态模型登场;腾讯混元图像2.0实现零延迟生图;MiniMax推出AI声音模型Speech-02;DeepSeek-V3揭秘低成本训练大模型 | 05月16日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/1f6629a6-152d-8137-9d6a-d53e3fd2c67e
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。