商汤王晓刚谈世界模型加速AI进入物理世界；苹果计划重塑Siri；OpenAI推理模型斩获IOI金牌；智谱开源GLM-4.5V多模态模型；昆仑万维推出Matrix-3D | 08月12日AI资讯

slug

summary

商汤科技的王晓刚认为世界模型将加速AI进入物理世界，苹果计划重塑Siri以提升交互体验，OpenAI的推理模型在IOI 2025中获金牌，智谱的GLM-4.5V多模态模型在多个榜单上表现优异，昆仑万维推出的Matrix-3D框架能够通过单张图片生成高质量3D场景，标志着3D生成行业的新标杆。

商汤王晓刚：世界模型将加快AI从数字空间进入物理世界，「悟能」想做那个桥梁

王晓刚认为，具身智能的未来在于世界模型的应用，能够加速AI从数字空间进入物理世界。商汤科技通过「悟能」平台，结合多年的计算机视觉和大模型技术，致力于解决数据匮乏的问题，推动具身智能的发展。当前，自动驾驶和人机交互技术的进步为具身智能提供了新的想象空间，但仍面临硬件和数据采集的挑战。商汤希望通过其技术积累，成为行业内的「机器人大脑」，实现更广泛的应用和连接。

🔗访问原文

苹果 AI 下半场：年底问世的新 Siri，要彻底改变 iPhone 的交互

苹果计划在2025年底至2027年间逐步重塑Siri，推出更智能的自然语言理解和深度应用控制功能。新Siri将通过App Intents框架实现更复杂的操作，目标是成为一个能主动对话的智能助手，超越现有的AI助手。苹果CEO强调这一转型是公司的必然选择，旨在重拾市场领导地位并应对AI竞争。成功与否将影响苹果未来的生态系统和用户信任。

🔗访问原文

刚刚，OpenAI内部推理模型斩获IOI 2025金牌！所有AI选手中第一

OpenAI的内部推理模型在IOI 2025比赛中获得金牌，击败325名人类选手，排名第6，AI组第1。该模型未经过特别训练，仅使用基本工具进行推理。与去年相比，模型的排名显著提升，反映出其在多个领域的强大能力。尽管商业模型表现不佳，OpenAI的模型仍显示出领先优势，引发了对AI技术发展的广泛讨论和猜测。

🔗访问原文

41个榜单SOTA！智谱最新开源GLM-4.5V实测：看图猜地址、视频秒变代码

智谱最新开源的GLM-4.5V多模态视觉推理模型在42个公开榜单中取得41项SOTA，具备图像、视频、文档理解等多项功能。该模型通过GeoGuessr游戏和视频理解能力展现出强大的推理能力，能够准确识别建筑风格和复刻网页。GLM-4.5V的Grounding能力使其能够精确定位视觉元素，并在空间关系理解和图像识别方面表现优异。此次更新还提供了高性价比的多模态AI解决方案，推动了多模态技术的实际应用。

🔗访问原文

拿下3D生成行业新标杆！昆仑万维Matrix-3D新模型鲨疯了，一张图建模游戏场景

Matrix-3D是昆仑万维推出的全新3D生成框架，能够通过单张图片生成高质量的可漫游3D场景，支持360°自由视角和用户自定义运动轨迹。该模型在生成效果、几何一致性和视觉质量上超越现有方法，具备快速生成和强泛化能力，标志着3D生成行业的新标杆。昆仑万维在空间智能领域的长期布局和技术积累，使得Matrix-3D成为其在AGI方向上的重要探索成果。

🔗访问原文

商汤王晓刚：世界模型将加快AI从数字空间进入物理世界，「悟能」想做那个桥梁

苹果 AI 下半场：年底问世的新 Siri，要彻底改变 iPhone 的交互

刚刚，OpenAI内部推理模型斩获IOI 2025金牌！所有AI选手中第一

41个榜单SOTA！智谱最新开源GLM-4.5V实测：看图猜地址、视频秒变代码

拿下3D生成行业新标杆！昆仑万维Matrix-3D新模型鲨疯了，一张图建模游戏场景

AI学长小林

交流频道

加入我们的社群讨论分享