slug
summary
tags
icon
password
商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
王晓刚认为,具身智能的未来在于世界模型的应用,能够加速AI从数字空间进入物理世界。商汤科技通过「悟能」平台,结合多年的计算机视觉和大模型技术,致力于解决数据匮乏的问题,推动具身智能的发展。当前,自动驾驶和人机交互技术的进步为具身智能提供了新的想象空间,但仍面临硬件和数据采集的挑战。商汤希望通过其技术积累,成为行业内的「机器人大脑」,实现更广泛的应用和连接。
苹果 AI 下半场:年底问世的新 Siri,要彻底改变 iPhone 的交互
苹果计划在2025年底至2027年间逐步重塑Siri,推出更智能的自然语言理解和深度应用控制功能。新Siri将通过App Intents框架实现更复杂的操作,目标是成为一个能主动对话的智能助手,超越现有的AI助手。苹果CEO强调这一转型是公司的必然选择,旨在重拾市场领导地位并应对AI竞争。成功与否将影响苹果未来的生态系统和用户信任。
刚刚,OpenAI内部推理模型斩获IOI 2025金牌!所有AI选手中第一
OpenAI的内部推理模型在IOI 2025比赛中获得金牌,击败325名人类选手,排名第6,AI组第1。该模型未经过特别训练,仅使用基本工具进行推理。与去年相比,模型的排名显著提升,反映出其在多个领域的强大能力。尽管商业模型表现不佳,OpenAI的模型仍显示出领先优势,引发了对AI技术发展的广泛讨论和猜测。
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
智谱最新开源的GLM-4.5V多模态视觉推理模型在42个公开榜单中取得41项SOTA,具备图像、视频、文档理解等多项功能。该模型通过GeoGuessr游戏和视频理解能力展现出强大的推理能力,能够准确识别建筑风格和复刻网页。GLM-4.5V的Grounding能力使其能够精确定位视觉元素,并在空间关系理解和图像识别方面表现优异。此次更新还提供了高性价比的多模态AI解决方案,推动了多模态技术的实际应用。
拿下3D生成行业新标杆!昆仑万维Matrix-3D新模型鲨疯了,一张图建模游戏场景
Matrix-3D是昆仑万维推出的全新3D生成框架,能够通过单张图片生成高质量的可漫游3D场景,支持360°自由视角和用户自定义运动轨迹。该模型在生成效果、几何一致性和视觉质量上超越现有方法,具备快速生成和强泛化能力,标志着3D生成行业的新标杆。昆仑万维在空间智能领域的长期布局和技术积累,使得Matrix-3D成为其在AGI方向上的重要探索成果。
上一篇
昆仑万维发布Skywork UniPic 2.0;Figure机器人展示衣物折叠能力;华人团队扩散模型数据潜力突破;OpenAI CEO谈GPT-5商业化;美国发布AI行动计划 | 08月13日AI资讯
下一篇
百川M2击败OpenAI成医疗模型领导者;智谱发布GLM-4.5技术报告;银河通用Galbot机器人展示高级操作;LEGION框架检测AI伪造图像;小云雀AI视频创作工具降低门槛 | 08月11日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/24d629a6-152d-81dc-be0c-d679f76cdba7
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。