slug
summary
tags
icon
password
⏩Figure AI把「终结者」造出来了
硅谷著名具身智能创业公司Figure发布了新一代人形机器人Figure 02,具备实时语音对话、AI视觉系统、机械手、内置VLM、大容量电池等特点。该机器人能够与人类实时对话,自动学习如何装配零件,并已经可以完全自主地在现实世界中执行各种任务。Figure 02的导航系统使用了VLM(视觉语言模型),机器人上的摄像头能够进行语义基础研究和快速常识性视觉推理。机器人躯干内定制有容量为2.25 KWh的电池组,可以比上一代机器人提供50%以上的能量,续航能力得到了显著提升。Figure 02还采用了全新的外骨骼结构和集成布线设计,外形上有很大改观。该机器人搭载了第四代机械手,有16个自由度,并具有与人类相当的力量,可以胜任各种复杂任务。Figure AI的创始人表示,随着机器人的不断运行,AI数据引擎将收集并整理数据用于训练模型,不断提升性能。
⏩李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot
该文章介绍了一项名为SpatialBot的空间大模型,该模型通过对RGB-Depth的理解,可以准确获得机械爪和目标物体的深度值,从而产生对空间概念的理解。作者还提出了具有三个层次的SpatialQA数据集,用于引导模型理解和使用深度信息。文章提供了模型的示例对话和模型如何理解深度图的详细说明。该文章对于了解空间智能和深度理解方面的最新研究具有很高的参考价值。
⏩GPT-4o新版本突然上线:丝滑解决9.11和9.9谁大,更强也更便宜了
GPT-4o新版本上线,性能提升且成本降低,输入和输出分别节省50%和33%。该版本支持16k token输出,并引入结构化输出功能,确保模型生成内容符合开发者定义的JSON模式。价格方面,输入为2.5美元/百万token,输出为10美元/百万token,整体成本更可控。
⏩苹果AI后台提示词曝光,工程师:别幻觉!别捏造事实!
苹果AI的后台提示词被曝光,显示其功能包括邮件助手和内容安全分类。开发者在MacOS 15.1 Beta 1中发现了这些提示词,强调了减少“幻觉”和编造事实的信息。苹果工程师们对AI的角色和行为进行了详细设定,类似于Siri的设计理念,旨在确保AI的回答准确和可控。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/1864062f-5100-4398-a635-1dbccdcfa5cf
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。