Lazy loaded image
AI日报
03月05日AI资讯 | Claude攻克图论猜想仅用31步;谷歌发布Gemini 3.1 Flash-Lite性价比模型;GPT-5.3 Instant上线优化聊天体验;上海AI Lab推出多智能体极端事件解释框架;李飞飞判断AI下一步是写世界
字数 1209阅读时长 4 分钟
2026-3-5
2026-3-5
slug
summary
Claude成功攻克图论猜想,仅用31步,标志着AI在数学探索上的新里程碑。谷歌发布Gemini 3.1 Flash-Lite模型,强调高性价比与性能优势。GPT-5.3 Instant上线,优化聊天体验,减少冗余回复。上海AI Lab推出多智能体极端事件解释框架,分析AI社会中的极端事件演化。李飞飞预测AI将向空间创作扩展,推动3D世界模型的发展。新评估范式Theory of Space考察多模态大模型在动态环境中的空间理解能力。IQuest Research发布UBio-MolFM框架,实现生物大分子的高精度模拟,推动药物研发进展。
tags
icon
password

刚刚,Claude独立攻克图论猜想,仅用31步!算法祖师爷高德纳震惊发文

Claude成功攻克了未解的图论猜想,仅用31步,令计算机科学泰斗高德纳震惊。AI在自动推理和解决创造性问题上取得了新的里程碑,标志着AI开始参与真正的数学探索。高德纳在其论文中详细描述了这一过程,并指出AI的解题方式与人类研究相似,预示着未来可能出现新的研究模式。

谷歌Gemini最强性价比模型发布,1块8读完3本三体

谷歌发布了Gemini 3.1 Flash-Lite模型,强调其高性价比和快速响应能力,每百万输入token仅需0.25美元,输出token为1.5美元。该模型在性能上显著优于前代产品,适合大规模智能应用,并支持可调思考层级。与ChatGPT的GPT-5.3 Instant相比,Gemini 3.1在成本控制和吞吐量上具有优势,但在用户交互体验上,GPT-5.3表现更佳。

GPT-5.3 Instant上线:ChatGPT终于不说教了

GPT-5.3 Instant模型上线,优化了聊天体验,减少了冗余和机械回复,使沟通更自然流畅。新模型在情商、联网搜索和写作能力上都有显著提升,能够更好地理解用户意图,减少不必要的免责声明。同时,幻觉率降低,安全性增强。未来的GPT-5.4将支持更大的上下文窗口和跨会话记忆功能,提升视觉分析能力。

在AI社会抓「内鬼」?上海AI Lab推出首个多智能体极端事件解释框架

上海人工智能实验室与多所高校合作,推出了一个多智能体极端事件解释框架,旨在分析AI社会中的极端事件演化过程。研究发现,极端事件的出现与智能体之间的非线性交互密切相关,并揭示了五大演化规律,包括少数高危智能体的驱动作用和羊群效应。该框架不仅用于事后分析,还能通过精准监管高风险行为,降低系统崩溃风险,推动构建更安全的未来。

李飞飞World Labs最新判断:AI写完代码,下一步是「写世界」?

AI正在向空间创作和现实世界任务扩展,3D被视为人机交互的通用接口。3D不仅是视觉效果,更是结构化表达,类似于代码。通过3D表示,设计师和工程师可以与生成式世界模型协作,推动可编程空间系统的发展。未来的世界模型将生成结构化的3D世界,支持数字孪生、机器人和新的应用领域,确保人类与机器之间的可靠沟通与协作。

李曼玲、李飞飞、吴佳俊等联手:评估具身大模型的新范式!

全新的具身模型空间能力评估范式Theory of Space突破了传统静态图文问答的局限,考察基础模型在动态环境中通过自主探索构建和修正空间信念的能力。研究发现,当前多模态大模型在空间理解上面临挑战,尤其在主动信息获取和视觉推理方面表现不佳。该研究提出了构建、修正和利用三大核心能力,并引入显式认知地图探测作为评测工具,以提高模型的空间推理能力。最终目标是实现更高效的空间理解,推动具身智能的实际应用。

IQuest Research 发布 UBio - MolFM:让生物大分子模拟同时实现更高精度与更快推理

IQuest Research发布的UBio-MolFM框架实现了生物大分子的高精度模拟,具备可处理最多15万原子的吞吐能力。通过构建1700万数据的UBio-Mol26数据集,采用E2Former-V2架构和三阶段课程学习,团队解决了分子模拟中的"尺度-精度"矛盾,提升了模拟的准确性和效率,推动了药物研发和生物研究的进展。
上一篇
03月06日AI资讯 | OpenAI筹备2026年IPO;GPT-5.4将具备极限推理能力;博通AI业务收入达84亿美元;Seedance 2.0视频生成成本降至1秒1元;阿里通义实验室换帅
下一篇
03月04日AI资讯 | OpenClaw突破25万星登顶GitHub;谷歌Gemini 3.1以1/4价格暴击Claude;AI Agent完成菲尔兹奖成果形式化;美团发布AI浏览器Tabbit;阿里千问硬件负责人谈AI定义硬件