OpenAI与博通合作开发AI芯片；Karpathy开源nanochat项目；Meta发布SAM 3视觉模型；蚂蚁集团开源dInfer推理框架；Gemini 3前端开发获好评 | 10月14日AI资讯

slug

summary

OpenAI官宣自研首颗芯片，AI界「M1时刻」九个月杀到！联手博通三年10GW

OpenAI与博通合作开发自研AI芯片，预计到2029年底部署10GW算力，标志着AI领域的重大进展。该芯片将提高GPT模型的性能和效率，OpenAI希望通过自研芯片和系统实现更大的自主性，减少对外部供应商的依赖。

Karpathy「疯狂之作」：100美元、4小时，就能训练你自己的「小型GPT」

Karpathy推出了开源项目「nanochat」，只需100美元和4小时即可训练自己的小型ChatGPT，项目代码约8000行，涵盖从数据准备到推理的全流程。该项目旨在降低LLM研究门槛，让更多人能够训练自己的模型，具有潜力成为研究工具或基准。

🔗访问原文

ICLR神秘论文曝光！SAM3用「概念」看世界，重构视觉AI新范式

Meta的SAM 3模型引入了基于概念的分割技术，允许用户通过提示识别和分割图像或视频中的所有符合特定概念的对象。该模型通过构建一个高质量的数据引擎，生成了包含400万个概念标签的数据集，并在可提示分割任务上实现了新的性能标准，显著提高了分割准确度和处理速度。

🔗访问原文

推理速度10倍提升，蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

蚂蚁集团开源了高性能扩散语言模型推理框架dInfer，推理速度提升超过10倍，达到1011 tokens/秒，超越自回归模型。dInfer通过模块化设计和多项优化策略，解决了高计算成本、KV缓存失效和并行解码的问题，标志着扩散语言模型的成熟。

🔗访问原文

前端危！Gemini 3内测结果获网友一致好评，「有史以来最强前端开发模型」

Gemini 3在内测中获得了用户的高度评价，尤其在前端开发和SVG矢量图生成方面表现出色。其多模态能力增强，能够生成介绍网页和原创音乐，且在编程和图像处理上表现优异。预计将于10月22日正式发布，用户期待其不被「阉割」。

🔗访问原文

硅谷一线创业者内部研讨：为什么只有 5%的 AI Agent 落地成功，他们做对了什么？

95%的AI代理在生产环境中失败，主要原因是上下文工程、安全性和记忆设计不足。成功的案例强调了构建复杂的上下文选择系统、有效的治理机制和多模型路由的重要性。信任是关键，用户对AI的信任影响其应用，成功的AI代理通常采用「人机协作」的设计。

🔗访问原文

剑桥揭开大模型翻车黑箱！别再怪它不懂推理，是行动出错了

研究表明，大模型在执行长时任务时的问题主要出在执行能力而非推理能力。随着任务步骤的增加，模型的每步准确率下降，导致执行失败。自条件化效应使得模型在先前犯错的情况下更易再次出错。研究强调需要关注大模型的执行稳定性，并提出通过提供明确的计划和知识来测量模型的执行能力，以提高长视界任务的成功率。

🔗访问原文

CoT 之后，CoF 如何让帧间逻辑从「隐式对齐」变成「显式思考」？

CoF（帧链推理）为视频生成与理解提供了一种新思路，通过显式推理链增强帧间一致性，克服传统方法的不足。研究表明，CoF能够将多步推理思想应用于视觉数据，提升模型在复杂场景中的推理能力和逻辑连贯性。Veo 3等模型在大规模训练下，展现出强大的泛化能力，能够在无微调条件下完成多种任务，标志着视频生成模型的新范式。

🔗访问原文

OpenAI官宣自研首颗芯片，AI界「M1时刻」九个月杀到！联手博通三年10GW

Karpathy「疯狂之作」：100美元、4小时，就能训练你自己的「小型GPT」

ICLR神秘论文曝光！SAM3用「概念」看世界，重构视觉AI新范式

推理速度10倍提升，蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

前端危！Gemini 3内测结果获网友一致好评，「有史以来最强前端开发模型」

硅谷一线创业者内部研讨：为什么只有 5%的 AI Agent 落地成功，他们做对了什么？

剑桥揭开大模型翻车黑箱！别再怪它不懂推理，是行动出错了

CoT 之后，CoF 如何让帧间逻辑从「隐式对齐」变成「显式思考」？

AI学长小林

交流频道

加入我们的社群讨论分享