微信发布WeDLM实现AR模型3倍加速；OpenAI首款硬件定型为AI笔；Anthropic豪购谷歌100万块TPU；MIT提出套娃模型突破推理限制；DeepSeek发布多流残差连接新论文 | 01月04日AI资讯

slug

summary

微信推出的WeDLM模型实现了推理速度的显著提升，OpenAI发布的AI笔旨在提供低干扰的交互体验，Anthropic以210亿美元收购谷歌TPU以增强其计算能力，MIT提出的套娃模型突破了长文本处理的限制，DeepSeek的研究聚焦于多流残差连接的应用，Mind Lab Toolkit在AI训练中展现出高效性，光帆科技推出的主动式AI耳机则标志着AI硬件的重大转变。

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

腾讯微信AI团队提出的WeDLM模型在标准因果注意力下实现扩散式解码，推理速度超过同等自回归模型，低熵场景下加速超过10倍，数学推理任务上实现3倍加速，同时保持生成质量。WeDLM通过拓扑重排序和双流掩码策略优化了推理效率，实验结果显示其在多个任务上超越了现有模型。

🔗访问原文

OpenAI首款硬件定型为笔！网友：就叫oPen吧

OpenAI首款硬件是一支AI笔，由前苹果设计师Jony Ive参与设计，具备音频能力并能与ChatGPT双向交流。此产品旨在提供低干扰的AI交互体验，避免与手机巨头直接竞争，同时为OpenAI开辟新的变现路径。该笔可能会将手写内容转化为文本，并与配对设备通信，提升用户体验。

🔗访问原文

Anthropic打响「去CUDA」第一枪！210亿美元豪购谷歌100万块TPU

Anthropic以210亿美元收购100万块谷歌TPU，计划自建超算，标志着AI军备竞赛的新阶段。Claude Opus 4.5展现出强大的编码能力，能够在短时间内完成复杂任务。Anthropic选择以较少资源实现更多目标，强调高质量训练数据和模型推理能力。

🔗访问原文

MIT新论文：2026推理模型过时了，「套娃模型」当立

MIT最新提出的「套娃模型」通过将文本存入代码环境并递归调用自身，显著提高了长文本处理能力，突破了GPT-5的上下文窗口限制，处理规模达到1000万Token。该模型有效解决了上下文腐烂问题，降低了计算成本，并在复杂任务中表现出更高的推理性能，预示着未来的主流方向。

🔗访问原文

DeepSeek 今年第一篇论文，到底在讲什么？

DeepSeek的论文探讨了多流残差连接在大模型中的应用，提出了通过引入双随机矩阵来解决信号爆炸的问题，从而保持信息的稳定传递。经过优化，27B模型的信号增益从3000降至1.6，训练稳定性显著提升，同时在下游任务上表现出更好的推理能力和阅读理解能力。

🔗访问原文

前OpenAI CTO押注的赛道，被中国团队抢先跑通，AI「下半场」入场券人人有份

在AI领域，国内团队Mind Lab推出的Mind Lab Toolkit（MinT）以极高的工程效率解决后训练的复杂性，成为全球首个能与Thinking Machines Lab的Tinker相竞争的产品。MinT支持在CPU上高效训练万亿参数模型，显著降低成本，广泛应用于基础研究和行业。

🔗访问原文

从「被动」到「主动」，为什么给耳机装上「眼睛」后AI范式变了？

光帆科技推出全球首款具视觉感知能力的主动式AI耳机，结合智能手表和充电盒，形成全感穿戴设备，旨在实现无屏、主动式AI交互。该设备通过持续感知用户环境，主动提供建议和完成任务，标志着AI硬件的重大转变，挑战传统被动式智能。

🔗访问原文

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

OpenAI首款硬件定型为笔！网友：就叫oPen吧

Anthropic打响「去CUDA」第一枪！210亿美元豪购谷歌100万块TPU

MIT新论文：2026推理模型过时了，「套娃模型」当立

DeepSeek 今年第一篇论文，到底在讲什么？

前OpenAI CTO押注的赛道，被中国团队抢先跑通，AI「下半场」入场券人人有份

从「被动」到「主动」，为什么给耳机装上「眼睛」后AI范式变了？

AI学长小林

交流频道

加入我们的社群讨论分享