slug
summary
tags
icon
password
微信炼出扩散语言模型,实现vLLM部署AR模型3倍加速,低熵场景超10倍
腾讯微信AI团队提出的WeDLM模型在标准因果注意力下实现扩散式解码,推理速度超过同等自回归模型,低熵场景下加速超过10倍,数学推理任务上实现3倍加速,同时保持生成质量。WeDLM通过拓扑重排序和双流掩码策略优化了推理效率,实验结果显示其在多个任务上超越了现有模型。
OpenAI首款硬件定型为笔!网友:就叫oPen吧
OpenAI首款硬件是一支AI笔,由前苹果设计师Jony Ive参与设计,具备音频能力并能与ChatGPT双向交流。此产品旨在提供低干扰的AI交互体验,避免与手机巨头直接竞争,同时为OpenAI开辟新的变现路径。该笔可能会将手写内容转化为文本,并与配对设备通信,提升用户体验。
Anthropic打响「去CUDA」第一枪!210亿美元豪购谷歌100万块TPU
Anthropic以210亿美元收购100万块谷歌TPU,计划自建超算,标志着AI军备竞赛的新阶段。Claude Opus 4.5展现出强大的编码能力,能够在短时间内完成复杂任务。Anthropic选择以较少资源实现更多目标,强调高质量训练数据和模型推理能力。
MIT新论文:2026推理模型过时了,「套娃模型」当立
MIT最新提出的「套娃模型」通过将文本存入代码环境并递归调用自身,显著提高了长文本处理能力,突破了GPT-5的上下文窗口限制,处理规模达到1000万Token。该模型有效解决了上下文腐烂问题,降低了计算成本,并在复杂任务中表现出更高的推理性能,预示着未来的主流方向。
DeepSeek 今年第一篇论文,到底在讲什么?
DeepSeek的论文探讨了多流残差连接在大模型中的应用,提出了通过引入双随机矩阵来解决信号爆炸的问题,从而保持信息的稳定传递。经过优化,27B模型的信号增益从3000降至1.6,训练稳定性显著提升,同时在下游任务上表现出更好的推理能力和阅读理解能力。
前OpenAI CTO押注的赛道,被中国团队抢先跑通,AI「下半场」入场券人人有份
在AI领域,国内团队Mind Lab推出的Mind Lab Toolkit(MinT)以极高的工程效率解决后训练的复杂性,成为全球首个能与Thinking Machines Lab的Tinker相竞争的产品。MinT支持在CPU上高效训练万亿参数模型,显著降低成本,广泛应用于基础研究和行业。
从「被动」到「主动」,为什么给耳机装上「眼睛」后AI范式变了?
光帆科技推出全球首款具视觉感知能力的主动式AI耳机,结合智能手表和充电盒,形成全感穿戴设备,旨在实现无屏、主动式AI交互。该设备通过持续感知用户环境,主动提供建议和完成任务,标志着AI硬件的重大转变,挑战传统被动式智能。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/2de629a6-152d-81ff-92fc-f70bb195d85c
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。

