华人团队提出Memory Decoder；英伟达研究小模型；OpenAI发布gpt-oss；D2F模型跑赢自回归；4DNeX生成动态场景 | 08月18日AI资讯

slug

summary

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

华人团队提出了一种名为“Memory Decoder”的预训练记忆模块，能够让模型在不改变原参数的情况下，快速适应特定领域，如生物医学、金融和法律。该方法相比传统的DAPT和RAG更高效、成本更低，实验结果显示在这三个领域的困惑度平均降低了6.17分，显著提升了模型的预测准确性。

🔗访问原文

英伟达新研究：小模型才是智能体的未来

小模型在智能体任务中表现出更高的经济性和灵活性，能够通过优化硬件资源和任务设计来高效执行。相比大型模型，小模型在处理简单、重复性任务时更具成本效益，且更适合本地部署。英伟达提出将大模型转化为小模型的方法，以实现更高的资源利用率和性能优化。

🔗访问原文

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

OpenAI最近发布了gpt-oss开源模型，标志着自GPT-2以来的重大进展。gpt-oss-120b和gpt-oss-20b模型在架构上与GPT-2有显著不同，采用了MXFP4优化以支持单GPU运行，并引入了滑动窗口注意力等新技术。与Qwen3模型相比，gpt-oss在架构宽度和深度上各有优势。

🔗访问原文

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

D2F模型由上海交通大学和加州大学圣地亚哥分校联合推出，首次使开源扩散大语言模型的生成速度超过自回归模型，吞吐量提升达2.5倍。D2F通过引入块级自回归生成、双尺度并行解码和双状态解码等技术，显著提高了推理效率。

🔗访问原文

一张图，开启四维时空：4DNeX让动态世界「活」起来

4DNeX是全球首个仅依赖单张输入生成4D动态场景的框架，利用真实世界动态影像进行训练，实现高效、多视角、高保真渲染。4DNeX-10M数据集包含近千万帧4D标注视频，涵盖多种场景，支持高保真4D内容生成。

🔗访问原文

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

英伟达新研究：小模型才是智能体的未来

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

一张图，开启四维时空：4DNeX让动态世界「活」起来

AI学长小林

交流频道

加入我们的社群讨论分享

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

英伟达新研究：小模型才是智能体的未来

从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路

开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍

一张图，开启四维时空：4DNeX让动态世界 「活」起来

AI学长小林

交流频道

加入我们的社群讨论分享

一张图，开启四维时空：4DNeX让动态世界「活」起来