slug
summary
tags
icon
password
超越RAG和DAPT!华人团队新研究引热议:即插即用、无需改变原参即可让模型化身领域专家
华人团队提出了一种名为“Memory Decoder”的预训练记忆模块,能够让模型在不改变原参数的情况下,快速适应特定领域,如生物医学、金融和法律。该方法相比传统的DAPT和RAG更高效、成本更低,实验结果显示在这三个领域的困惑度平均降低了6.17分,显著提升了模型的预测准确性。
英伟达新研究:小模型才是智能体的未来
小模型在智能体任务中表现出更高的经济性和灵活性,能够通过优化硬件资源和任务设计来高效执行。相比大型模型,小模型在处理简单、重复性任务时更具成本效益,且更适合本地部署。英伟达提出将大模型转化为小模型的方法,以实现更高的资源利用率和性能优化。
从GPT-2到gpt-oss,深度详解OpenAI开放模型的进化之路
OpenAI最近发布了gpt-oss开源模型,标志着自GPT-2以来的重大进展。gpt-oss-120b和gpt-oss-20b模型在架构上与GPT-2有显著不同,采用了MXFP4优化以支持单GPU运行,并引入了滑动窗口注意力等新技术。与Qwen3模型相比,gpt-oss在架构宽度和深度上各有优势。
开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍
D2F模型由上海交通大学和加州大学圣地亚哥分校联合推出,首次使开源扩散大语言模型的生成速度超过自回归模型,吞吐量提升达2.5倍。D2F通过引入块级自回归生成、双尺度并行解码和双状态解码等技术,显著提高了推理效率。
一张图,开启四维时空:4DNeX让动态世界 「活」起来
4DNeX是全球首个仅依赖单张输入生成4D动态场景的框架,利用真实世界动态影像进行训练,实现高效、多视角、高保真渲染。4DNeX-10M数据集包含近千万帧4D标注视频,涵盖多种场景,支持高保真4D内容生成。
上一篇
英伟达开源9B小模型比Qwen3快6倍;阿里Qwen-Image-Edit图像编辑大杀器上线;OpenAI高管离职加入新创企;中美AI竞争格局生变 | 08月19日AI资讯
下一篇
昆仑万维发布六款多模态AI模型;谷歌推出Genie 3世界模型;上海交大揭示LLM裁判机制缺陷;Qwen3 Coder市场份额破20%;OpenAI估值达5000亿美元 | 08月17日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/253629a6-152d-8157-956a-cd66faa24374
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。