slug
summary
tags
icon
password
Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型
Meta推出Llama 4系列模型,采用混合专家架构,支持原生多模态训练,Llama 4 Scout和Maverick可供下载,具有超长上下文窗口,推理成本低于GPT-4o,未来还将发布更强大的Llama 4 Behemoth模型。
谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!
谷歌宣布支持MCP协议,允许Gemini模型与外部工具和数据源连接,提升AI应用能力。MCP被比作1993年的HTTP,可能改变AI数据集成方式,但也面临依赖外部标准的风险。
中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开
中科大与华为合作开发的生成式推荐大模型已成功在昇腾NPU上部署,展示了在复杂场景和排序任务中的优越性能,未来研究将聚焦于数据工程和训练效率等方向,以推动推荐系统的发展。
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
FoundationStereo是一个用于立体深度估计的基础模型,具有强大的零样本泛化能力,采用大规模合成数据和创新的网络架构,显著提升了在不同场景下的准确性和鲁棒性,已在多个排行榜上名列第一。相关论文获得CVPR 2025满分评审,代码已开源。
LLM「想太多」有救了!高效推理让大模型思考过程更精简
研究者提出高效推理概念,旨在减少大模型的冗长推理过程,提高效率,尤其在资源有限的场景中。通过优化模型、推理输出和输入提示,帮助模型更简洁地回答问题,避免过度思考。
上一篇
Rokid祝铭明谈AI眼镜中国战场;Hinton提出无梯度学习方法NoProp;MoCha开启自动化多轮对话电影生成;PartRM模型入选CVPR 2025;Llama 4发布三款新模型 | 04月07日AI资讯
下一篇
Midjourney V7硬刚GPT-4o;字节跳动DreamActor-M1革新动画;OpenAI免费发布GPT-5;Higgsfield AI推电影级视频生成;谷歌Canvas免费开放 | 04月05日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/1cd629a6-152d-810e-96eb-fb2d526019ea
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。