AI日报
Meta推出Llama 4多模态模型;谷歌部署Gemini+MCP;中科大华为发布生成式推荐大模型;英伟达开源双目深度估计大模型;LLM高效推理技术突破 | 04月06日AI资讯
00 分钟
2025-4-6
2025-4-6
slug
summary
tags
icon
password

Meta推出Llama 4:MoE构架、原生多模态、10M上下文,没有发布推理模型

Meta推出Llama 4系列模型,采用混合专家架构,支持原生多模态训练,Llama 4 Scout和Maverick可供下载,具有超长上下文窗口,推理成本低于GPT-4o,未来还将发布更强大的Llama 4 Behemoth模型。

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

谷歌宣布支持MCP协议,允许Gemini模型与外部工具和数据源连接,提升AI应用能力。MCP被比作1993年的HTTP,可能改变AI数据集成方式,但也面临依赖外部标准的风险。

中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开

中科大与华为合作开发的生成式推荐大模型已成功在昇腾NPU上部署,展示了在复杂场景和排序任务中的优越性能,未来研究将聚焦于数据工程和训练效率等方向,以推动推荐系统的发展。

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

FoundationStereo是一个用于立体深度估计的基础模型,具有强大的零样本泛化能力,采用大规模合成数据和创新的网络架构,显著提升了在不同场景下的准确性和鲁棒性,已在多个排行榜上名列第一。相关论文获得CVPR 2025满分评审,代码已开源。

LLM「想太多」有救了!高效推理让大模型思考过程更精简

研究者提出高效推理概念,旨在减少大模型的冗长推理过程,提高效率,尤其在资源有限的场景中。通过优化模型、推理输出和输入提示,帮助模型更简洁地回答问题,避免过度思考。
上一篇
Rokid祝铭明谈AI眼镜中国战场;Hinton提出无梯度学习方法NoProp;MoCha开启自动化多轮对话电影生成;PartRM模型入选CVPR 2025;Llama 4发布三款新模型 | 04月07日AI资讯
下一篇
Midjourney V7硬刚GPT-4o;字节跳动DreamActor-M1革新动画;OpenAI免费发布GPT-5;Higgsfield AI推电影级视频生成;谷歌Canvas免费开放 | 04月05日AI资讯