AI日报
【AI资讯】2月27日
00 分钟
2025-2-27
2025-2-27
slug
summary
tags
icon
password

⏩阿里最新深度思考模型强不强?我们让它和Grok3比拼了下

这篇文章对阿里最新发布的深度思考模型QwQ-Max-Preview进行了详细评测,并与Grok3进行了对比。文章指出QwQ-Max-Preview在数学、编程和通用任务中表现出色,尤其在逻辑推理和联网搜索方面具有优势。通过具体的逻辑题目比较,展示了两个模型在处理复杂问题时的思维方式和回答质量。QwQ-Max-Preview能够同时使用深度思考和联网搜索功能,而Grok3则不具备此能力。文章还提到阿里将开源QwQ-Max和Qwen2.5-Max,并推出新的应用程序,显示出阿里在AI领域的持续创新和发展。
 

⏩DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价

DeepSeek最近开源了三个重要项目,包括DualPipe和EPLB,旨在提升AI训练效率。DualPipe是一种双向流水线并行算法,通过实现前向和后向计算的完全重叠,显著减少了流水线气泡,提高了计算效率。EPLB则专注于专家并行负载均衡,旨在优化GPU利用率,减少通信开销。这些工具和数据集的发布不仅为DeepSeek模型的使用提供了支持,也为其他大模型的训练和部署提供了借鉴。DeepSeek创始人梁文锋参与了这些项目的开发,显示了其在AI领域的技术创新和贡献。
 

⏩英伟达财报:全年营收1300亿美元创纪录,老黄说DeepSeek引爆算力需求

英伟达于2025财年第四财季发布财报,营收达393.31亿美元,同比增长78%,全年营收创纪录的1305亿美元。CEO黄仁勋指出,推理AI模型DeepSeek引发了前所未有的算力需求,预计未来计算需求将增长百倍。他强调,推理AI时代的到来将使AI在回答问题前进行思考,显著增加计算量。黄仁勋还提到,新的初创公司因推理AI能力的突破而涌现,推动了数据中心的资本投资。整体来看,英伟达在AI领域的创新和市场趋势显示出强劲的增长潜力,尤其是在推理AI的应用上。
 

⏩微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B

微软在2024年底发布了Phi-4模型家族,其中包括Phi-4-multimodal和Phi-4-mini两个新成员。Phi-4-multimodal是一个多模态模型,结合了文本、视觉和语音输入,采用新颖的模态扩展方法,表现优于现有大型模型。Phi-4-mini则是一个高效的语言模型,拥有38亿参数,专注于速度和效率,在数学和编码任务上表现出色。两者均支持多语言应用,并采用了先进的技术设计,如分组查询注意力机制和输入输出嵌入绑定技术,提升了模型的性能和资源利用率。这一发布标志着微软在人工智能领域的又一重要进展,展示了小型模型在复杂任务中的潜力。
上一篇
【AI资讯】2月28日
下一篇
【AI资讯】2月26日