AI日报
【AI资讯】2月25日
00 分钟
2025-2-25
2025-2-27
slug
summary
tags
icon
password

⏩DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!

DeepSeek发布了开源项目FlashMLA,结合了先进的MLA算法与GPU优化技术,旨在为大模型推理提供高性能、低延迟的解码方案。该项目专为NVIDIA的Hopper GPU优化,能够显著提高大规模语言模型的计算效率,尤其在处理可变长度序列时表现出色。评测结果显示,FlashMLA在不同Hopper GPU上的内存速度和计算性能均达到了理论上限的接近值。该技术的发布引起了主流推理框架的关注,vLLM和SGLang团队均表示将集成FlashMLA,以进一步提升推理性能。
 

⏩全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手

本文介绍了Anthropic发布的Claude 3.7 Sonnet,这是全球首个混合推理模型,具备标准和扩展思考模式,能够在编码和推理任务中提供更高效的响应。新模型允许用户对思考时间进行细粒度控制,并通过API与GitHub集成,提升开发者的编码体验。Claude 3.7 Sonnet在多个基准测试中表现出色,超越了前代模型和其他竞争对手,展示了其在数学、物理和指令遵循等领域的强大能力。这一创新标志着AI推理模型的重大进步,提供了更无缝的用户体验,推动了AI技术的应用和发展。
 

⏩微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?

本文探讨了微软在AI数据中心租赁方面的重大调整,尤其是在DeepSeek发布后,微软取消了与多家运营商的租赁协议,反映出对AI算力需求的担忧。文章分析了微软市值的剧烈波动及其与OpenAI的合作关系变化,指出微软可能在过度建设AI算力方面变得谨慎。尽管如此,其他科技巨头如亚马逊和谷歌仍在加大对AI基础设施的投资。文章还提到,微软CEO表示将根据客户需求调整数据中心建设规划,显示出对未来AI市场的复杂态度。
 

⏩超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

本文介绍了豆包团队推出的BFS-Prover,这是一个新型的自动形式化数学推理模型,旨在挑战传统的复杂搜索算法。BFS-Prover通过引入专家迭代、自适应性数据过滤和直接偏好优化等技术,展现出在形式化数学测试集MiniF2F上达到72.95%准确率的优异表现,超越了以往的蒙特卡洛树搜索和价值函数方法。文章深入探讨了自动定理证明的挑战与解决方案,强调了简化算法在大规模推理任务中的潜力,并期待与相关研究者的进一步交流。该成果已开源,标志着AI在数学推理领域的重要进展。
 

⏩苹果史上最大投资!4年5000亿美金重注AI+芯片,特朗普专门感谢

苹果公司宣布将在未来四年内投资5000亿美元,重点发展人工智能和半导体领域,计划新建24家工厂并创造2万个就业岗位。这一投资被视为对美国制造业的支持,特别是在AI基础设施和数据中心方面。苹果将建立一家先进制造工厂,专注于生产支持其个人智能系统的服务器,并计划将其先进制造基金从50亿美元增加到100亿美元。此外,苹果还将加强与高校的合作,推动AI和智能制造技术的应用。此举不仅展示了苹果在AI领域的决心,也反映了其对美国创新未来的信心。
 
上一篇
【AI资讯】2月26日
下一篇
【AI资讯】2月24日