AI日报
【AI资讯】3月3日
00 分钟
2025-3-3
2025-3-4
slug
summary
tags
icon
password

⏩老显卡福音!美团技术团队开源首发INT8无损满血版DeepSeek R1

美团技术团队开源的DeepSeek R1模型通过INT8精度量化技术,成功解决了原生FP8模型在GPU部署上的限制,实现了模型精度的基本无损。INT8量化不仅拓展了模型的硬件兼容性,还在推理性能上相比BF16提升了50%。文章详细介绍了分块量化和通道量化两种技术,强调了其在降低量化损失和提高推理吞吐方面的优势。量化后的模型已开源至Hugging Face,方便用户使用。这项技术的突破为老旧显卡用户带来了福音,推动了AI模型的广泛应用和部署。
 

⏩AI学术算命?Gemini 2.0预测谷歌AI大佬职业生涯,准到离谱!

本文报道了谷歌的Gemini 2.0在学术论文分析和职业预测方面的应用,展示了其强大的深度解析能力和自然语言理解。谷歌首席科学家Jeff Dean和DeepMind高级研究科学家Yi Tay亲自测试了Gemini 2.0,获得了精准的论文评价和职业发展预测。Gemini不仅能指出论文中的不足之处,还能预测作者的职业路径,显示出其在学术研究中的潜在影响力。文章深入探讨了Gemini 2.0的技术进步,包括支持多模态输入和输出,进一步增强了其应用范围和实用性。这一技术的进步可能会改变学术界的研究方式,值得关注。
 

⏩杭州国资押注大模型,智谱AI获超10亿元战略融资

智谱AI近日完成超过10亿元人民币的战略融资,标志着其在大模型领域的进一步发展。该公司致力于GLM大模型技术的研发和开发者生态的建设,已在杭州成立子公司,推动区域数字经济。智谱AI的GLM架构涵盖多模态和Agent等技术,兼容多种国产GPU芯片,具备较低的幻觉率,已在金融、医疗等20多个行业实现规模化应用。智谱AI还计划在2025年推出全新大模型并开源,致力于推动AI普惠,成为国内大模型领域的领跑者。
 

⏩Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

本文讨论了Claude 3.7在经典游戏超级马里奥中的表现,指出其在评估AI智能体时的重要性。加州大学圣迭戈分校的研究表明,Claude 3.7的表现超越了OpenAI的GPT-4o和Gemini系列,显示出游戏作为AI评估基准的潜力。文章提到Karpathy对当前AI评估指标的质疑,强调了游戏智能体在AI研究中的新趋势。Claude 3.7在游戏中的操作流畅性和策略性引发了对AI评估标准的重新思考,表明游戏可能成为未来AI性能评估的重要领域。
 

⏩中国首个AI原生IDE:字节跳动发布AI编程工具Trae国内版

字节跳动于2025年3月3日发布了国内首个AI原生集成开发环境工具Trae,搭载doubao-1.5-pro模型,支持DeepSeek R1&V3。Trae旨在提升开发者的编程效率,通过自然语言输入需求,快速生成代码框架,改变传统编程方式。该工具具备强大的上下文感知能力,能够理解整个项目的代码,提供代码自动补全和Bug修复等功能,助力开发者应对复杂技术挑战。Trae的发布标志着AI辅助编程进入全面赋能时代,预计到2028年,AI辅助编程的渗透率将超过75%。此举不仅丰富了国内AI编程工具市场,也为开发者提供了更高效的协作体验。
 
上一篇
【AI资讯】3月4日
下一篇
【AI资讯】3月2日