slug
summary
tags
icon
password
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
FormalMATH基准测试评估了当前AI模型在数学推理中的表现,显示最佳模型成功率仅为16.46%。该测试涵盖5560道数学题,揭示了AI在微积分等领域的明显弱点,并提出未来需加强多步推理和人机协作的方向。所有数据和模型已公开。
AI编程模型领域迎新王?谷歌发布Gemini 2.5 Pro I/O,单条文本提示即可生成完整应用
谷歌发布了Gemini 2.5 Pro I/O,这是其最强编程模型的升级版,能够通过单条文本提示生成完整应用,显著提高了代码生成的准确性和效率,已在多个开发场景中获得广泛好评。该模型在生成网页应用方面表现优异,超越了竞争对手,成为开发者的新宠。
豪掷30亿美元,OpenAI史上最大收购案!
OpenAI即将以30亿美元收购AI编程工具Windsurf,此举旨在增强其在AI编程市场的竞争力。Windsurf因其灵活的模型选择和企业级功能受到青睐,收购将帮助OpenAI巩固其技术优势并拓展市场机会。
ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍
华为诺亚提出的MoLE架构通过将专家输入改为embedding token,并使用查找表替代传统矩阵运算,显著降低了推理延迟和显存开销,尤其在批量解码场景中表现出优势,保持与MoE相当的性能。
免费!鹅厂最新3D生成模型火爆外网,CG导演都已经用上了
鹅厂推出的最新3D生成模型支持文/图生成3D模型和动画,用户只需上传照片即可创建个性化3D角色,且功能强大,已被广泛应用于游戏和艺术创作,完全免费,每日可生成20次。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/1ec629a6-152d-81b8-aa31-f5c094e4a102
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。