Lazy loaded image
AI日报
上海AI Lab与澳门大学推出CompassVerifier;北大与字节跳动发布SWE-Swiss;GPT-5发布引发热议;国产AI四大天王合体;奥迪实现燃油车智能化 | 08月08日AI资讯
字数 828阅读时长 3 分钟
2025-8-8
2025-8-8
slug
summary
tags
icon
password

3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab & 澳门大学

AI的下半场需要同时注重训练和验证能力。上海AI Lab与澳门大学推出了通用答案验证模型CompassVerifier和评测集VerifierBench,以填补验证领域的空白。当前大模型在验证能力上存在不足,CompassVerifier通过多阶段筛选和数据增强,提升了答案验证的准确性和鲁棒性,展现出优于其他模型的性能,推动AI在多领域的进步。

北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

北京大学与字节跳动合作推出SWE-Swiss模型,旨在高效解决软件工程问题。该32B参数模型在SWE-bench Verified基准上取得60.2%的准确率,展示了中等规模模型的高效能。研究提出的训练方法包括代码定位、修复和单元测试生成,采用两阶段强化学习提升模型能力。团队将开源模型和数据集,推动社区研究发展。

GPT-5王者降临,免费博士级AI全面屠榜!百万程序员不眠之夜,7亿人沸腾

GPT-5正式发布,标志着OpenAI在实现AGI方面的重要进展。新模型在编码、数学、写作和健康等领域表现卓越,成为最可靠的AI系统。GPT-5的多版本推出使其成为通用智能操作系统的核心,用户可根据需求选择不同版本。其在编程和写作方面的能力显著提升,能够生成高质量的代码和文本,且具备个性化和记忆功能,能够更好地满足用户需求。开发者可通过API访问GPT-5,推动软件工程的变革。

单机狂飙4万亿参数,国产AI「四大天王」首次合体!这台超节点鲨疯了

国产AI四大天王在单机上成功运行4万亿参数,依靠元脑SD200超节点AI服务器的强大算力和创新架构,实现了高效推理和应用。该服务器支持64路本土GPU,具备超大显存和高速互联,满足大模型的需求,推动AI算力基础设施向开放化和标准化发展。

「油车智障」的招牌,被奥迪一脚踢开

一汽奥迪与华为乾崑合作,实现燃油车与新能源车的智能化融合,推出具备高阶智驾能力的A5L和Q6L e-tron。通过底层架构升级和智能系统集成,燃油车也能实现精准控制和高级辅助驾驶,打破了传统燃油车的技术壁垒,证明了智能化是未来汽车发展的关键方向。
上一篇
Gemini数学推理超越人类;OpenAI三人团队拿下IMO金牌;DeepMind新模型解码古罗马;GPT-5发布引争议;自变量展示通用具身智能 | 08月09日AI资讯
下一篇
GPT-5将向免费用户开放;小红书开源多模态大模型dots.vlm1;亚马逊云科技推出AI模型聚合平台;OpenAI开源gpt-oss模型;谷歌DeepMind发布Genie 3 | 08月07日AI资讯