slug
summary
tags
icon
password
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
腾讯云在2025全球数字生态大会上发布了智能体开发平台3.0,全面升级了功能,包括RAG能力、Multi-Agent协作和Workflow更新,支持多种数据库和插件。腾讯优图实验室将持续开源关键技术,旨在促进技术普惠和智能体生态的发展。多个企业已成功应用这些技术,提升了业务效率和客户服务。
OpenAI硬件,也选了中国「果链」公司立讯精密
立讯精密与OpenAI达成合作,共同开发未来的AI硬件,立讯精密作为苹果的重要供应商,具备丰富的高精度产品生产经验。OpenAI计划推出多款AI硬件,预计在2026年末或2027年初发布,硬件形式可能包括眼镜和可穿戴设备。此外,OpenAI还从苹果挖来了20多名硬件人才,进一步增强其在AI硬件领域的布局。
DeepSeek-R1登顶Nature,8位专家严审通过, 大模型「交卷时刻」来了
DeepSeek-R1在《Nature》上发表,标志着中国AI技术获得国际认证,经过8位专家的同行评审,强调了同行评审在AI行业透明度和可复现性的重要性。评审过程中,DeepSeek-R1进行了重要修订,增加了安全性评估,回应了外界对模型的质疑,推动了AI行业的健康发展。同行评审被视为验证模型有效性的重要机制,有助于抵制行业中的炒作和不实宣传。
大模型训练新突破!Meta提出LSP:无数据也能实现能力飞升
Meta提出的语言自我博弈(LSP)方法通过强化学习解决了大模型训练中数据不足的问题,使模型能够在无额外数据的情况下自我改进。LSP利用自我博弈的框架,模型在「挑战者」和「解题者」两种角色中相互作用,提升任务性能。实验表明,LSP在多个基准测试中表现优于传统数据驱动模型,展示了无数据训练的可行性和未来发展潜力。
华为超节点:用「一台机器」的逻辑,驱动AI万卡集群
华为推出超节点架构,通过灵衢互联协议解决大规模AI计算中的通信瓶颈,实现多台机器的深度互联,提升算力利用率。新架构支持8192至15488张昇腾卡,降低延迟并提高系统可靠性,适用于各类数据中心。华为还强调硬件开放和软件开源,以促进AI生态的繁荣。
超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了
亚马逊云科技将国产开源模型Qwen3和DeepSeek-V3.1纳入Amazon Bedrock,进一步丰富了其AI平台的模型阵容。这两款模型在推理性能和应用灵活性方面表现出色,Qwen3特别适合复杂软件工程任务,而DeepSeek-V3.1则在代码生成和AI工具调用方面展现了强劲能力。亚马逊云科技强调多模型选择的重要性,以满足不同客户的需求,并推动AI技术的创新与发展。
攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0
蚂蚁开源的新一代推理模型Ring-flash-2.0通过创新的棒冰算法和长周期的强化学习训练,解决了训练稳定性和效果之间的矛盾,性能达到40B密集模型的水平。该模型仅激活6.1B参数,具备高性价比,支持200+token/s的推理速度,并在多项推理榜单上取得显著突破,标志着大模型竞争进入高性价比时代。
上一篇
AI资讯-09月21日
下一篇
英伟达50亿美元入股英特尔;谷歌Chrome全面集成Gemini;DeepMind破解百年流体力学难题;华为发布AI算力芯片;Notion 3.0进入Agent时代 | 09月19日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/274629a6-152d-81aa-84ed-d639e6527475
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。