AI日报
Altman和Ive新公司「io」推无屏AI硬件;Claude 4发布连续编码7小时;英伟达Llama 4每秒1000 token;华为InstructRAG性能提升19%;首个AI翻译榜单GPT-4o领先 | 05月23日AI资讯
00 分钟
2025-5-23
2025-5-23
slug
summary
tags
icon
password

目标出货一亿台,Altman和Ive的新公司「io」到底要做什么硬件?

Sam Altman与Jony Ive合作的新公司「io」计划推出一款无屏幕的AI硬件设备,目标是出货1亿台,成为继手机和电脑后的第三个核心设备,旨在减少用户对屏幕的依赖。该设备将全面感知用户环境,并与OpenAI的技术紧密结合。

19岁少年「破解」谷歌新AI?每秒1479 token,扩散再战GPT!

19岁少年声称破解谷歌的Gemini Diffusion模型,速度每秒1479 token,生成质量优于传统模型。该模型在编程和数学任务上表现出色,可能改变NLP领域的格局,谷歌的扩散模型展示了非自回归架构的潜力。

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

英伟达的Blackwell架构在Llama 4 Maverick模型上实现了每秒1000个token的AI推理新纪录,单台服务器的整体吞吐量达到72,000 TPS,得益于多项技术优化和推测解码策略,显著提升了模型性能和响应速度。

SIGIR 2025 | 解决扩展和迁移难题,华为新加坡提出InstructRAG,提升高达19%

华为新加坡团队提出InstructRAG,通过多智能体协同的元强化学习架构,解决了大语言模型在任务规划中的可扩展性和可迁移性问题,实现了高达19.2%的性能提升,展现出强大的抗噪声能力和快速适应新任务的能力。

首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源

首个AI翻译测评榜单TransBench发布,GPT-4o和Qwen系列在多语言翻译中表现突出,评测标准涵盖幻觉率、文化禁忌等,旨在提高翻译模型的实用性和准确性。阿里国际的Marco MT已成为电商领域使用量最大的翻译模型。

Claude 4发布!AI编程新基准、连续编码7小时,混合模型、上下文能力大突破

Claude 4发布了新的AI编程模型Opus 4和Sonnet 4,具备更强的编码和推理能力,支持长时间连续编码,并引入了工具使用和记忆功能,提升了开发者的工作效率和模型的智能水平。
上一篇
字节开源BAGEL模型;AI科学家团队2.5个月发现治盲新药;Claude 4采用RLVR范式;DeepSeek-R1引领推理革命;上海AI Lab发布InternThinker | 05月24日AI资讯
下一篇
谷歌发布Veo 3实现音画同步;英伟达DreamGen让机器人梦境学习;飞书知识问答提升企业效率;谷歌I/O 2025推出AI全家桶;MIT与谷歌优化LLM推理效率 | 05月22日AI资讯