slug
summary
tags
icon
password
妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒
斯坦福Hazy实验室推出的Megakernel推理引擎将Llama-1B模型的前向传播集成到单个GPU内核中,实现推理时间低于0.00068秒,速度比传统引擎快3.5倍,显著提高了GPU的带宽利用率和性能。该技术展示了低延迟推理的潜力。
博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工
AI系统Zochi独立完成从假设到论文的全过程,成功发表在ACL 2025会议上。其研究提出的Tempest框架通过多轮对话有效突破大模型的安全防线,成功率高达97%。该方法利用树搜索技术逐步引导模型泄露敏感信息,警示AI安全需关注长期交互中的潜在风险。
华为攻克AI推理「想太多」问题!新方法让大模型推理提速60%,准确率还高了
华为提出S-GRPO方法,通过串行分组和衰减奖励机制,显著提高大模型推理速度60%并提升准确率,解决冗余思考问题,适用于后训练优化阶段。实验结果显示,该方法在多个推理基准上超越现有模型,兼顾效率和准确性。
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
DeepSeek的R1新版在性能上接近OpenAI的o3,具备更强的推理和编程能力,能够处理复杂问题并提供创意解决方案,标志着开源技术的一次重要胜利。新模型已在HuggingFace发布。
可灵2.1刚刚上线,价格降了65%,更快、更听话、也更强。
可灵2.1正式上线,价格降低65%,提供更快、更高效的生成效果。新版本分为标准版、高品质版和大师版,满足不同创作需求,适合短视频和商业级制作。整体性价比提升,让更多用户能够轻松使用AI生成视频。
上一篇
DeepSeek-R1升级幻觉率降50%;可灵AI季度收入1.5亿;GPT-4o-Image任务完成率28.9%;全球首个AI智能体自进化开源框架发布;美团开放AI代码工具 | 05月30日AI资讯
下一篇
美团NoCode平台开放;字节扣子空间推AI播客;开源代码定位神器LocAgent发布;华为盘古Pro MoE模型亮相;阿里通义PARSCALE策略降内存95% | 05月28日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/202629a6-152d-819e-b450-fca7609ca62e
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。