slug
summary
tags
icon
password
8B模型可以超过GPT-4o!并行KV Cache压缩支持的128K长度外推方法ParallelComp
ParallelComp提出了一种新方法,通过并行注意力分块和智能淘汰机制,显著提升大语言模型在超长文本推理中的性能,能够无缝外推至128K长度,且在特定任务中超过GPT-4o的表现,为LLM的实际应用提供了新的解决方案。
刚刚,首个能在机器人上本地运行的具身Gemini来了
谷歌DeepMind推出了首个可在机器人上本地运行的视觉-语言-动作模型Gemini Robotics On-Device,具备强大的任务适应能力和低延迟推理,支持开发者快速微调以适应新任务,标志着向具身智能时代迈进了一步。与此同时,谷歌还下调了部分免费用户的使用额度。
ICML 2025 Oral | 从「浅对齐」到「深思熟虑」,清华牵头搭起大模型安全的下一级阶梯
清华团队提出STAIR框架,通过引入系统2思考,提升大模型的安全对齐能力,显著增强模型在越狱攻击下的鲁棒性,同时保持其推理能力。RealSafe-R1模型在此基础上开发,确保安全性与性能的平衡,推动大模型在高风险应用中的安全应用。
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
TaoAvatar是阿里巴巴开发的3D真人数字人技术,支持在手机和XR设备上实时渲染和AI对话。MNN-TaoAvatar作为开源应用,集成多项AI技术,实现自然交流,具有高效的端侧实时对话和渲染能力,适合在移动设备上运行。
让多模态大模型「想明白再画」!港大等开源GoT-R1:强化学习解锁视觉生成推理新范式
香港大学等团队推出GoT-R1框架,通过强化学习提升多模态大模型在视觉生成中的语义-空间推理能力,克服了传统模型在处理复杂指令时的局限,取得了新SOTA性能,尤其在复杂场景生成方面表现优异。
上一篇
一键生成AI工作流:全自动N8N MCP,告别手动搭建 | N8N新手必备!
下一篇
ICML 2025提出Token-Level Editing方法;DanceGRPO统一视觉生成框架;北大发布人形机器人通用大模型;腾讯推出CodeBuddy 3.0插件;OpenAI计划2025年大规模应用AI智能体 | 05月14日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/21d629a6-152d-817c-834d-d68604f6e717
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。