slug
summary
tags
icon
password
刘强东连投3家具身智能!京东美团「战火」烧到外卖之外
刘强东在具身智能领域投资了三家公司,包括千寻智能、众擎机器人和逐际动力,进一步推动了该领域的发展。千寻智能专注于视觉-语言-动作模型和人形机器人,众擎机器人致力于规模化生产和技术研发,而逐际动力则强调硬件与智能模型的结合。京东的投资策略显示出对量产能力和高耦合产品的偏好,同时也在内部建立了相关业务部门,推动具身智能生态的构建。
并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈
英伟达推出的Helix架构通过并行技术显著提升大模型的上下文长度和并发能力,解决了处理长任务时的卡顿问题。Helix受DNA结构启发,将KV缓存和张量并行结合,允许在百万token的上下文中高效处理信息,提升用户交互体验。尽管该技术在特定领域有应用潜力,但在实际运用中,许多组织可能更需构建智能流水线,而非依赖Helix的架构。
刷新世界纪录!神秘学生击败谷歌AlphaEvolve难题最优解,优势仅0.00006442
一名学生利用AI在「Circle Packing」数学难题上击败谷歌的AlphaEvolve算法,创造了新的世界纪录,优势为0.00006442。该学生的算法在单位正方形内成功放置圆形,超越了谷歌和FICO的最佳解。这一成就引发了对AI在数学领域能力的讨论,尤其是在最近的IMO比赛中,AI的表现引发了争议。Alex的成功标志着科研范式的变革,表明AI技术正在使个人能够挑战传统的科研巨头。
美团提出多模态推理新范式:RL+SFT非传统顺序组合突破传统训练瓶颈
美团提出Metis-RISE框架,通过将强化学习和监督微调相结合,显著提升多模态大语言模型的推理能力。72B参数模型在OpenCompass多模态推理榜单上排名第四,展示了该方法的有效性和可扩展性。
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
英伟达推出基于Qwen2.5架构的OpenReasoning-Nemotron模型,具备超强推理能力,特别在数学、科学和代码任务上创下新纪录,超越o3。该模型支持多种参数规模,并在多个基准测试中表现优异,显示出强大的泛化能力。虽然未进行强化学习,但在推理任务中表现突出。可在本地运行,适合不同设备。
上一篇
OpenAI发布GPT-4.1全家福;英伟达5000亿美元投资AI基础设施;DeepSeek-V3降本方法公开;谷歌AlphaEvolve突破数学难题;讯飞AI耳机用户破百万 | 05月15日AI资讯
下一篇
OpenAI新推理模型夺IMO金牌;谷歌DeepMind证实大模型自信心问题;Meta曝光AGI梦之队;中科院生成式渲染器突破;Claude展现自主休眠行为 | 07月20日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/237629a6-152d-8154-9043-ebcafdd54a40
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。