英伟达发布CUDA二十年最大更新及8B模型超越GPT-5；Yann LeCun提出GenMimic机器人新方法；DeepSeek技术演进分析；谷歌全栈AI战略称王 | 12月07日AI资讯

slug

summary

Yann LeCun提出的GenMimic方法使人形机器人能够从AI生成视频中零样本执行人类动作；康奈尔大学的PasoDoble框架提升了大型语言模型的数学推理能力；英伟达发布CUDA 13.1更新并推出Orchestrator-8B模型超越GPT-5；DeepSeek技术演进至V3.2，优化了计算复杂度；谷歌通过Gemini 3模型和第七代TPU打破市场主导地位，推动全栈AI战略；趣丸科技与北大合作提出情感动态轨迹评估框架，评估大语言模型的情感支持能力。

Yann LeCun离开Meta后首篇论文？使用了宇树机器人做研究

Yann LeCun与其他研究者共同提出了一种名为GenMimic的新方法，使人形机器人能够零样本地执行AI生成视频中的人类动作。研究的核心在于如何让机器人从生成的视频中提取核心动作逻辑，尽管视频中可能存在噪声或变形。该研究的贡献包括建立了一个评估人形机器人控制策略的基准数据集GenMimicBench，并在仿真和真实环境中验证了新方法的有效性，展示了机器人在物理上复现人类动作的能力。

🔗访问原文

两个LLM互相对线，推理能力起飞：康奈尔团队发布大模型版类GAN训练法

康奈尔大学的NLP团队提出了PasoDoble，一个新的类GAN训练框架，通过对抗性训练两个模型（Proposer和Solver）来提升大型语言模型（LLM）的数学推理能力。Proposer生成高难度问题，Solver尝试解决这些问题，整个过程不依赖外部监督。实验结果显示，PasoDoble显著提高了模型在数学基准上的表现，尤其是在更大规模的模型上。未来的研究将探索将该框架应用于其他领域，并研究更复杂的多模型训练方法。

🔗访问原文

英伟达周末双炸！CUDA二十年最大更新，顺手屠榜AGI比赛

英伟达在周末发布了CUDA 13.1，这是二十年来最大的一次更新，推出了CUDA Tile编程模型，旨在简化GPU开发。同时，特级大师团队KGMoN在Kaggle ARC Prize 2025竞赛中以27.64%的分数夺冠，使用的是一个仅4B的小模型，展示了合成数据生成的强大能力和小模型的高效性。此次更新和比赛胜利标志着AI和GPU开发的重要进展。

🔗访问原文

英伟达巧用8B模型秒掉GPT-5，开源了

英伟达推出的Orchestrator-8B模型在HLE测试中得分37.1%，超越GPT-5的35.1%，且成本仅为后者的1/2.5。该模型通过协调多种工具，优化解题过程，结合强化学习和定制数据集进行训练，展现出高效且经济的优势，预示着AI领域未来可能不再依赖单一的大模型。

🔗访问原文

V3→R1→V3.2｜一文看懂 DeepSeek 技术演进

DeepSeek技术从V3到V3.2的演进包括了MoE和MLA架构的应用，R1模型采用可验证奖励的强化学习，V3.1变为混合模型支持推理与聊天切换，V3.2-Exp引入了DSA稀疏注意力以优化计算复杂度。最终，V3.2整合了所有技术，支持更复杂的工程任务。

🔗访问原文

谷歌：全栈AI之王

谷歌通过Gemini 3模型和第七代TPU的发布，成功打破了OpenAI与英伟达的市场主导地位，标志着其全栈AI战略的全面觉醒。Gemini 3在推理能力和多模态架构上实现显著突破，Nano Banana Pro则增强了用户创造力。谷歌的全栈整合策略使其在AI基础设施、研究和产品开发中形成了独特优势，推动了市场竞争格局的改变，尤其在推理成本上显著低于竞争对手。谷歌的C端产品如搜索和Gemini应用，成为推动AI能力和商业增长的核心引擎，预示着AI技术将深刻影响未来的技术文明。

🔗访问原文

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

趣丸科技与北京大学合作提出了一种新的情感动态轨迹评估框架（ETrajEval），用于评估大语言模型在长期对话中的情感支持能力。该框架通过构建328个交互环境和1152个情感干扰事件，关注用户情感轨迹，提出了三个关键指标：平均情绪水平（BEL）、情绪轨迹波动（ETV）和情绪质心位置（ECP）。研究发现，顶级模型在情感支持能力上差异显著，且在英语对话中表现优于中文对话。该评估方法为未来情感支持模型的开发提供了重要见解。

🔗访问原文

Yann LeCun离开Meta后首篇论文？使用了宇树机器人做研究

两个LLM互相对线，推理能力起飞：康奈尔团队发布大模型版类GAN训练法

英伟达周末双炸！CUDA二十年最大更新，顺手屠榜AGI比赛

英伟达巧用8B模型秒掉GPT-5，开源了

V3→R1→V3.2｜一文看懂 DeepSeek 技术演进

谷歌：全栈AI之王

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

AI学长小林

交流频道

加入我们的社群讨论分享