Lazy loaded image
AI日报
03月03日AI资讯 | 人大&通义提出IterResearch实现2048轮交互不退化;交大JTok模块节省1/3算力;SkyReels-V4登AI视频榜第二;银河通用获25亿融资;MiniMax发布首份大模型财报
字数 1212阅读时长 4 分钟
2026-3-3
2026-3-3
slug
summary
tags
icon
password

ICLR 2026|人大&通义:别再只会堆上下文了!IterResearch用40K上下文轻松实现2048轮交互不退化

IterResearch提出了一种新的迭代式深度研究范式,通过马尔可夫式工作空间重构,使得Agent在仅40K上下文长度下完成2048次交互而性能不衰减,准确率从3.5%提升至42.5%。该方法避免了传统ReAct范式中上下文的线性增长问题,允许Agent在清晰的思维空间中进行有效探索,展示了Interaction Scaling的潜力。研究表明,Agent能够在获取足够信息后主动终止交互,且该范式在不同模型上均表现出显著提升。

Dense、MoE之外第三条Scaling路径:交大提出JTok模块,省1/3算力

上海交通大学提出的JTok模块通过引入调制向量来提升大模型的容量,显著降低算力需求,达到节省三分之一算力的效果。该模块可作为插件形式集成在Transformer中,支持静态和动态调制,提升模型在多项任务中的性能,尤其在推理和数学能力上表现突出。JTok-M的创新为大模型扩展提供了新的方向,打破了传统的算力与性能绑定逻辑,形成了新的缩放法则。

Artificial Analysis 榜单第二,SkyReels-V4 宣告 AI 视频进入「全栈统一」阶段

SkyReels-V4在最新的AI视频评测中排名第二,展现出其在视频生成和编辑方面的全栈能力。该模型能够将不同素材无缝结合,生成高质量的短剧和视频,支持多种语言的音频生成。其技术架构实现了视频和音频的同步生成,简化了创作流程,提升了内容制作的效率,标志着AI视频创作的重大进步。

国家大基金首次「出手」具身智能,银河通用再获25亿融资

银河通用完成25亿元融资,国家大基金首次投资具身智能企业,巩固其在行业中的领先地位。公司通过端到端大模型「银河星脑」实现了高效的机器人训练,并在春晚展示了其技术能力。银河通用的机器人在多个工业和消费场景中取得了成功,吸引了大量资本涌入,预计未来三年内将实现1万台人形机器人自主作业的目标。

MiniMax 财报发布:首份大模型成绩单

MiniMax发布了2025年财报,显示总收入达到7904万美元,同比增长158.9%,毛利率为25.4%。销售开支减少40%,研发增速为33.8%。公司完成了语言、视频、语音和音乐四个模态的布局,用户数达2.36亿,企业客户增长65%。M2系列产品在成本和效率上取得显著进展,预计未来将向平台型公司转型,推动AI成为新一代生产基础设施。

想入局VLA却不知从何下手?NTU & 中大开源「终极菜谱」:从基座到频域建模,每一步都有实验支撑

VLANeXt是由NTU和中山大学联合研究的视觉-语言-动作模型,系统性分析了VLA设计空间的12个关键维度,提供了从基础组件到动作建模的全面指导。该模型在LIBERO基准和LIBERO-plus测试中超越了多种SOTA方法,特别在面对未见过的扰动时展现出10%的成功率提升,适用于单臂和双臂任务,具有良好的泛化能力。

一张玻璃纸,卡住了整个 AI 世界

在全球对AI芯片的需求激增时,唯一能生产关键材料T-glass的日本公司Nittobo面临供应短缺,导致价格飙升。英伟达等大客户已锁定大部分供应,造成其他厂商面临严重短缺。随着材料的重要性日益凸显,未来的AI竞争将不仅仅依赖算法,而是取决于关键材料的获取。多家公司正在寻找T-glass替代供应商,但进展缓慢,行业面临重大挑战。
上一篇
Vozo-根据文案自动配音并编辑视频
下一篇
【保姆级】OpenClaw 全网最细教学:安装→Skills实战→多Agent协作,1 小时全精通!