Lazy loaded image
AI日报
02月04日AI资讯 | 杨植麟将出席NVIDIA GTC 2026;Skywork桌面版发布Windows版AI助手;生数科技发布Vidu Q3音视频生成模型;腾讯研究上下文学习基准;港科大推出RebuttalAgent应对学术审稿
字数 1147阅读时长 3 分钟
2026-2-4
2026-2-4
slug
summary
tags
icon
password

黄仁勋2026大模型座上宾:杨植麟

杨植麟成为2026年GTC大会的演讲嘉宾,代表着AI行业的新发展。经历了DeepSeek的冲击后,Kimi通过技术创新和开源策略重获信任,并在市场上取得了显著成绩。杨植麟的成功反映了对高强度深度思考的需求,Kimi K2.5模型在多个测试中超越了其他旗舰模型,显示出其技术实力和市场认可度。

天选Windows打工AI来了!实测完Claude Cowork国产版:超顶

Skywork桌面版是一款国产AI工具,支持多模型切换和丰富的技能集成,能够快速完成文件整理、PPT制作和跨格式办公自动化等任务。其本地处理确保隐私安全,并通过持久上下文功能提升工作效率,适应多智能体协作的趋势。该工具在性能和速度上优于同类产品,展现出国产AI的创新能力和市场潜力。

让 AI 视频学会配音,学术界花了十年|Vidu Q3 发布的背后

Vidu Q3 是生数科技发布的视频生成模型,支持最长 16 秒的音视频同步生成,结合了对话、音效和背景音乐。该模型在全球排名第二,具有高效的生成流程,能够通过图像和文本生成视频,且支持多语言和唇形同步。学术界在音视频生成领域的研究已有十年,Vidu Q3 的发布标志着商业产品在高分辨率和长时长音视频生成上的突破。

姚顺雨腾讯首篇论文:给AI下半场指路「上下文学习」

姚顺雨在腾讯的研究成果CL-bench旨在测试大模型的上下文学习能力,强调AI需在真实任务中表现优异。当前最强模型GPT-5.1在复杂任务中的解决率仅为23.7%,显示出模型依赖静态知识而非实时学习。CL-bench包含500个复杂上下文,要求模型从中学习新知识,研究表明即使提供上下文,模型仍常因忽视关键细节而失败。团队的目标是推动上下文学习的实际应用。

ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

香港科技大学的研究团队提出了RebuttalAgent,一个基于心智理论的框架,旨在提升学术反驳的说服力。该模型通过分析审稿人的立场和态度,制定策略并生成针对性的回复,克服了传统模型的局限性。RebuttalAgent在与人类专家评分的一致性测试中表现优异,显示出其在复杂人际博弈中的潜力,帮助作者有效应对审稿意见,促进学术交流。

Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

研究揭示了视觉-语言模型中存在的注意力偏置问题,提出了一种无需重新训练的去偏方法,显著提升了剪枝策略的稳定性与可靠性。该方法通过修正注意力的结构性偏置,改善了模型在信息不足时的判断能力,确保保留与语义相关的视觉信息,减少了无关背景的干扰。

倒反天罡:「租个人」网站爆火,AI开始雇人「跑腿」了

一个名为「rentahuman.ai」的网站上线,允许AI雇佣人类完成线下任务,如取货和活动签到。上线首夜吸引超过130人注册,短短48小时内可用劳动力超过2万。网站规则友好,人类可设定时薪,但也引发了关于支付、任务真实性及责任归属的伦理和法律问题。未来该网站的演进备受关注。
上一篇
AI资讯-02月05日
下一篇
终于,我用AI治好了"只收藏不学习"的坏毛病(附全自动工作流)