AI日报
哈佛揭示AI推理思维错配;神秘模型登顶视频生成榜;DeepSeek推出反思数学模型;电子科大提出OWL抗幻觉框架;vivo开源Rust内核 | 11月29日AI资讯
00 分钟
2025-11-29
2025-11-29
slug
summary
tags
icon
password

17万条推理轨迹扒出AI推理的真相:有劲儿,但用错了地方|哈佛新论文解读

当前AI在解决问题时存在严重的思维错配,过于依赖逻辑连贯性和前向推理,导致在复杂任务中表现不佳。研究表明,AI缺乏选择性注意、网络组织和抽象化能力,无法有效应对复杂问题。建议通过改进训练奖励信号,内化成功的思维结构,以提升AI的推理能力和解决问题的效率。

刚刚,神秘模型登顶视频生成榜,又是个中国模型?

一个名为 Whisper Thunder (aka) David 的神秘模型登顶人工分析视频榜,超越了其他知名AI视频模型。该模型生成的8秒视频片段具有明显的运动幅度,用户需反复刷新才能偶遇。虽然其音频能力尚不明确,但网友推测该模型可能来自中国。生成效果包括情感丰富的动漫场景和城市风光等,尽管存在一些生成瑕疵,但仍令人印象深刻。

DeepSeek的模型,让AI第一次学会了反思。

DeepSeek推出了DeepSeekMath-V2模型,具备自我反思能力,能够检查解题过程并纠正错误,表现出色,达到奥林匹克金牌水平。该模型通过生成器和验证器的组合,促进了逻辑思维和批判性思维的发展,解决了AI在实际应用中表现不佳的问题。DeepSeekMath-V2的成功表明,AI应追求内在逻辑自洽,而非仅仅满足外部评估标准。

AAAI 2026 | 电子科技大学提出OWL,基于双路径注意力干预的多模态大模型物体幻觉缓解

提出了一种基于因果关系的双路径注意力干预框架Owl,用于缓解视觉语言大模型中的物体幻觉。该方法通过量化视觉和文本注意力的依赖关系,采用双路径对比解码策略,显著降低幻觉发生率,同时保持生成内容的丰富性和正确性。实验结果显示,Owl在多个基准测试中优于传统解码策略和现有抗幻觉方法,增强了模型在复杂视觉场景下的理解能力。

捐赠自研OS内核背后:Rust 先行者 vivo 的「担当」

vivo 开源了自研的蓝河操作系统内核 BlueKernel,旨在满足 AI 原生硬件设备的安全性、轻量化和通用性需求。该内核全栈使用 Rust 语言编写,具备内存安全、低资源消耗和多芯片架构兼容性。vivo 的开源举措不仅推动了行业创新,还通过举办创新赛等活动,促进 Rust 语言的普及和生态发展。

国产家庭机器人终于落地!连人带床推你去上班,小五位数价格明年开卖

国产家庭机器人F1即将上市,具备22个自由度和多种传感器,能够自主完成复杂家务和与人互动。其设计适应家庭环境,续航超过8小时,定位为家庭助理型机器人,重点关注儿童和大清洁场景。创始人强调不依赖外部资金,专注于用户需求和真实家庭测试,预计售价在小五位数。未来还将推出更轻量级的F2型号。
上一篇
AI资讯-11月30日
下一篇
AI资讯-11月28日