【AI资讯】1月16日 | 小林的博客-AI学长

slug

summary

⏩国产AI视频爆火全球，歪果仁集体起立！快到震撼，惊爆价低至4分

本文报道了国产AI视频生成工具Vidu 2.0的发布，强调其在生成速度、成本和视频质量上的显著提升。Vidu 2.0能够在10秒内生成视频，成本低至每秒4分钱，极大地降低了视频制作的时间和费用。文章指出，该工具在广告、影视、动画和游戏等领域将带来颠覆性影响，传统制作流程将被简化。Vidu 2.0还具备风格一致性和高质量生成的能力，展示了其在AI视频生成领域的领先地位。整体来看，Vidu 2.0的推出标志着AI视频技术的重大进步，具有广泛的应用前景。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652558746&idx=1&sn=0a26e2ff942953cee6b14f1b430400d3&chksm=f09b247e932daeed0e9681b724816170329ea35ae01142bb18a0ab38303d87661fa546b2cfae&scene=0#rd

⏩终于等到你！港大首发「轻量级RAG神器」MiniRAG，1.5B手机端可用

港大黄超教授团队推出的MiniRAG框架是一种轻量级的RAG系统，旨在解决传统RAG架构对大型语言模型的依赖问题。MiniRAG通过优化架构设计，使得1.5B级别的小模型能够高效完成RAG任务，适用于端侧AI部署。该框架引入了异构图索引和轻量级知识检索机制，确保在复杂查询和信息检索中保持高效性和准确性。研究团队还推出了LiHua-World数据集，以模拟真实的个人数据，全面评估MiniRAG的性能。实验结果显示，MiniRAG在资源消耗和性能稳定性方面表现优异，尤其在小型语言模型的应用场景中展现出显著优势，推动了端侧RAG系统的发展。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652558746&idx=3&sn=1bf556d1b30fcd7286cc514bd5236216&chksm=f072bf7e61ebee3608b42abfd07652682a1ee783a309f61ee66073bd6444be5f4d012286903a&scene=0#rd

⏩阿里云通义开源最强过程奖励PRM模型，7B尺寸比GPT-4o更能发现推理错误

阿里云通义于2025年1月16日开源了新的数学推理过程奖励模型Qwen2.5-Math-PRM，包含72B和7B两个尺寸，性能显著超越同类开源模型，尤其在识别推理错误方面，7B模型的表现超过了GPT-4o。通义团队还推出了步骤级评估标准ProcessBench，填补了大模型推理过程错误评估的空白。PRM通过对推理过程中的每一步进行评估和反馈，提升了模型的推理能力和可信度。Qwen2.5-Math-PRM在多个数学基准测试中表现优异，尤其在错误步骤识别能力上显示出显著优势，为未来推理过程监督技术的研发提供了新的思路。

🔗：https://www.jiqizhixin.com/articles/2025-01-16-4

⏩端侧版GPT-4o问世，面壁小钢炮实现端到端、全模态实时对话

本文介绍了面壁智能推出的端侧多模态大模型MiniCPM-o 2.6，该模型在视觉、语音等领域表现出色，参数量为8B，支持双语语音识别和实时对话，性能接近GPT-4o。MiniCPM-o 2.6在推理速度和效率上有显著提升，能够在iPad等设备上实现实时多模态互动。文章详细阐述了该模型在音频理解、生成及视觉理解方面的领先地位，并与行业顶尖模型进行对比，强调其在实时流式视频理解能力上的突破。MiniCPM-o 2.6的推出有望提升AI语音助手的表现，带来更自然的交流体验，推动AI技术在日常生活中的应用。

🔗：https://www.jiqizhixin.com/articles/2025-01-16-5

⏩国产AI视频爆火全球，歪果仁集体起立！快到震撼，惊爆价低至4分

⏩终于等到你！港大首发「轻量级RAG神器」MiniRAG，1.5B手机端可用

⏩阿里云通义开源最强过程奖励PRM模型，7B尺寸比GPT-4o更能发现推理错误

⏩端侧版GPT-4o问世，面壁小钢炮实现端到端、全模态实时对话

AI学长小林

交流频道

加入我们的社群讨论分享