slug
summary
tags
icon
password
⏩国产AI视频爆火全球,歪果仁集体起立!快到震撼,惊爆价低至4分
本文报道了国产AI视频生成工具Vidu 2.0的发布,强调其在生成速度、成本和视频质量上的显著提升。Vidu 2.0能够在10秒内生成视频,成本低至每秒4分钱,极大地降低了视频制作的时间和费用。文章指出,该工具在广告、影视、动画和游戏等领域将带来颠覆性影响,传统制作流程将被简化。Vidu 2.0还具备风格一致性和高质量生成的能力,展示了其在AI视频生成领域的领先地位。整体来看,Vidu 2.0的推出标志着AI视频技术的重大进步,具有广泛的应用前景。
⏩终于等到你!港大首发「轻量级RAG神器」MiniRAG,1.5B手机端可用
港大黄超教授团队推出的MiniRAG框架是一种轻量级的RAG系统,旨在解决传统RAG架构对大型语言模型的依赖问题。MiniRAG通过优化架构设计,使得1.5B级别的小模型能够高效完成RAG任务,适用于端侧AI部署。该框架引入了异构图索引和轻量级知识检索机制,确保在复杂查询和信息检索中保持高效性和准确性。研究团队还推出了LiHua-World数据集,以模拟真实的个人数据,全面评估MiniRAG的性能。实验结果显示,MiniRAG在资源消耗和性能稳定性方面表现优异,尤其在小型语言模型的应用场景中展现出显著优势,推动了端侧RAG系统的发展。
⏩阿里云通义开源最强过程奖励PRM模型,7B尺寸比GPT-4o更能发现推理错误
阿里云通义于2025年1月16日开源了新的数学推理过程奖励模型Qwen2.5-Math-PRM,包含72B和7B两个尺寸,性能显著超越同类开源模型,尤其在识别推理错误方面,7B模型的表现超过了GPT-4o。通义团队还推出了步骤级评估标准ProcessBench,填补了大模型推理过程错误评估的空白。PRM通过对推理过程中的每一步进行评估和反馈,提升了模型的推理能力和可信度。Qwen2.5-Math-PRM在多个数学基准测试中表现优异,尤其在错误步骤识别能力上显示出显著优势,为未来推理过程监督技术的研发提供了新的思路。
⏩端侧版GPT-4o问世,面壁小钢炮实现端到端、全模态实时对话
本文介绍了面壁智能推出的端侧多模态大模型MiniCPM-o 2.6,该模型在视觉、语音等领域表现出色,参数量为8B,支持双语语音识别和实时对话,性能接近GPT-4o。MiniCPM-o 2.6在推理速度和效率上有显著提升,能够在iPad等设备上实现实时多模态互动。文章详细阐述了该模型在音频理解、生成及视觉理解方面的领先地位,并与行业顶尖模型进行对比,强调其在实时流式视频理解能力上的突破。MiniCPM-o 2.6的推出有望提升AI语音助手的表现,带来更自然的交流体验,推动AI技术在日常生活中的应用。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/17c629a6-152d-80e6-97c5-ec4bb5feeecd
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。