【AI资讯】1月22日 | 小林的博客-AI学长

slug

summary

⏩中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

本文探讨了模型蒸馏在大型语言模型（LLMs）中的应用，强调了过度蒸馏可能导致模型性能下降的问题。研究者们提出了一种新的评估框架，通过响应相似性评估（RSE）和身份一致性评估（ICE）来量化蒸馏模型的影响。研究发现，除了Claude、豆包和Gemini外，许多知名的开源和闭源大语言模型的蒸馏程度过高，且基础大语言模型的蒸馏程度普遍高于对齐后的模型。文章呼吁对大语言模型的开发进行更独立和透明的研究，以提高其稳健性和安全性。这项研究为理解和优化模型蒸馏提供了重要的理论基础和实践指导。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652559968&idx=1&sn=7acc85c74808c6934634f18d55c35969&chksm=f05bc767b77767af9a15369f80a8a6a5615db24d3c3f1fad727b157b713dfb9f6ced06e319ab&scene=0#rd

⏩刚刚，特朗普联手奥特曼，狂砸5000亿美元启动AI「星际之门」

这篇文章报道了特朗普与OpenAI CEO Sam Altman等人联合宣布的名为「星际之门」的人工智能项目，计划在未来四年内投资5000亿美元，旨在为美国建设新的人工智能基础设施。项目的目标是确保美国在AI领域的领导地位，创造数十万个就业岗位，并带来巨大的经济效益。文章详细介绍了项目的合作伙伴，包括软银、甲骨文和英伟达等，以及他们在技术和财务方面的角色。Sam Altman在发布会上强调了这一项目对通用人工智能（AGI）发展的重要性，并展望了AI在医疗等领域的潜在影响。这一项目被视为推动AI技术进步的关键一步，具有重要的行业意义和前瞻性。

🔗：https://www.jiqizhixin.com/articles/2025-01-22

⏩1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

本文报道了谷歌最新发布的Gemini 2.0 Flash Thinking推理模型，该模型在Chatbot Arena中再次登顶。新版本引入了1M长的上下文处理能力，显著提升了对长篇文本的分析能力。文章详细介绍了该模型的技术突破，包括在多轮对话中自我纠错的能力，以及在数学和科学能力测试中的显著进步。谷歌的开发理念强调模型的全面均衡，旨在打造一个通用的AI模型，能够在各类任务中表现出色。Jeff Dean表示，未来将根据用户反馈不断改进模型，确保其在各个领域的持续进步。

🔗：https://www.jiqizhixin.com/articles/2025-01-22-6

⏩李飞飞：语言之外，另一半的智能还有待实现

李飞飞在与投资人Reid Hoffman的对话中探讨了AI的未来发展，强调了语言智能与空间智能的区别。她认为，除了语言能力，AI还需具备处理3D空间的能力，以打破物理与数字世界的界限。李飞飞回顾了ImageNet的创立过程，指出数据驱动的重要性，并提出AI治理应关注应用层面，确保技术服务于公众福祉。她呼吁重视人类的主体能动性，强调基础研究和人才培养在AI发展中的关键作用。这场访谈为理解AI的未来趋势提供了深刻的见解。

🔗：https://www.jiqizhixin.com/articles/2025-01-22-7

⏩刚刚，豆包1.5模型家族硬核登场！「深度思考」秘笈曝光，多模态冲爆榜单

豆包大模型1.5的发布标志着AI领域的一次重要进展，其多模态能力在多个基准测试中表现优异，尤其是在视觉理解和语音对话方面。该模型在训练过程中未使用其他模型生成的数据，展现出独特的技术路线。其视觉理解能力经过全面技术升级，能够处理不同分辨率的图片，并提供详细的解题分析和分类功能。此外，豆包的语音多模态模型实现了端到端的语音对话，具备高理解力和情感表达能力。整体来看，豆包大模型1.5在AI产品创新和应用方面具有显著的影响力，推动了智能技术的边界探索。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652560273&idx=1&sn=ed6d216abfb443c2edd9fbfe3a473009&chksm=f067c9f28d43a7cbd25e4070ba6abce9f2532689ad4bfa97f36116c2244cb08d76459c985096&scene=0#rd

⏩中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

⏩刚刚，特朗普联手奥特曼，狂砸5000亿美元启动AI「星际之门」

⏩1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

⏩李飞飞：语言之外，另一半的智能还有待实现

⏩刚刚，豆包1.5模型家族硬核登场！「深度思考」秘笈曝光，多模态冲爆榜单

AI学长小林

交流频道

加入我们的社群讨论分享