【AI资讯】1月21日 | 小林的博客-AI学长

slug

summary

谷歌Gemini成功创作全球首部AI撰写的10万字商业战略书籍；Kimi k1.5多模态模型在数学和编程上与OpenAI相当；DeepSeek推出的R1推理模型在多个任务上表现优异；微软团队探讨无直接数据下大行动模型的训练流程，推动AI应用进展。

⏩不到4小时，谷歌Gemini写完10万字商业战略书籍！人类全程没碰一个字

这篇文章报道了初创公司DeepWriter成功创作了全球第一部完全由AI撰写的10万字商业战略书籍，使用谷歌的Gemini Flash 2.0-exp模型，创作过程仅耗时不到4小时。文章详细介绍了AI在写作中的应用，强调了其在商业领域的潜力和创新性。书籍主题围绕小型SaaS初创公司如何在竞争中脱颖而出，AI模型通过简单的提示生成内容，且写作质量接近人类水平。文章还探讨了Deepwriter的写作流程和功能，展示了AI在创作复杂文档方面的能力，预示着AI写作工具的未来发展方向。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652559712&idx=2&sn=b89086e10073a21ef5d88073bf1fd023&chksm=f0fdee65b1400b2b5755cab425a581f17a82c1af7f3816f87b8da2beb9133860807dffc0b0ed&scene=0#rd

⏩追平满血版o1的国产多模态模型终于来了！训练细节全部公开

本文介绍了月之暗面发布的Kimi k1.5多模态思考模型，该模型在数学、代码和多模态推理能力上达到了与OpenAI满血版o1相当的水平，成为全球首个在这些领域达到此性能的非OpenAI模型。文章详细阐述了Kimi k1.5的训练细节，包括基于强化学习的后训练技术和长上下文的优化策略。Kimi k1.5在多个基准测试中表现优异，尤其是在数学和编程竞赛中，显示出其强大的推理能力和通用能力。该技术的透明度和开放性在当前竞争激烈的AI市场中显得尤为重要，月之暗面希望通过分享技术细节吸引更多人才参与AGI的探索。

🔗：https://www.jiqizhixin.com/articles/2025-01-21-4

⏩「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

DeepSeek推出的R1推理模型在数学、代码和自然语言推理等任务上与OpenAI的o1模型相媲美，标志着AI领域的重大进展。R1采用多阶段循环训练方式，结合强化学习技术，显著提升了模型推理能力。DeepSeek-R1的开源策略和极具竞争力的API定价，使其在市场上具有高性价比。该模型的训练技术和研究论文也已公开，推动了开源社区的发展。DeepSeek-R1-Zero的设计创新在于使用群组相对策略优化和独特的奖励机制，进一步降低了训练成本并提升了模型性能。这些进展可能会改变AI领域的竞争格局，促使其他公司加速追赶。

🔗：https://www.jiqizhixin.com/articles/2025-01-21-5

⏩无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

本文探讨了微软团队在无直接数据情况下如何训练大行动模型（LAM），以解决大语言模型（LLMs）在实际应用中的局限性。文章详细描述了LAM的三大特性：用户意图理解、行动生成能力和动态规划与适应，强调了从被动的文本生成转变为主动的行动生成的重要性。微软团队提出了一套完整的训练流程，涵盖数据积累、模型训练和实际部署，旨在克服数据获取和模型评估的挑战。这一研究为AI在复杂任务执行中的应用提供了新思路，推动了自然语言处理领域的技术进步。

🔗：https://www.jiqizhixin.com/articles/2025-01-21-6

⏩不到4小时，谷歌Gemini写完10万字商业战略书籍！人类全程没碰一个字

⏩追平满血版o1的国产多模态模型终于来了！训练细节全部公开

⏩「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

⏩无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

AI学长小林

交流频道

加入我们的社群讨论分享