【AI资讯】2月6日 | 小林的博客-AI学长

slug

summary

⏩冲击DeepSeek R1，谷歌发布新一代Gemini全型号刷榜，编程、物理模拟能力炸裂

谷歌于2025年发布了新一代Gemini 2.0系列模型，包括Gemini 2.0 Flash、Flash-Lite和旗舰版Gemini 2.0 Pro，标志着AI领域的重大进展。Gemini 2.0 Pro在编程和复杂任务上表现卓越，能够一次性生成正确代码，支持长达200万tokens的上下文处理，适用于多种任务如图像、音频和视频分析。该模型的发布引发了与DeepSeek等竞争对手的较量，后者的R1模型在性能上也备受关注。谷歌通过降低成本和增强功能，力求在全球大模型竞争中占据领先地位，Gemini 2.0的推出将进一步推动AI技术的应用与发展。

🔗：https://www.jiqizhixin.com/articles/2025-02-06-4

⏩今天起，ChatGPT搜索人人可用！OpenAI疯狂砸钱，雇300+博士为AI打工

本文报道了OpenAI推出的ChatGPT搜索功能，用户无需注册即可使用，标志着其在搜索领域的重大进展。文章分析了ChatGPT如何通过免登录模式挑战传统搜索引擎，尤其是谷歌的市场份额，并引用了Semrush的报告，指出ChatGPT在年轻用户和特定领域的流量优势。此外，OpenAI还雇佣300多名博士，以提升其模型的推理质量，涉及多个学科的复杂问题。文章还提到DeepSeek等新兴技术可能对AI开发的后训练阶段产生影响，显示出AI领域的快速发展和竞争态势。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652562887&idx=1&sn=ad0d6a34fd64e94655faef312108ab73&chksm=f0b0564d1911a2144da4452cf6f5eb4b6806648684e51edde331e77009bb4c1da97718d388f0&scene=0#rd

⏩16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

这篇文章报道了斯坦福大学等机构的研究团队提出的s1-32B模型，该模型在推理能力上超越了OpenAI的o1-preview，展示了极高的样本效率。研究者们仅使用1000个样本进行微调，并引入了预算强制（budget forcing）技术，通过控制模型的思考时间来提升推理性能。文章详细介绍了s1K数据集的构建过程，强调了样本的质量、难度和多样性。测试时扩展方法的核心在于通过增加计算量来提高模型性能，研究者们通过实验证明了这一方法的有效性。这项研究为AI推理模型的训练和应用提供了新的思路和方法，具有重要的学术和实用价值。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652562988&idx=2&sn=85722bbd6e6142e1e24c3af68006b08e&chksm=f0ab85fdfd9e090c3a50f7a2f883ccd3a782433fe8062b97726399a5da291f40087f2067e048&scene=0#rd

⏩OpenAI联创John Schulman，被曝火速离职Anthropic！刚刚入职6个月

本文报道了OpenAI联合创始人John Schulman在加入Anthropic仅六个月后选择离职的消息。Schulman是强化学习领域的先驱，并在ChatGPT的核心架构开发中发挥了重要作用。他的离职被认为对Anthropic是一个重大损失。文章回顾了Schulman的职业生涯，包括他在OpenAI的贡献以及他对AI对齐的关注。Schulman在OpenAI的工作经历和他对人工智能未来的看法也得到了详细阐述，提供了对AI领域内重要人物动态的深刻见解。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652563110&idx=1&sn=405faf3c80d6dc9483fc1982dd645a00&chksm=f019d8f1427f40288b46905ec8739a565ac2b41f6c22b9dd1c29b553e6220d90ab1291109166&scene=0#rd

⏩百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

百度智能云于2025年2月3日宣布DeepSeek-R1和DeepSeek-V3模型上线千帆平台，首日吸引超1.5万家客户调用。为降低使用成本，百度在推理引擎性能优化和服务架构创新上进行了深度融合，提供超低推理价格。DeepSeek-V3的调用价格为官方刊例价的3折，DeepSeek-R1为5折。千帆大模型平台是全球首个企业级大模型平台，至2024年11月，模型精调数超过3.3万，企业应用开发数超过77万，文心大模型日均调用次数超15亿，涵盖金融、政务、汽车等多个领域，为企业客户提供高效经济的开发体验。

🔗：https://www.jiqizhixin.com/articles/2025-02-06-11

⏩冲击DeepSeek R1，谷歌发布新一代Gemini全型号刷榜，编程、物理模拟能力炸裂

⏩今天起，ChatGPT搜索人人可用！OpenAI疯狂砸钱，雇300+博士为AI打工

⏩16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

⏩OpenAI联创John Schulman，被曝火速离职Anthropic！刚刚入职6个月

⏩百度智能云上架DeepSeek R1/V3，上线首日超1.5万家客户调用

AI学长小林

交流频道

加入我们的社群讨论分享