AI日报
【AI资讯】2月6日
00 分钟
2025-2-6
2025-2-6
slug
summary
tags
icon
password

⏩冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

谷歌于2025年发布了新一代Gemini 2.0系列模型,包括Gemini 2.0 Flash、Flash-Lite和旗舰版Gemini 2.0 Pro,标志着AI领域的重大进展。Gemini 2.0 Pro在编程和复杂任务上表现卓越,能够一次性生成正确代码,支持长达200万tokens的上下文处理,适用于多种任务如图像、音频和视频分析。该模型的发布引发了与DeepSeek等竞争对手的较量,后者的R1模型在性能上也备受关注。谷歌通过降低成本和增强功能,力求在全球大模型竞争中占据领先地位,Gemini 2.0的推出将进一步推动AI技术的应用与发展。
 

⏩今天起,ChatGPT搜索人人可用!OpenAI疯狂砸钱,雇300+博士为AI打工

本文报道了OpenAI推出的ChatGPT搜索功能,用户无需注册即可使用,标志着其在搜索领域的重大进展。文章分析了ChatGPT如何通过免登录模式挑战传统搜索引擎,尤其是谷歌的市场份额,并引用了Semrush的报告,指出ChatGPT在年轻用户和特定领域的流量优势。此外,OpenAI还雇佣300多名博士,以提升其模型的推理质量,涉及多个学科的复杂问题。文章还提到DeepSeek等新兴技术可能对AI开发的后训练阶段产生影响,显示出AI领域的快速发展和竞争态势。
 

⏩16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling

这篇文章报道了斯坦福大学等机构的研究团队提出的s1-32B模型,该模型在推理能力上超越了OpenAI的o1-preview,展示了极高的样本效率。研究者们仅使用1000个样本进行微调,并引入了预算强制(budget forcing)技术,通过控制模型的思考时间来提升推理性能。文章详细介绍了s1K数据集的构建过程,强调了样本的质量、难度和多样性。测试时扩展方法的核心在于通过增加计算量来提高模型性能,研究者们通过实验证明了这一方法的有效性。这项研究为AI推理模型的训练和应用提供了新的思路和方法,具有重要的学术和实用价值。
 

⏩OpenAI联创John Schulman,被曝火速离职Anthropic!刚刚入职6个月

本文报道了OpenAI联合创始人John Schulman在加入Anthropic仅六个月后选择离职的消息。Schulman是强化学习领域的先驱,并在ChatGPT的核心架构开发中发挥了重要作用。他的离职被认为对Anthropic是一个重大损失。文章回顾了Schulman的职业生涯,包括他在OpenAI的贡献以及他对AI对齐的关注。Schulman在OpenAI的工作经历和他对人工智能未来的看法也得到了详细阐述,提供了对AI领域内重要人物动态的深刻见解。
 

⏩百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用

百度智能云于2025年2月3日宣布DeepSeek-R1和DeepSeek-V3模型上线千帆平台,首日吸引超1.5万家客户调用。为降低使用成本,百度在推理引擎性能优化和服务架构创新上进行了深度融合,提供超低推理价格。DeepSeek-V3的调用价格为官方刊例价的3折,DeepSeek-R1为5折。千帆大模型平台是全球首个企业级大模型平台,至2024年11月,模型精调数超过3.3万,企业应用开发数超过77万,文心大模型日均调用次数超15亿,涵盖金融、政务、汽车等多个领域,为企业客户提供高效经济的开发体验。
上一篇
Deepseek R1用不了?本地部署、API 和第三方工具全攻略,一篇掌握所有替代方案!
下一篇
【AI资讯】2月5日