AI日报
OpenAI发布o3/o4-mini模型;豆包1.5深度思考模型上线;Shopify全面拥抱AI;伯克利与英伟达实现4K视觉预训练;谷歌AI破解海豚语 | 04月17日AI资讯
00 分钟
2025-4-17
2025-4-17
slug
summary
tags
icon
password

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

豆包1.5·深度思考模型上线,具备强大的视觉理解能力和多模态推理,支持复杂问题的解答。模型在数学、编程和科学推理等领域表现出色,日均调用量超过12.7万亿,推动国产AI技术发展。

Shopify all in AI!CEO:不学AI就走人,能用AI干的就不招人了

Shopify CEO Tobi Lütke强调,所有员工必须有效使用AI,视其为基本期望,AI将成为提升生产力的重要工具,团队在请求额外人力资源前需证明能否用AI完成目标,鼓励共享AI学习经验以促进创新。

OpenAI发布o3、o4-mini:首批使用图片思考的推理模型,会自主使用工具、评测继续刷榜

OpenAI发布了o3和o4-mini两款新型推理模型,具备图像思维能力和自主使用工具的功能,o3在多个基准测试中创下新纪录,o4-mini则在成本和性能上表现优异,二者均支持多模态任务和高效推理。

4K分辨率视觉预训练首次实现!伯克利 & 英伟达多模态新SOTA,更准且3倍加速处理

伯克利与英伟达推出PS3视觉编码器,实现4K超高分辨率的高效视觉预训练,显著提升了多模态模型VILA-HD的表现和处理速度,准确率提高3.2%,处理速度提升三倍。

谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

谷歌推出DolphinGemma模型,基于30年海豚研究数据,能够破解海豚语言,实现人与海豚的实时交流。该模型可在普通手机上运行,利用音频技术识别和预测海豚的声音模式。
上一篇
智谱3亿支持开源;字节AI营销产品登顶;谷歌发布Gemini 2.5 Flash;OpenAI推出o3/o4-mini模型;蚂蚁集团推百宝箱平台 | 04月18日AI资讯
下一篇
Claude推出高级Research功能;MiniMax线性注意力突破;港中文清华Video-R1反超GPT-4o;OpenAI发布GPT-4.1系列;可灵AI全球用户突破2200万 | 04月16日AI资讯