【AI资讯】7月30日 | 小林的博客-AI学长

slug

summary

Meta发布了Segment Anything Model 2（SAM 2），用于实时图像和视频对象分割，并开源了相关数据库。生成式AI技术在社交媒体推荐系统中的应用前景被探讨，Meta和英伟达的创始人讨论了未来的发展趋势。生数科技的Vidu视频生成产品以30秒生成4秒视频的速度全球上线，成为业界最快。苹果的自研基础模型（AFM）在多项任务上表现超过GPT-4，具备强大的对话功能和应用。

⏩刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

Meta在SIGGRAPH上发布了Segment Anything Model 2 (SAM 2)，这是一个用于实时、可提示的图像和视频对象分割的统一模型。SAM 2可以分割任何视频或图像中的任何对象，甚至是以前没有见过的对象和视觉域。SAM 2在图像分割准确率方面超越了之前的功能，并且实现了比现有工作更好的视频分割性能。该模型的架构采用创新的流式内存设计，使其能够按顺序处理视频帧。Meta还发布了一个大型带注释数据库，包括大约51,000个真实世界视频和超过600,000个masklets。SAM 2已经开源并免费使用，并在Amazon SageMaker等平台上托管。

🔗：https://www.jiqizhixin.com/articles/2024-07-30-5

⏩大模型的下一个形态，不再是人和模型一轮一轮的即时问答了。

这篇文章是关于生成式AI技术在社交媒体推荐系统中的应用以及AI技术的发展趋势的。文章提到了英伟达和Meta的创始人在SIGGRAPH计算机图形学会议上的对话，讨论了生成式AI技术的应用前景。他们认为生成式AI可能会改变社交媒体的推荐系统，使其能够根据用户的兴趣生成即时创造的内容。此外，文章还提到了Meta正在研发全息AR眼镜和开放操作系统，以及英伟达和Meta在选择通用大模型和专业模型方面的分歧。

🔗：https://www.jiqizhixin.com/articles/2024-07-30-9

⏩视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

生数科技的Vidu视频生成产品于2024年7月30日全球上线，具备4秒视频生成仅需30秒的速度，成为业界最快。Vidu支持文生视频和图生视频功能，新增动漫风格和角色一致性，能够生成高达1080P的视频，且在复杂场景中表现出色，生成速度远超其他主流工具。

🔗：http://mp.weixin.qq.com/s?__biz=Mzg5NTc0MjgwMw==&mid=2247504199&idx=2&sn=a48f5d04f215b23b13d93d6432fb9a01&chksm=c1843a971209a422825042cdf7b4839f33d84cdd88be85defa8fcc35dfc8f7dba630712be572&scene=0#rd

⏩苹果AI实测：Siri 变身智能助手，自研模型表现超过 GPT-4

苹果推出的自研基础模型（AFM）在多项任务上表现超过GPT-4，具备强大的对话功能和多种应用，包括摘要和代码生成。模型训练使用谷歌TPU，未使用英伟达硬件，数据来源于开放许可的代码和数学数据集。AFM经过多个训练阶段和创新的强化学习算法，最终在指令遵循能力和写作任务上达到新的性能标准，同时在安全性方面表现优于其他模型。

🔗：http://mp.weixin.qq.com/s?__biz=Mzg5NTc0MjgwMw==&mid=2247504199&idx=3&sn=7ad5656813d36082676c2245abfff898&chksm=c12a34f0690414f0f07aa13d9cd6e876f77903fdce61aa424d94df18cff2ab0c50abf6637723&scene=0#rd

⏩刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

⏩大模型的下一个形态，不再是人和模型一轮一轮的即时问答了。

⏩视频生成产品 Vidu 全球上线，4s 视频仅需 30s 时间，业界最快

⏩苹果AI实测：Siri 变身智能助手，自研模型表现超过 GPT-4

AI学长小林

交流频道

加入我们的社群讨论分享