AI日报
【AI资讯】7月30日
00 分钟
2024-7-30
2024-7-30
slug
summary
tags
icon
password

⏩刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

Meta在SIGGRAPH上发布了Segment Anything Model 2 (SAM 2),这是一个用于实时、可提示的图像和视频对象分割的统一模型。SAM 2可以分割任何视频或图像中的任何对象,甚至是以前没有见过的对象和视觉域。SAM 2在图像分割准确率方面超越了之前的功能,并且实现了比现有工作更好的视频分割性能。该模型的架构采用创新的流式内存设计,使其能够按顺序处理视频帧。Meta还发布了一个大型带注释数据库,包括大约51,000个真实世界视频和超过600,000个masklets。SAM 2已经开源并免费使用,并在Amazon SageMaker等平台上托管。
 

⏩大模型的下一个形态,不再是人和模型一轮一轮的即时问答了。

这篇文章是关于生成式AI技术在社交媒体推荐系统中的应用以及AI技术的发展趋势的。文章提到了英伟达和Meta的创始人在SIGGRAPH计算机图形学会议上的对话,讨论了生成式AI技术的应用前景。他们认为生成式AI可能会改变社交媒体的推荐系统,使其能够根据用户的兴趣生成即时创造的内容。此外,文章还提到了Meta正在研发全息AR眼镜和开放操作系统,以及英伟达和Meta在选择通用大模型和专业模型方面的分歧。

视频生成产品 Vidu 全球上线,4s 视频仅需 30s 时间,业界最快

生数科技的Vidu视频生成产品于2024年7月30日全球上线,具备4秒视频生成仅需30秒的速度,成为业界最快。Vidu支持文生视频和图生视频功能,新增动漫风格和角色一致性,能够生成高达1080P的视频,且在复杂场景中表现出色,生成速度远超其他主流工具。
 

苹果AI实测:Siri 变身智能助手,自研模型表现超过 GPT-4

苹果推出的自研基础模型(AFM)在多项任务上表现超过GPT-4,具备强大的对话功能和多种应用,包括摘要和代码生成。模型训练使用谷歌TPU,未使用英伟达硬件,数据来源于开放许可的代码和数学数据集。AFM经过多个训练阶段和创新的强化学习算法,最终在指令遵循能力和写作任务上达到新的性能标准,同时在安全性方面表现优于其他模型。
 
上一篇
【AI资讯】7月31日
下一篇
只需一张图,免费生成任意表情视频,让萝莉模仿大叔的表情,太好玩了 | LivePortrait本地安装