【AI资讯】7月7日 | 小林的博客-AI学长

slug

summary

本文介绍了谷歌DeepMind的新算法JEST，可以减少ChatGPT的训练时间和能源消耗；UCSD和MIT的华人团队开源了TeleVision框架，实现远程操控机器人；阿里音频生成大模型可以快速理解和生成多种语言的语音；启明创投发布了2024生成式AI十大展望；Gemini 1.5 Pro是一款具有超强长文本和多模态能力的AI设备；华科、百度和密歇根大学合作开发了视频异常检测框架，精度达到90.67%。

⏩破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

谷歌DeepMind新算法JEST能够大大减少ChatGPT的训练时间和计算资源消耗，提高了AI训练的效率。该算法通过多模态对比学习与联合示例选择的方式，从大型数据集中筛选出与学习最相关的子batch，以减少计算量和能源消耗。这项研究对于解决AI模型耗能大、数据管理困难的问题具有重要意义。

🔗：http://www.jintiankansha.me/t/7mensCkuYD

⏩相隔3000英里，用苹果头显遥控机器人！UCSD、MIT华人团队开源TeleVision

UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision，可以让你身临其境操作机器人，即便相隔3000英里之外。Open-TeleVision创新之处在于，可以提供立体式感知环境，实现操作者动作到机器人的精确镜像，创造出一种沉浸式体验。该研究对于远程操控机器人的技术和应用具有重要意义。

🔗：http://www.jintiankansha.me/t/lBIQTjcMNr

⏩阿里音频生成大模型一次发俩还开源！50种语言快速理解+5种语言语音生成，带情感的那种

这篇文章介绍了阿里音频生成大模型的开源情况。该模型可以快速理解50种语言并生成5种语言的语音，具有情感交互的功能。它可以应用于同音交传、AI博客、情感交互和有声读物等领域。

🔗：http://www.qbitai.com/?p=163517

⏩启明创投在世界人工智能大会上发布2024生成式AI十大展望

启明创投在世界人工智能大会上发布了2024生成式AI十大展望。这篇文章提到了超级模型、超级应用和超级机遇，对于AI领域的发展趋势进行了深入分析。

🔗：http://www.qbitai.com/?p=163576

⏩Gemini 1.5 Pro 上手体验！在谷歌见证 AI 的超强长文本与多模态能力

Gemini 1.5 Pro 是一款具有超强长文本与多模态能力的 AI 设备。它的上下文窗口长度从 1M 增加到 2M，是目前主流大模型的最长上下文。此外，它还原生支持多模态，可以处理长时间的视频、音频和大量文字。Gemini 1.5 Pro 还推出了上下文缓存功能，提高了模型对长文本的处理速度和效率。本文介绍了在谷歌与 Founder Park 联合组织的线下 Workshop 上，AI 开发者和爱好者们对 Gemini 1.5 Pro 进行的上手体验，以及他们在 Google Cloud 项目实战中的经验。

🔗：http://www.jintiankansha.me/t/CMbbybPmO2

⏩突破不可解释性！视频异常新检测框架精度90.67%拿下SOTA｜华科&百度&密歇根大学

该文章介绍了一种新的视频异常检测框架，其精度达到了90.67%，超过了当前的SOTA。该框架能够精确定位并分析检测视频中的异常情况，突破了不可解释性的问题。该研究由华科、百度和密歇根大学合作完成。

🔗：http://www.qbitai.com/?p=163581

⏩破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

⏩相隔3000英里，用苹果头显遥控机器人！UCSD、MIT华人团队开源TeleVision

⏩阿里音频生成大模型一次发俩还开源！50种语言快速理解+5种语言语音生成，带情感的那种

⏩启明创投在世界人工智能大会上发布2024生成式AI十大展望

⏩Gemini 1.5 Pro 上手体验！在谷歌见证 AI 的超强长文本与多模态能力

⏩突破不可解释性！视频异常新检测框架精度90.67%拿下SOTA｜华科&百度&密歇根大学

AI学长小林

交流频道

加入我们的社群讨论分享

⏩破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

⏩相隔3000英里，用苹果头显遥控机器人！UCSD、MIT华人团队开源TeleVision

⏩阿里音频生成大模型一次发俩还开源！50种语言快速理解+5种语言语音生成，带情感的那种

⏩启明创投在世界人工智能大会上发布2024生成式AI十大展望

⏩Gemini 1.5 Pro 上手体验！在谷歌见证 AI 的超强长文本与多模态能力

⏩突破不可解释性！视频异常新检测框架精度90.67%拿下SOTA｜华科&amp;百度&amp;密歇根大学

AI学长小林

交流频道

加入我们的社群讨论分享

⏩突破不可解释性！视频异常新检测框架精度90.67%拿下SOTA｜华科&百度&密歇根大学