slug
summary
tags
icon
password
⏩破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
谷歌DeepMind新算法JEST能够大大减少ChatGPT的训练时间和计算资源消耗,提高了AI训练的效率。该算法通过多模态对比学习与联合示例选择的方式,从大型数据集中筛选出与学习最相关的子batch,以减少计算量和能源消耗。这项研究对于解决AI模型耗能大、数据管理困难的问题具有重要意义。
⏩相隔3000英里,用苹果头显遥控机器人!UCSD、MIT华人团队开源TeleVision
UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。Open-TeleVision创新之处在于,可以提供立体式感知环境,实现操作者动作到机器人的精确镜像,创造出一种沉浸式体验。该研究对于远程操控机器人的技术和应用具有重要意义。
⏩阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种
这篇文章介绍了阿里音频生成大模型的开源情况。该模型可以快速理解50种语言并生成5种语言的语音,具有情感交互的功能。它可以应用于同音交传、AI博客、情感交互和有声读物等领域。
⏩启明创投在世界人工智能大会上发布2024生成式AI十大展望
启明创投在世界人工智能大会上发布了2024生成式AI十大展望。这篇文章提到了超级模型、超级应用和超级机遇,对于AI领域的发展趋势进行了深入分析。
⏩Gemini 1.5 Pro 上手体验!在谷歌见证 AI 的超强长文本与多模态能力
Gemini 1.5 Pro 是一款具有超强长文本与多模态能力的 AI 设备。它的上下文窗口长度从 1M 增加到 2M,是目前主流大模型的最长上下文。此外,它还原生支持多模态,可以处理长时间的视频、音频和大量文字。Gemini 1.5 Pro 还推出了上下文缓存功能,提高了模型对长文本的处理速度和效率。本文介绍了在谷歌与 Founder Park 联合组织的线下 Workshop 上,AI 开发者和爱好者们对 Gemini 1.5 Pro 进行的上手体验,以及他们在 Google Cloud 项目实战中的经验。
⏩突破不可解释性!视频异常新检测框架精度90.67%拿下SOTA|华科&百度&密歇根大学
该文章介绍了一种新的视频异常检测框架,其精度达到了90.67%,超过了当前的SOTA。该框架能够精确定位并分析检测视频中的异常情况,突破了不可解释性的问题。该研究由华科、百度和密歇根大学合作完成。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/ee6d04f2-2628-49ab-ba70-521e5f638216
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。