AI日报
【AI资讯】6月26日
00 分钟
2024-6-26
2024-6-26
slug
summary
tags
icon
password

⏩中国科技「亮剑」!十年来,AI领域项目首次问鼎国家科技奖一等奖

中国科技公司科大讯飞荣获2023年度国家科学技术进步奖一等奖,成为过去十年AI领域获得的首个国奖一等奖。今年的国奖评选非常激烈,科大讯飞的获奖项目是《多语种智能语音关键技术及产业化》。该项目是多个语种的语音识别、语音合成、机器翻译集合为一体的综合技术,打破了科技封锁,解决了难题。科大讯飞在AI领域深耕25年,持续攻关近10年,其多语种智能技术获得了多项世界冠军。

⏩百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法

中国团队与新加坡南洋理工大学合作发布了一篇名为《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning》的论文,提出了Q*模型算法,可以帮助小模型达到参数量比其大数十倍甚至上百倍模型的推理能力,大幅提升了小模型的性能,并显著降低了计算资源的需求。该算法在GSM8K、MATH和MBPP数据集上取得了性能飞跃,评分分别超越了ChatGPT和Gemini Ultra。该研究对于国产开源模型推理能力的提升具有重要意义,有望为人工智能前沿技术发展带来全新可能。

⏩AGI 大会上好评如潮的演讲:创新工场汪华解读 AI 应用爆发何时到来?

汪华在AGI大会上分享了关于AI应用爆发的见解。他指出,AI的投资重点正在向应用侧迁移,今年投资在应用上的金额比去年有了翻倍增长。他认为AI应用爆发的四个前提是模型性能、推理成本、模型的模态和应用生态的演进与完善。他强调推理成本的降低对于AI应用的普及至关重要,预计到明年年底,模型的性能推理成本会降到现在的100倍。

⏩人脸伪造图像检测:Deepfake魔高一尺,TextIn道高一丈

本文介绍了一起Deepfake视频会议诈骗案件,并探讨了AI技术在人脸伪造方面的风险和挑战。文章提到了AI技术的高仿真度使得虚假图片在宣传、取证和诈骗等方面被滥用的风险上升,进一步加剧了社会对图像真实性的质疑。同时,文章介绍了TextIn人脸伪造检测技术,该技术基于CNN+ViT技术框架实现,通过大批量训练Deepfake样本提供防伪手段,并具备较高的识别准确率。文章指出,随着技术的进步和完善,TextIn人脸伪造检测技术将成为保护网络安全和个人隐私的重要工具。

⏩美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖

美图影像研究院(MT Lab)在国际人工智能顶会CVPR 2024的野外像素级视频理解挑战赛中获得了视频语义分割(VSS)和复杂场景视频目标分割(MOSE)的亚军,以及视频全景分割挑战赛(VPS)的季军。这次成绩证明了美图影像研究院在视频领域的长期布局和持续探索,并将这些前沿技术应用于美图公司旗下的产品中。美图影像研究院将继续专注于AI领域的研发,推动AI技术的落地应用,为用户和客户提供更好的AI工作流。

⏩模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞

初创公司Evolutionary Scale AI发布了最新的98B参数蛋白质语言模型ESM3,支持序列、结构、功能的all-to-all推理,并模拟自然界5亿年的进化。ESM3与AlphaFold 3相比具有竞争优势,开源且与AWS和英伟达云计算平台合作。ESM3是首个能同时对蛋白质的序列、结构和功能进行推理的生成模型,训练过程包括了地球自然环境的多样性,训练参数总量达到98B,使用了超过1024 FLOPS的算力。

⏩自动驾驶理论新突破登Nature子刊!清华、密歇根联合提出三条技术路线,剑指「稀疏度灾难」

清华大学与密歇根大学联合提出的自动驾驶汽车安全性「稀疏度灾难」问题发表在《Nature Communications》上。研究指出,稀疏性导致深度学习模型训练难度增加,提出了密集学习、模型泛化改进和车路协同等技术路线以应对挑战。稀疏度灾难广泛存在于自动驾驶的感知、预测、决策、测试等安全攸关任务中,造成了自动驾驶汽车的安全性挑战。研究提出了三种解决稀疏度灾难的技术路线,包括使用安全攸关数据进行密集学习、改善模型泛化和推理能力以及利用车路协同等技术降低安全风险事件发生概率。

⏩今天起,全球所有Mac用户可免费安装桌面版ChatGPT

OpenAI宣布推出适用于macOS的ChatGPT应用程序,用户可以直接从OpenAI网站下载。ChatGPT for Mac支持GPT-3.5、GPT-4和GPT-4o型号,还支持DALL-E图像生成器和自定义GPT。苹果用户将能够通过iPhone和iPad访问ChatGPT,包括通过Siri和其他应用形式。Windows版本也在开发中。

⏩ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

本文介绍了天津大学量子智能与语言理解团队提出的量子隐式表征网络(QIREN),该方法在理论上具有指数级强的信号表征能力,并在实验中表现出超越SOTA模型的性能。文章详细介绍了QIREN的架构和理论分析,以及与经典方法的比较。该研究成果已被ICML 2024接收。

⏩史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造

美国芯片创业公司Etched推出了自己的第一块AI芯片Sohu,它运行大模型的速度比英伟达H100要快20倍,比今年3月才推出的顶配芯片B200也要快上超过10倍。Sohu是世界第一款专用于Transformer计算的芯片,与其他产品之间是量级的区别。文章介绍了Sohu芯片的性能和优势,以及其对于Transformer架构的适用性。

⏩OpenAI断供大陆市场,这家GPT-4的“国产平替”真香

OpenAI将封锁非支持国家和地区的API流量,对中国大陆市场的开发者和企业将带来巨大冲击。AI公司零一万物推出了“Yi API二折平替计划”,提供了高性能且性价比极高的替换方案。Yi-Large在模型评测中表现优秀,性能和使用成本都超过了GPT-4。Yi-Large-Turbo和Yi-Medium也提供了更低的使用成本和更适合特定场景的模型选择。

⏩旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包

旷视科技发布了开源的AI人像视频生成框架MegActor,用户只需输入一张静态的肖像图片和一段视频文件,即可生成表情丰富、动作一致的AI人像视频。MegActor采用开源方式提供给开发者社区使用,能够生成非常逼真的视频。旷视研究院始终坚持全面开源,确保实际效果的可复现性。MegActor的训练数据全部来自公开可获取的开源数据集,配合开源代码,使得感兴趣的从业者可以从头开始完整复现这些令人惊艳的效果。

⏩耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘

这篇文章介绍了字节跳动豆包大模型团队最近发布的语音生成大模型成果Seed-TTS。该模型能够生成几乎与真人完全一样的语音,包括发音瑕疵和人类说话的特点。文章提供了一些生成的中文和英文语音示例,并介绍了模型的音色定制和根据情节和角色特质生成对应人物和情绪的语音的能力。该模型已经在C端产品上线并获得了用户的好评。团队成员分享了一些关于该模型的认可和技术亮点。

⏩模拟5亿年的进化信息,首个同时推理蛋白质序列、结构和功能的生物学大模型

该文章介绍了EvolutionaryScale团队提出的ESM3模型,该模型可以同时推理蛋白质的序列、结构和功能。ESM3是一种前沿的多模态生成语言模型,可以模拟超过5亿年的自然进化过程,并生成不同于已知蛋白质序列的功能性蛋白质。该模型具有高度敏感的生物学对齐能力,能够更准确地反映自然界的生物逻辑和进化约束。ESM3的多模态推理能力使科学家能够以前所未有的控制程度生成新蛋白质。该研究具有重要的科学意义和应用前景。

⏩钉钉宣布对所有大模型开放,构建中国最开放AI生态

钉钉宣布对所有大模型开放,构建中国最开放AI生态。钉钉生态伙伴总数超过5600家,其中AI 生态伙伴已经超过100家;钉钉AI每天调用量超1000万次。钉钉将自身产品和场景向所有大模型厂商开放,构建最开放的AI生态,与伙伴共同探索大模型应用之路。钉钉与大模型生态伙伴将以三种模式展开合作与探索。钉钉的IM、文档、音视频等产品的AI能力主要由通义大模型支持。在此基础上,钉钉将结合其他各家大模型的特点,探索不同模型能力在产品和场景中的应用。钉钉还宣布升级全局搜索能力,开启全新“钉钉 AI 搜索”的邀测。

⏩OpenAI 突然断供中国!商汤推出0成本“搬家服务”,还送大礼包

商汤科技推出大模型0元购计划,为新注册企业用户提供免费服务大礼包,包括多类模型API接口。商汤还赠送5000万Token包,并提供迁移培训,帮助用户顺利过渡到商汤平台。与此同时,OpenAI宣布将阻止来自不在其支持列表中的国家和地区的API流量,其中不包括中国。
上一篇
OpenAI终止API服务,中国用户该如何应对?4个安全使用方法,让你无惧封禁!
下一篇
【AI资讯】6月25日