发布于: 2024-7-11最后更新: 2024-7-11字数 00 分钟

slug
summary
tags
icon
password
 

⏩夸克升级“超级搜索框”  推出AI搜索为中心的一站式AI服务

阿里智能信息事业群旗下夸克推出以AI搜索为中心的一站式AI服务,提供从检索、创作、总结,到编辑、存储、分享的一体化信息服务价值。夸克7.0版搜索框集合了智能回答、智能创作和智能总结三大能力,能更好地理解用户意图,提供准确、丰富的结果。此外,夸克还支持视频字幕导出、分段总结、整体总结、生成脑图等功能,提升工作学习效率。夸克的AI搜索与大语言模型能力的契合已成为行业共识,未来将加快产品创新节奏,为用户创造无处不在的信息服务价值。

⏩Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

这篇文章介绍了加拿大温莎大学研究人员对GPT和Meta AI的Llama在化学信息学领域的应用进行比较的研究。研究人员发现,使用Llama生成的SMILES嵌入在分子特性和药物-药物相互作用预测任务中的表现优于GPT生成的SMILES嵌入。这项研究凸显了Llama在分子嵌入方面的潜力,并推荐Llama模型作为从SMILES字符串生成分子嵌入的优选模型。

⏩精度媲美AlphaFold,EPFL的AI方法从序列中匹配蛋白质互作

洛桑联邦理工学院(EPFL)的Anne-Florence Bitbol团队提出了一种配对相互作用的蛋白质序列的方法,利用了在多个序列比对上训练的蛋白质语言模型的强大功能。该方法对小型数据集表现良好,可以改进蛋白质复合物的结构预测。研究人员已免费提供该方法,希望科学界广泛采用它以进一步推动计算生物学的发展,并使研究人员能够探索蛋白质相互作用的复杂性。该方法不仅增强了科学家对蛋白质相互作用的理解,而且开辟了医学研究的新途径,有可能带来疾病治疗和药物开发的突破。

⏩CVPR世界第二仅次Nature!谷歌2024学术指标出炉,NeurIPS、ICLR跻身前十

谷歌2024学术指标公布,CVPR位居第二,超越Science仅次于Nature。CVPR、NeurIPS、ICLR三大顶会跻身TOP 10,分别位列第二、第七和第十。CVPR被引最高的论文包括动量对比(MoCo)算法、StyleGAN算法和A ConvNet for the 2020s。NeurIPS被引最高的论文包括PyTorch开山之作和GPT-3。ICLR被引最高的论文包括LoRA和Vision Transformer(ViT)。ICCV被引最高的论文包括Swin Transformer和SAM。

⏩CVPR成全球第二大学术出版物,超越Science!AI顶会占领前20|谷歌学术指标2024

CVPR成为全球第二大学术出版物,超越Science!NeurIPS和ICLR进入前十。

⏩首届AI奥数竞赛方案公布:4支获奖队伍,竟都选择国产模型DeepSeekMath

全球首届AI数学奥林匹克竞赛(AIMO)的获胜团队使用了NuminaMath 7B TIR模型,该模型是deepseek-math-7b-base的微调版本。该模型在数学推理能力上逼近GPT-4,在MATH基准榜单上超过了30B~70B的开源模型。NuminaMath 7B TIR模型经过两个阶段的监督微调,可以通过结合自然语言推理和使用Python REPL来计算中间结果,解决数学问题。然而,该模型难以解决几何问题,可能是因为其容量有限且缺乏视觉等模态。

⏩CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动

本文介绍了一种使用自回归条件扩散模型的动作生成框架,可以实现真实、带有语义、符合场景且无长度限制的动作生成。同时,还发布了一个大规模人物-场景交互数据集TRUMANS,包含准确且丰富的针对人物动作以及三维场景的标注信息。该研究对人物动作生成领域的发展具有重要意义。

⏩ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

ControlNet 作者 Lvmin Zhang 推出了新项目 PaintsUndo,通过输入一张静态图像,可以自动生成整个绘画的全过程视频。PaintsUndo 不仅可以处理不同类型的图像,还可以进行素描、上墨、着色、阴影、变换等多种绘画行为。该项目在本地部署过程简单,速度较快,预计可以在5到10分钟内处理一张图像。项目发布了两个模型,单帧模型和多帧模型,多帧模型的结果更加一致但速度较慢。PaintsUndo 的发布受到了广泛关注,收获了1.4k star。

⏩GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

该文章介绍了字节跳动大模型团队开发的成果 Depth Anything V2 被苹果官方收入 Core ML 模型库的情况。Depth Anything V2 是一种单目深度估计模型,可以应用于视频特效、自动驾驶、3D建模、增强现实等领域。文章还介绍了该模型的技术挑战和解决方法,以及团队对于 Scaling Laws 在单一视觉任务方面的思考。该模型在 Github 上收获了8.7k Star。

⏩18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了

亚马逊云科技发布了一系列生成式AI技术,将大模型技术与企业用户需求连接起来。他们已经发布了326个生成式AI功能,数量是其他供应商总和的两倍多。亚马逊云科技的三层生成式AI技术栈迎来了一次升级,包括大模型微调和检索增强生成(RAG)。此外,他们还推出了Guardrails for Amazon Bedrock,可以阻止高达85%的有害内容。

Loading...
【AI资讯】7月12日

【AI资讯】7月12日

该文档是关于AI资讯的摘要,涵盖了AI Agent开源项目、通用Agent新框架、注意力算法的改进、生成式模型的能力超越、类脑计算模型、视频推理框架、量子化学计算、反向传播显存效率、GPT-2训练成本降低、机器人大模型公司、大模型在金融投资领域的应用等主题。

【AI资讯】7月10日

【AI资讯】7月10日

本文介绍了多个AI相关的新闻和研究成果,包括NeRF渲染结果的瞬态干扰物去除方法、全新的语言模型架构TTT、大语言模型树搜索训练增强框架TSLLM、带有显式记忆的语言模型Memory3、神经元对语义信息的精细皮层表征、视频生成AI模型「可灵AI」的升级、DeepMind的训练方法改进、RAG大模型知识冲突的解析、Claude工具的prompt生成和评估、百万专家Mixture的参数高效专家检索机制、隐私计算技术的应用和标准化、半导体设计开源大模型SemiKong、AlphaFold 3的预测生物分子复合物的能力、西门子在工业领域的AI应用、京西集团的全球技术战略和智能底盘产品的发展。

公告
分享AI实战与落地的知识,高效探索ChatGPT的使用方法、技巧与行业应用场景,让AI成为你手中真正的生产力!