【AI资讯】7月11日 | 小林的博客-AI学长

slug

summary

⏩夸克升级“超级搜索框”  推出AI搜索为中心的一站式AI服务

阿里智能信息事业群旗下夸克推出以AI搜索为中心的一站式AI服务，提供从检索、创作、总结，到编辑、存储、分享的一体化信息服务价值。夸克7.0版搜索框集合了智能回答、智能创作和智能总结三大能力，能更好地理解用户意图，提供准确、丰富的结果。此外，夸克还支持视频字幕导出、分段总结、整体总结、生成脑图等功能，提升工作学习效率。夸克的AI搜索与大语言模型能力的契合已成为行业共识，未来将加快产品创新节奏，为用户创造无处不在的信息服务价值。

🔗：https://www.jiqizhixin.com/articles/2024-07-11

⏩Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI

这篇文章介绍了加拿大温莎大学研究人员对GPT和Meta AI的Llama在化学信息学领域的应用进行比较的研究。研究人员发现，使用Llama生成的SMILES嵌入在分子特性和药物-药物相互作用预测任务中的表现优于GPT生成的SMILES嵌入。这项研究凸显了Llama在分子嵌入方面的潜力，并推荐Llama模型作为从SMILES字符串生成分子嵌入的优选模型。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-2

⏩精度媲美AlphaFold，EPFL的AI方法从序列中匹配蛋白质互作

洛桑联邦理工学院（EPFL）的Anne-Florence Bitbol团队提出了一种配对相互作用的蛋白质序列的方法，利用了在多个序列比对上训练的蛋白质语言模型的强大功能。该方法对小型数据集表现良好，可以改进蛋白质复合物的结构预测。研究人员已免费提供该方法，希望科学界广泛采用它以进一步推动计算生物学的发展，并使研究人员能够探索蛋白质相互作用的复杂性。该方法不仅增强了科学家对蛋白质相互作用的理解，而且开辟了医学研究的新途径，有可能带来疾病治疗和药物开发的突破。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-3

⏩CVPR世界第二仅次Nature！谷歌2024学术指标出炉，NeurIPS、ICLR跻身前十

谷歌2024学术指标公布，CVPR位居第二，超越Science仅次于Nature。CVPR、NeurIPS、ICLR三大顶会跻身TOP 10，分别位列第二、第七和第十。CVPR被引最高的论文包括动量对比（MoCo）算法、StyleGAN算法和A ConvNet for the 2020s。NeurIPS被引最高的论文包括PyTorch开山之作和GPT-3。ICLR被引最高的论文包括LoRA和Vision Transformer（ViT）。ICCV被引最高的论文包括Swin Transformer和SAM。

🔗：http://www.jintiankansha.me/t/EfTQ3LTMCt

⏩CVPR成全球第二大学术出版物，超越Science！AI顶会占领前20｜谷歌学术指标2024

CVPR成为全球第二大学术出版物，超越Science！NeurIPS和ICLR进入前十。

🔗：http://www.qbitai.com/?p=165464

⏩首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

全球首届AI数学奥林匹克竞赛（AIMO）的获胜团队使用了NuminaMath 7B TIR模型，该模型是deepseek-math-7b-base的微调版本。该模型在数学推理能力上逼近GPT-4，在MATH基准榜单上超过了30B~70B的开源模型。NuminaMath 7B TIR模型经过两个阶段的监督微调，可以通过结合自然语言推理和使用Python REPL来计算中间结果，解决数学问题。然而，该模型难以解决几何问题，可能是因为其容量有限且缺乏视觉等模态。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-4

⏩CVPR'24 Highlight｜一个框架搞定人物动作生成，精细到手部运动

本文介绍了一种使用自回归条件扩散模型的动作生成框架，可以实现真实、带有语义、符合场景且无长度限制的动作生成。同时，还发布了一个大规模人物-场景交互数据集TRUMANS，包含准确且丰富的针对人物动作以及三维场景的标注信息。该研究对人物动作生成领域的发展具有重要意义。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-6

⏩ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

ControlNet 作者 Lvmin Zhang 推出了新项目 PaintsUndo，通过输入一张静态图像，可以自动生成整个绘画的全过程视频。PaintsUndo 不仅可以处理不同类型的图像，还可以进行素描、上墨、着色、阴影、变换等多种绘画行为。该项目在本地部署过程简单，速度较快，预计可以在5到10分钟内处理一张图像。项目发布了两个模型，单帧模型和多帧模型，多帧模型的结果更加一致但速度较慢。PaintsUndo 的发布受到了广泛关注，收获了1.4k star。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-7

⏩GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

该文章介绍了字节跳动大模型团队开发的成果 Depth Anything V2 被苹果官方收入 Core ML 模型库的情况。Depth Anything V2 是一种单目深度估计模型，可以应用于视频特效、自动驾驶、3D建模、增强现实等领域。文章还介绍了该模型的技术挑战和解决方法，以及团队对于 Scaling Laws 在单一视觉任务方面的思考。该模型在 Github 上收获了8.7k Star。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-9

⏩18个月326项能力，这家大厂猛猛上新生成式AI，如今纯靠Prompt就搞定企业级应用了

亚马逊云科技发布了一系列生成式AI技术，将大模型技术与企业用户需求连接起来。他们已经发布了326个生成式AI功能，数量是其他供应商总和的两倍多。亚马逊云科技的三层生成式AI技术栈迎来了一次升级，包括大模型微调和检索增强生成（RAG）。此外，他们还推出了Guardrails for Amazon Bedrock，可以阻止高达85%的有害内容。

🔗：https://www.jiqizhixin.com/articles/2024-07-11-10

⏩夸克升级“超级搜索框”  推出AI搜索为中心的一站式AI服务

⏩Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI

⏩精度媲美AlphaFold，EPFL的AI方法从序列中匹配蛋白质互作

⏩CVPR世界第二仅次Nature！谷歌2024学术指标出炉，NeurIPS、ICLR跻身前十

⏩CVPR成全球第二大学术出版物，超越Science！AI顶会占领前20｜谷歌学术指标2024

⏩首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

⏩CVPR'24 Highlight｜一个框架搞定人物动作生成，精细到手部运动

⏩ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

⏩GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

⏩18个月326项能力，这家大厂猛猛上新生成式AI，如今纯靠Prompt就搞定企业级应用了

AI学长小林

交流频道

加入我们的社群讨论分享

⏩夸克升级“超级搜索框” &nbsp;推出AI搜索为中心的一站式AI服务

⏩Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI

⏩精度媲美AlphaFold，EPFL的AI方法从序列中匹配蛋白质互作

⏩CVPR世界第二仅次Nature！谷歌2024学术指标出炉，NeurIPS、ICLR跻身前十

⏩CVPR成全球第二大学术出版物，超越Science！AI顶会占领前20｜谷歌学术指标2024

⏩首届AI奥数竞赛方案公布：4支获奖队伍，竟都选择国产模型DeepSeekMath

⏩CVPR'24 Highlight｜一个框架搞定人物动作生成，精细到手部运动

⏩ControlNet作者又出爆款！一张图生成绘画全过程，两天狂揽1.4k Star

⏩GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

⏩18个月326项能力，这家大厂猛猛上新生成式AI，如今纯靠Prompt就搞定企业级应用了

AI学长小林

交流频道

加入我们的社群讨论分享

⏩夸克升级“超级搜索框” 推出AI搜索为中心的一站式AI服务