slug
summary
tags
icon
password
⏩从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用
GitHub推出的全新功能「GitHub Models」将有望加快AI工程师时代的到来。该功能允许开发者在GitHub上直接访问全球顶级大模型,并将其导入到自己的AI项目中。开发者可以在GitHub的代码空间中进行编码,并通过Azure进行生产部署。此举将降低部署AI模型的门槛,使每个人都有机会成为AI工程师。GitHub还提供与Azure AI的无缝集成,使开发者可以在全球25个以上的Azure区域部署AI应用,并获得企业级安全保护。GitHub Models功能的推出标志着GitHub的转型,从通过开源协作创建AI到借助AI的力量创建软件,再到如今推动AI工程师的崛起。
⏩买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100
马斯克宣布特斯拉将推出自研超算Dojo,以挑战英伟达,预计在2024年达到100 exaflops的计算能力。Dojo使用D1芯片,具备高效性能,旨在支持自动驾驶系统的训练。尽管面临英伟达GPU供应不足的挑战,特斯拉仍计划通过Dojo实现AI硬件的自主化,未来可能出租算力以拓展商业模式。
⏩世界首例!AI机器人做牙科手术,8倍速诊疗比人类医生更精准
Perceptive初创公司发明的全自动AI机器人牙医,执行了世界上首次人类临床牙科手术,诊疗速度是人类医生8倍。Perceptive宣布了两项新技术,希望机器人诊疗在未来能够为每个人带来更好的牙科体验。OCT 3D成像系统可以生成牙齿内部的3D图像,具有高分辨率和高准确率。机器人牙医的切入点是牙冠安装,使用Perceptive的机器人牙医诊疗系统,患者只需单次就诊,几分钟内就能迅速完成手术。
⏩小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++
该文章介绍了一种名为Just-read-twice(JRT)的提示策略和JRT循环架构,用于改进循环语言模型的内存需求和性能。研究者通过观察发现,数据在推理期间涌入循环语言模型的排序极大地影响了在有限内存中预测存储哪些信息的难度。他们提出了JRT-Prompt策略,在模型生成答案之前在上下文中将信息重复多次,从而有效避免了将数据排序“归正”的问题。实验结果表明,JRT-Prompt在循环语言模型和ICL任务上取得了显著的性能提升。此外,研究者还提出了JRT-RNN架构,通过改进训练损失和使用线性注意力公式来提高模型的质量和效率。该研究对于改进循环语言模型的内存效率和性能具有重要意义。
⏩阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
这篇文章介绍了阿里发布的一款名为「轨迹可控版Sora」的视频生成模型。该模型采用了Diffusion Transformer(DiT)架构,能够生成高质量、符合物理规律的视频。文章详细介绍了该模型的设计原理和实验结果,并与其他方法进行了比较。实验结果表明,该模型在生成视频的流畅度、遵循轨迹和保真度方面表现出色。该模型的应用前景广阔,可以用于视频制作、动画制作等领域。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/cdf2cc7a-5134-4a00-b2ee-f266bb613807
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。