slug
summary
tags
icon
password
⏩Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先
Jamba 1.5是当前最强的长上下文模型,基于新提出的Mamba架构,成功挑战传统的Transformer架构。该模型具备256K的上下文窗口,速度和质量均优于同类模型,标志着LLM领域的重要创新。AI21 Labs的联合首席执行官表示,Jamba的设计旨在满足企业客户的特定需求,提供高性能的生成式AI应用。Jamba的发布不仅展示了Mamba与Transformer的结合,还推动了混合SSM-Transformer模型的生产级应用,解决了传统架构在内存占用和推理速度上的不足。这一创新为语言模型的发展开辟了新的可能性,具有重要的行业影响。
⏩语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
Meta最新发布的Transfusion模型实现了文本和图像生成的统一,标志着多模态AI的重大进展。该模型融合了Transformer和扩散模型的优势,能够在混合模态序列上进行训练,参数量高达70亿。研究表明,Transfusion在生成高质量图像方面表现优异,超越了DALL-E 2和Stable Diffusion XL。通过全局因果注意力和模态特定的编码解码层,Transfusion在处理离散和连续模态的组合上展现出强大的能力,预示着未来多模态AI模型的广泛应用潜力。
⏩李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文
李沐在演讲中探讨了选择职业道路的重要性,包括在大公司工作、攻读博士学位和创业的优缺点。强调了动机的重要性,指出强烈的动机源于欲望和恐惧,并建议在选择职业时考虑个人的兴趣和目标。最后,提到在快速变化的时代中,努力和适应能力是成功的关键。
⏩萝卜快跑1天1万单,六代车投放在即!李彦宏:Robotaxi正成为通勤首选
本文报道了百度Apollo的Robotaxi服务在市场上的快速增长,累计订单数已突破700万,显示出其在自动驾驶领域的强劲表现。李彦宏指出,Robotaxi正逐渐成为人们通勤的首选,反映出智能出行的趋势和消费者对无人驾驶技术的认可。文章还探讨了无人车未来的发展方向,强调了自动驾驶技术在交通领域的重要性和潜力。这些信息对于关注AI和自动驾驶技术的读者具有较高的实用价值和参考意义。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/35e91999-4e71-4f8d-81bd-bd4aaf9a4acf
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。