slug
summary
tags
icon
password
⏩力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议
Gemma 2模型以27B的参数击败了70B的Llama 3-Instruct,成为开源模型的性能第一。Gemma 2在LMSYS Chatbot Arena的排行上取得了亮眼的成绩,并在多轮对话排行榜上表现强劲。Gemma 2采用了更深的网络和局部滑动窗口与全局注意力的结合,同时使用了知识蒸馏法进行训练。然而,Gemma 2的微调数据来源引起了争议,其中包括LMSYS的聊天数据集。
⏩《奇点更近了》作者再预言:2045年,智能将扩展到100万倍
该文章是关于Ray Kurzweil的新作《奇点更近了》的报道。Ray Kurzweil是人工智能领域的权威,他在2005年出版的《奇点临近》引发了人们的关注。在新作中,他提出了5个关键性的预言,包括将智能扩展到100万倍。文章还提到了计算能力的指数级增长和人工智能在医学领域的应用。
⏩登Nature子刊,拓扑Transformer模型进行多尺度蛋白质-配体互作预测,助力药物研发
该文章介绍了一项名为TopoFormer的人工智能应用,该应用可以将分子的三维信息转化为药物相互作用模型可以使用的数据,从而提高药物研发能力。研究团队开发了一个拓扑Transformer模型TopoFormer,通过将蛋白质-配体复合物转换为拓扑不变量和同伦形状的序列,在多个尺度上捕捉它们的物理、化学和生物相互作用。该模型在预测药物和蛋白质相互作用方面表现出色,有望缩短药物开发时间和降低成本。该研究发表在《Nature Machine Intelligence》上。
⏩全网围观魏建军直播:长城端到端智驾大模型挑战重庆「魔幻路况」
长城汽车董事长魏建军通过直播向全球展示了长城汽车全场景NOA在重庆的挑战性路段的实际表现。直播中展示了长城汽车智能驾驶技术的全方位检验和领先的智能驾驶解决方案。文章介绍了长城汽车的技术王牌SEE模型的实战检验,以及全场景NOA在各种驾驶场景中的高效应对能力。同时,文章也强调了长城汽车智驾系统的安全性和效率,并介绍了其庞大的算力支撑和超算中心九州。最后,文章展望了长城汽车智能驾驶系统的未来发展。
⏩浙大、腾讯团队发布科学LLM大规模评测基准,国产大模型表现亮眼
浙大、腾讯团队发布了SciKnowEval评测基准,用于评估大型语言模型在理解和应用科学知识方面的能力。该基准包含化学和生物领域的50,000个不同层次的科学评测题目,并对20个开源和闭源LLMs进行了基准测试。研究发现,拥有千亿至万亿参数的通用大语言模型表现出色,整体性能优于中小型开源模型。此外,研究者还评测了一系列科学专业领域大模型,发现它们在专业领域知识测试中整体表现优秀。该研究对于评估和改进大型语言模型在科学领域的应用具有重要意义。
⏩神经网络可能不再需要激活函数?Layer Normalization也具有非线性表达!
这篇文章介绍了一篇发表在ICML2024上的论文《On the Nonlinearity of Layer Normalization》,该论文指出层标准化(Layer Normlization,LN)以及其计算退化版本RMSNorm具有非线性表达能力,并详细讨论了LN的万能近似分类能力。作者通过数学证明和实验验证了LN的非线性表达能力,并提出了分组层标准化技术(LN-G)来进一步加强LN的非线性以便于实际应用。实验结果表明,使用线性层和LN-G构成的神经网络能够取得较高的准确率,证明了LN的非线性表达能力和实用性。
⏩全球首个神经连接机械腿,截肢者恢复自然行走,还带空间感
这篇文章介绍了麻省理工学院(MIT)的研究成果,他们开发出了全球首个神经连接机械腿,可以帮助截肢者恢复自然行走能力,并且能够感受到空间位置。研究人员通过手术将非侵入性表面电极连接到机器人假肢小腿上,实现了神经信号控制机械腿的运动。相关论文已发表于《自然医学》杂志。该研究的创新之处在于通过兴奋剂-拮抗剂肌神经接口(AMI)实现了截肢肢体的神经反馈,使截肢者能够以正常步态行走,并且能够适应不同地形和避开障碍物。这项研究具有重要的临床应用前景,对于改善截肢者的生活质量具有重要意义。
⏩73年前,香农已经给大模型发展埋下一颗种子
该文章描述了普林斯顿大学教授承现峻提出的观点,即大语言模型(LLM)的种子可以追溯到克劳德·香农在1951年提出的预测下一个单词的问题。文章详细介绍了香农在他的论文中探讨的语言熵和冗余度的概念,并提出了计算英语熵的两种方法。这篇文章对于了解大语言模型的起源和发展具有重要意义。
⏩免费!国产大模型编程助手豆包MarsCode重磅上线,还有登录即用的云端IDE
豆包MarsCode是一款国产AI编程助手,具备代码补全、代码生成、代码解释、代码注释生成、单测生成、缺陷修复、AI问答等多项能力。它能够提高程序员的工作和学习效率,通过阅读和分析代码,快速生成代码片段,并能解释项目代码。豆包MarsCode还可以作为学习伙伴,提供高效的陪伴和支持,帮助开发者解决各种问题。
⏩重磅发布|科学前沿主论坛嘉宾阵容公布
2024年7月4日,上海世博中心将举办WAIC 2024科学前沿主论坛,主题为“可信AI,善治共享”。本次论坛由世界人工智能大会组委会主办,涉及智绘蓝图和智联未来两大议题,旨在探讨前沿智慧和未来趋势。会议将发布多项成果,嘉宾阵容强大。
⏩重磅发布|WAIC 2024最新活动日程安排完整发布!
2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)将于7月在上海世博中心、世博展览馆举行,论坛时间7月4日-6日,展览时间7月4日-7日。今年会议论坛将涵盖AI伦理治理、大模型、具身智能、投融资、教育人才等重点话题,全面体现AI向善、国际合作、共治共享的价值导向。9位图灵奖、菲尔兹奖、诺贝尔奖得主和88位国内外院士确认参会,共200余位重磅嘉宾将与会发表演讲。WAIC 2024完整论坛日程安排正式公布!欢迎阅览~
⏩AI成像新时代,视野扩大271倍,上海理工大学开发超快卷积光学神经网络
上海理工大学团队成功将CNN概念引入光学领域,开发了一种超快卷积光学神经网络(ONN),实现对散射介质后方物体的高效清晰成像。该神经网络利用强散射过程直接提取特征,实现无记忆图像重建,视野扩大271倍,计算速度达到每秒1.57千万亿次运算。该研究为光学成像技术开辟了新途径,对AI成像技术具有重大助力。
⏩整合多组学数据,华大基因团队图神经网络模型SpatialGlue登Nature子刊
华大基因团队提出了一种具有双注意力机制的图神经网络模型SpatialGlue,能够以空间感知的方式整合多组学数据。该模型能够捕获更多的解剖细节,更准确地解析空间域,例如大脑皮层。研究还证明了该方法在识别细胞类型方面的有效性。该研究发表在《Nature Methods》上,凸显了多模态空间组学在分析生物复杂性方面的能力。
⏩人机融合即将成真!纳米机器人杀死癌细胞,肿瘤生长抑制70%|Nature子刊
瑞典卡罗林斯卡学院的研究团队开发了一种DNA纳米机器人设备,可以在肿瘤微环境中激活,有效减少肿瘤生长70%。这项研究展示了纳米技术在癌症治疗中的潜力,并为未来的人类癌症治疗带来了希望。研究团队使用DNA折纸技术制造了纳米机器人,可以精确瞄准癌细胞并杀死它们,同时保留健康组织。这种技术有望成为比传统化疗和放疗更有效、危害更小的癌症治疗方法。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/6798930b-5615-4ee3-a7d5-fc4cdb04c1f9
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。