slug
summary
tags
icon
password
刚刚,DeepSeek扔出大杀器,梁文锋署名!暴力优化AI架构
DeepSeek发布了梁文锋署名的新论文,提出了名为mHC(流形约束超连接)的新架构,在27B参数模型上仅增加约6.7%的训练时间开销,显著提升性能。该架构通过将矩阵投影到约束流形上优化残差连接,确保稳定性并扩大残差流通道宽度,可能会取代传统的ResNet结构。实验结果表明,mHC在大规模预训练中表现优越,提升了模型的推理能力和训练稳定性。
老黄超200亿美元的推理闭环成型了
老黄在短短7天内以超过200亿美元收购Groq和AI21 Labs,形成了'硬件-网络-架构'的闭环。Groq的团队和技术,尤其是LPU,增强了英伟达在推理市场的竞争力。AI21 Labs的博士团队和Jamba架构将进一步提升推理效率,帮助英伟达对抗谷歌和博通的威胁。这一系列收购不仅是技术整合,更是对市场竞争的战略布局。
Sam Altman 的脑机接口公司刚建立,国内已经有了对标公司
Sam Altman联合创立的脑机接口公司Merge Labs正在采用超声波技术,旨在实现全脑信号的读写能力。与Neuralink不同,Merge Labs不需要在大脑中植入电极。与此同时,中国的格式塔科技有限公司也成立,计划利用超声波技术进行脑机接口研究,关注慢性疼痛、中风和精神疾病等适应症。超声波脑机接口的优势在于其无损调控能力,有望推动脑科学与AI的结合,促进人机融合的未来发展。
刷屏全网!摩尔线程天使投资人,对当前AI的40个观察
摩尔线程的天使投资人王捷总结了当前AI的40个观察,探讨AI经济的未来发展和影响,包括Scaling Law的收敛、AI在各行业的扩散、AI工作能力的评测体系、数字层的构建及其对经济活动的影响等。他强调,AI将推动经济结构的变化,可能导致非稀缺经济的出现,并提出了关于AI如何影响就业、国际分工及社会财富再分配的深刻问题。
OpenDataArena全面升级版正式上线,四大核心模块重构数据价值评估新格局
OpenDataArena全面升级,推出四大核心模块以重构数据价值评估。新版本包括数据价值排行榜、数据血缘探索器、多维数据评分器和全开源评测工具箱,旨在通过真实训练检验数据价值。研究发现解答质量比问题复杂度更关键,代码数据需建立针对性评估体系,且开源数据同质化严重。未来将持续探索数据在智能体、金融和医疗等领域的深层价值。
系统学习Deep Research,这一篇综述就够了
Deep Research(DR)是从信息获取到完整科研流程的能力演进,分为三个阶段:主动搜索、多源整合和完整科研闭环。其核心组件包括查询规划、信息获取、记忆管理和答案生成。训练与优化方法包括提示工程、监督微调和强化学习。面临的挑战包括内部与外部知识的协同、训练算法的稳定性、评估方法的构建和记忆模块的构建。DR代表了智能体能力和应用边界的转变,未来仍需探索如何构建自主且可信的智能体。
大橘子的 ListenHub 刚结束了新一轮融资
大橘子的ListenHub完成了200万美元融资,年收入突破300万美元,且无推广预算。产品从AI播客工具发展到内容生成,用户增长迅速,商业化推进显著。新一轮融资在AI播客热度减退时进行,展现出团队的韧性和市场潜力。
上一篇
AI资讯-01月03日
下一篇
英伟达拟30亿美元收购AI21 Labs;Kimi完成5亿美元融资现金超100亿;腾讯混元1.5开源端侧翻译模型;无问芯穹FUSCO突破MoE通信瓶颈;DeepMind揭秘Scaling Law未死 | 01月01日AI资讯
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/2dc629a6-152d-818c-be71-de1fdb859cf0
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。