slug
summary
tags
icon
password
豆包专业版实测:2亿人都可以体验能干活的Agent了!
文章对字节跳动豆包专业版进行了详细评测,重点展示了其Agent功能在实际场景中的表现,包括任务自动化、多步骤操作等能力。作为拥有2亿用户基础的AI产品,豆包Agent的落地标志着国产大模型在Agent应用方向上的重大进展。
刚刚,Claude Code大升级!卡帕西:LLM第三次变革
报道了Claude Code的重大版本升级,卡帕西(Karpathy)对此评价为LLM领域的第三次变革。Claude Code作为AI编程工具,此次升级大幅提升了代码生成、理解和调试能力,代表了AI辅助编程领域的最新进展。
Claude惊人真相被教授曝光:思考过程加密,给钱也看不到!
文章揭示Claude模型在推理过程中对其思考链条进行加密处理,即便是付费用户也无法查看内部推理细节。这一发现引发了关于AI透明度和可解释性的广泛讨论,涉及AI伦理与产品设计哲学。
体验完微信Agent以后,我觉得这就是微信有史以来最大的更新。
文章详细评测了微信最新推出的Agent功能,认为这是微信有史以来最大规模的更新。微信Agent将AI能力深度整合到日常通讯和社交场景中,代表了AI应用在超级App中的落地新范式。
端侧跑大模型,现在也太简单了
文章探讨了在端侧设备(手机、IoT设备等)运行大语言模型的最新进展,包括模型压缩、量化、蒸馏等技术的成熟使得端侧部署成为可能,代表了AI基础设施的重要发展趋势。
直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能
介绍了一个原生多模态大模型,能从像素直接生成语言,统一了单图、多图、视频和空间智能等多种输入形式。这是AI研究领域的重要突破,代表了多模态理解的最新前沿方向。
镜头被油污糊住,机器人还稳定操作?北大/清华等给VLA加一道信息筛选,不靠额外数据,效率提升14x,真机鲁棒性反而更高了 | ICML 2026
北大、清华等机构提出了一种新的信息筛选方法,增强了VLA(视觉-语言-动作)模型的鲁棒性,在镜头被遮挡等极端条件下仍能稳定操作。该工作被ICML 2026接收,效率提升达14倍。
不安全指令,一拒了之?TRIAD用三路决策:修复AI智能体的危险计划
文章介绍了TRIAD方法,通过三路决策机制来检测和修复AI智能体可能执行的危险计划,是AI安全领域的前沿研究。该工作为构建更安全的AI Agent系统提供了重要思路。