slug
summary
tags
icon
password
发布 ChatGPT 健康 6 天后,OpenAI 在自家医疗健康 Benchmark 上被反超
百川智能的M3模型在医疗健康领域评估测试集HealthBench中超越OpenAI的GPT-5.2 High,获得全球第一,标志着AI在医疗问诊能力上的重大进展。M3模型采用了事实感知强化学习技术,显著降低了幻觉率,并在问诊准确度上超过了人类医生。百川智能计划推出C端医疗产品,致力于提供高质量的医疗服务,并希望通过AI技术解决医疗供给不足的问题,逐步建立患者与AI之间的信任。
比iPhone更疯狂!乔布斯去世15年后,「最像他的人」操刀首款AI硬件
Jony Ive在离开苹果七年后与OpenAI合作推出首款AI硬件「Sweetpea」,旨在取代iPhone,强调音频优先和用户的平静体验。该设备采用2nm顶级芯片,预计首年销量达4000万到5000万台,挑战AirPods的市场地位。Ive的设计哲学回归到让技术隐身的理念,试图解决智能手机带来的焦虑问题。
谷歌Agent杀入电商赛道:AI直接帮忙比价下单,马斯克:有意思
谷歌推出了全新的电商解决方案,利用AI技术简化购物流程,包括UCP协议和Gemini CX,支持从商品发现到售后服务的全链条。用户可以通过AI直接下单,享受自动比价和优惠券领取的便利。国内电商平台如阿里巴巴和京东也在积极应用生成式AI,提升购物体验和商家服务。整体来看,AI正深刻改变电商行业的运作模式。
闷声赚钱的 RL 生意:每个任务,200-20000 美元
强化学习(RL)环境的市场正在快速增长,关键在于创建高质量的环境、任务和评分器。RL训练的成本高,任务费用在200到20000美元之间,且独占权影响定价。当前,企业工作流任务需求上升,尤其是在数学和编程领域。防止奖励黑客和任务难度校准是质量控制的重点,构建环境需要工程技能和领域知识。整体来看,RL环境已成为前沿AI训练的重要组成部分,未来发展潜力巨大。
AI4S又一瓶颈被攻克:两个AI「吵架」,让科研代码部署成功率突破95%
AI4S通过Deploy-Master工具解决科学软件的部署瓶颈,成功率超过95%。该工具通过双模型辩论机制优化构建过程,系统性地发现和验证科学工具,确保其可执行性,从而提升科学研究的可复现性和效率。团队观察到,失败主要集中在构建流程错误上,强调了建立统一执行基础设施的重要性,以支持Agentic Science的发展。
分化、新范式、Agent 与全球 AI 竞赛,中国模型主力选手们的 2026 预测
AGI-Next 2026 会议汇聚了中国大模型的核心人物,强调模型分化趋势与自主学习的新范式。To B 和 To C 市场的需求差异导致模型性能的分化,强模型在企业中更受青睐。未来的智能效率将关注资源投入与智能增量的关系。中国在全球 AI 竞赛中展现出强劲潜力,但仍需克服算力和市场成熟度的挑战,以实现更高效的创新和竞争力。
OpenAI 1亿美金收购 Torch:全公司只有 4 个人
OpenAI以约1亿美元收购了医疗数据整合应用Torch,团队只有4名员工。此次收购旨在增强OpenAI在医疗数据整合方面的能力,特别是在处理不同来源和格式的数据冲突。Torch的创始团队曾在Forward工作,积累了丰富的医疗数据整合经验。收购不仅是为了产品,更是为了团队的人才,以应对日益激烈的医疗AI竞争。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com//article/2e8629a6-152d-813e-8a2d-f5df58cb887d
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。