AI日报【AI资讯】8月15日OpenAI投资的代码工具Cursor默认切换至Claude-3.5-Sonnet,吸引程序员转向,尽管价格是GitHub Copilot的两倍。Claude推出API长文本缓存功能,显著降低处理成本。特斯拉FSD V12借助强大算力和数据提升性能,但在中国市场面临挑战。Apple Intelligence存在严重的安全漏洞,可能导致数据泄露,专家提醒需谨慎处理用户输入以避免安全问题。
AI日报【AI资讯】8月14日文章报道了几项AI领域的重要发展,包括即将上线的超级计算机将加速AGI训练,开源多模态大语言模型VITA的发布,谷歌推出的Gemini Live和新一代Pixel硬件,以及MultiOn公司发布的智能体Agent Q,其成功率显著提升。各项技术展示了AI在多模态交互和复杂决策中的潜力。
AI日报【AI资讯】8月13日文章介绍了三项重要的AI进展:T-MAC是一种基于查找表的方法,能够在CPU上高效执行低比特大型语言模型(LLMs),其推理速度超过专用加速器;Sakana AI推出的AI Scientist是首个全自动科学发现AI系统,能够独立进行研究和撰写论文;基于GPT-4o的AI工程师Genie正在内测,模拟人类工程师的认知过程,并在软件开发中展现出良好的应用潜力。
AI日报【AI资讯】8月12日红杉资本认为ChatGPT将成为新的Excel,催生3000亿美元市场。OpenAI的“草莓”项目引发关注,Perplexity AI正努力提高其搜索引擎的可靠性。南洋理工大学提出的结构扩散模型能够生成高质量的三维数字人。直接混合键合技术在半导体制造中实现芯片堆叠,提升功能和性能,预计市场规模将翻倍,但仍面临挑战。
AI日报【AI资讯】8月11日8月11日的AI资讯中提到,红杉资本分析师认为ChatGPT将成为新的Excel,推动3000亿美元市场。Meta提出了一种新的模态感知型专家混合架构,优化混合模态模型能力。ACL 2024的研究探讨了多模态思维链推理的进展与挑战。苹果研究人员推出了SlowFast-LLaVA视频模型,通过不同观察速度提高视频理解能力,显著超越现有方法。
AI日报【AI资讯】8月10日8月10日的AI资讯包括:一款新发布的AI换脸软件能够实时将单张照片换脸,引发伦理和安全风险的讨论;波士顿动力的Atlas机器人展示了其新能力,能够连续做8个俯卧撑;Meta提出了模态感知型混合专家架构,显著提升了模型训练效率和性能。
AI日报【AI资讯】8月9日OpenAI发布了基于GPT-4o的大规模安全评估,尽管未推出GPT-5,且其处理能力涵盖文本、音频、图像和视频。腾讯在MSU世界视频编码器大赛中表现出色,包揽所有指标第一名。阿里通义团队开源了先进的数学模型Qwen2-Math,表现优于其他模型。DeepMind的乒乓球机器人已达到业余选手水平,特别在与初学者的对战中表现突出。
AI日报【AI资讯】8月8日文章讨论了OpenAI的新匿名聊天机器人模型及其在逻辑推理中的表现,介绍了吴恩达推出的适合初学者的Python编程课程,以及字节跳动和香港大学合作开发的高效大模型Checkpointing系统ByteCheckpoint,最后提到字节版Sora的上线,用户可免费试用生成视频和图片的功能。
AI日报【AI资讯】8月7日8月7日的AI资讯包括Figure AI发布的新一代人形机器人Figure 02,具备实时对话和自主学习能力;SpatialBot空间大模型的介绍,强调对深度信息的理解;GPT-4o新版本上线,性能提升且成本降低;以及苹果AI后台提示词的曝光,旨在减少幻觉和编造事实的风险。
AI日报【AI资讯】8月6日8月6日的AI资讯包括智谱AI开源的视频生成模型Sora,支持在单张4090显卡上生成720p视频;MiniCPM-V 2.6发布,具备强大的多图理解能力;阿里国际推出专业版AI Search,旨在优化全球采购流程;AI芯片独角兽Groq融资6.4亿美元,估值达28亿美元,并聘请Yann LeCun担任技术顾问。
AI日报【AI资讯】8月5日华为诺亚实验室提出了一种可将模型压缩70倍的技术,降低存储开销。英伟达因产能不足推迟B200芯片的发布,并推出阉割版B200A。OpenAI正在开发一款99.9%准确率的反作弊工具以识别ChatGPT生成的内容,但尚未上线。Meta计划在2025年发布Llama 4,训练将使用24万块GPU,成本高昂但扎克伯格仍坚持投资AI。
AI日报【AI资讯】8月4日8月4日的AI资讯包括:GitHub推出新功能「GitHub Models」,允许开发者直接访问顶级大模型以构建AI应用;马斯克宣布特斯拉自研超算Dojo,预计达到100 exaflops计算能力;Perceptive公司开发的AI机器人成功执行世界首例牙科手术,速度是人类医生的8倍;研究者提出JRT提示策略以提升循环语言模型性能;阿里发布「轨迹可控版Sora」视频生成模型,生成高质量符合物理规律的视频。