AI日报
【AI资讯】2月18日
00 分钟
2025-2-18
2025-2-18
slug
summary
tags
icon
password

⏩刚刚,Ilya被曝正筹资超10亿美元、估值超300亿美元,知名创投Greenoaks牵头

Ilya Sutskever及其创业公司Safe SuperIntelligence(SSI)正在筹集超过10亿美元的资金,估值将超过300亿美元。该公司成立于2022年,致力于开发安全人工智能,吸引了投资者的关注。Greenoaks Capital Partners牵头此次融资,计划投资5亿美元。Sutskever因其在生成式AI领域的贡献而备受瞩目,他的团队正在探索新的研究方向。SSI的目标是开发与人类利益对齐的超越人类的安全AI,尽管目前尚无具体研究成果或产品。该公司的融资情况和未来发展引发了广泛的讨论与关注。
 

⏩国内首个短剧创作大模型开源了,一个人就能拍短剧,单卡80秒出大片

这篇文章介绍了昆仑万维开源的短剧创作大模型SkyReels-V1和表情动作可控算法SkyReels-A1,标志着国内在AI视频生成领域的重要进展。SkyReels-V1旨在解决传统短剧制作中的复杂流程和高成本问题,支持用户以更低的成本进行短剧创作。文章详细描述了模型的技术特点,包括对人物微表情和肢体动作的精准控制,能够生成高质量的影视级视频。SkyReels-V1不仅支持文生视频,还支持图生视频,展示了其在开源视频生成模型中的领先地位。该模型的推出为AI短剧创作提供了新的可能性,具有广阔的商业前景。
 

⏩20万张GPU!马斯克掏出「地表最强」大模型Grok-3,排行榜登顶,复仇OpenAI

马斯克的xAI发布了新一代大模型Grok-3,标志着AI领域的一次重大进展。Grok-3在性能上超越了多款竞争对手,包括OpenAI的模型,成为首个在Chatbot Arena中得分超过1400的模型。该模型的训练依赖于一个包含20万块GPU的数据中心,展现出强大的计算能力。Grok-3不仅在数学、科学和编码等领域表现优异,还具备推理能力,能够进行复杂问题的解决。其用户界面支持展示思考过程,提供更深度的思考模式,显示出其在AI创新和应用方面的潜力。这一发布无疑将对AI行业产生深远影响。
 

⏩微软开放3.1T token高质量数据!通用/代码/数学/问答,全领域超越开源

本文介绍了微软推出的RedStone数据处理管道,旨在从Common Crawl中提取高质量的领域特定数据集,包括RedStone-Web、RedStone-Code、RedStone-Math和RedStone-QA。RedStone通过优化数据处理流程,显著提升了模型性能,尤其是在大型语言模型的训练中,提供了3.1T token的高质量预训练数据。文章强调了高质量数据的定义,认为知识性和文本流畅性是关键指标。RedStone的多层过滤系统有效地从网络中挖掘出有价值的数据,支持构建其他类型的专有数据,且开源了相关代码,促进了社区的复现和应用。
 

⏩刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

DeepSeek发布了一篇新论文,提出了一种名为NSA的注意力机制,旨在解决长上下文建模中的计算效率问题。NSA是一种本地可训练的稀疏注意力机制,能够在硬件上优化性能,适用于大型语言模型的训练和推理。研究表明,NSA在处理长序列时,能够显著减少计算开销,同时保持与传统全注意力机制相当或更优的性能。该机制通过分层token建模和硬件对齐的设计,提升了训练和推理的效率。实验结果显示,NSA在多个评估任务中表现出色,验证了其在实际应用中的有效性。这一研究为AI领域的长上下文处理提供了新的思路和方法。
 
上一篇
一招解锁Deepseek API联网功能,让R1自带搜索,任意平台可用!
下一篇
【AI资讯】2月17日