【AI资讯】12月22日 | 小林的博客-AI学长

slug

summary

⏩无需Tokenizer，多模态对齐融合还会是难题吗？

新型字节级语言模型架构Byte Latent Transformer（BLT）通过直接建模原始字节流，解决多模态模型训练中的对齐和融合问题，具有显著的潜在价值。当前多模态对齐面临的挑战包括模态特征对齐、计算效率和数据质量等。

🔗：http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650948413&idx=3&sn=04d613ae1432977bf06d5173108ff326&chksm=85231b4220549cef7c107abbf9fb47512baf2da9660dced5e595e3789d51e3c10e483c3de368&scene=0#rd

⏩微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术报告出炉

本文报道了微软最新发布的14B小模型Phi-4，该模型在数学性能上超越了GPT-4o，展示了其在GPQA和MATH基准测试中的卓越表现。Phi-4的训练数据中有40%为合成数据，采用了多种创新技术，如精选原生数据和后训练技术，显著提升了模型的推理能力。研究表明，合成数据不仅提高了模型的训练效率，还有效避免了传统数据集中的一些问题。Phi-4的成功挑战了业界对数据墙的看法，标志着AI领域在模型训练和数据使用上的新突破。该模型将在微软Azure AI Foundry和HuggingFace平台上线，具有广泛的应用前景。

🔗：http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652552588&idx=3&sn=9e75f4c02cebe8fc7289b6ac76ca76bf&chksm=f05c4ac0d1f0706cbc04f063aeb43fdbefe568315d3df253c4c63ffa65d4c4061520e5ce103b&scene=0#rd

⏩自缘身在最高层？OpenAI o1 pro竞赛级评测结果新鲜出炉

本文讨论了OpenAI新发布的o1 pro模型在高难度数学推理测试中的表现，特别是与其他模型的对比。通过AGI-Eval的Math Pro Bench评测，o1 pro在整体正确率和推理时间上均表现优异，正确率达到0.774，显示出其在数学推理能力上的优势。文章还分析了不同题型的难度，指出考研数学题相对简单，适合模型的训练模式。o1 pro在推理效率上也显著优于其他模型，适合实时性要求高的应用场景。整体来看，o1 pro在数学推理领域展现出强大的能力，值得关注。

🔗：https://www.jiqizhixin.com/articles/2024-12-22-2

⏩是时候停止炒作「o3是AGI」了！背后15人安全对齐团队大盘点

本文讨论了OpenAI最新发布的o3系列模型，强调其在推理能力上的显著提升，但同时指出将其称为AGI的炒作是不切实际的。文章引用了多位AI研究者的观点，认为o3虽然在基准测试中表现优异，但仍需改进，且无法在现实世界中验证其能力。o3-mini作为更经济高效的版本，采用了新的安全评估方法，旨在提高模型的安全性和遵循性。文章还盘点了与o3-mini对齐范式相关的研究人员，提供了对AI领域最新进展的深入分析，具有较高的专业性和实用性。

🔗：https://www.jiqizhixin.com/articles/2024-12-22-3

⏩无需Tokenizer，多模态对齐融合还会是难题吗？

⏩微软Phi-4封神，14B小模型数学击败GPT-4o！合成数据占比40%，36页技术报告出炉

⏩自缘身在最高层？OpenAI o1 pro竞赛级评测结果新鲜出炉

⏩是时候停止炒作「o3是AGI」了！背后15人安全对齐团队大盘点

AI学长小林

交流频道

加入我们的社群讨论分享