发布于: 2024-8-20最后更新: 2024-8-20字数 00 分钟

slug
summary
tags
icon
password

哪里不会扫哪里!全球最强数学大模型发布人人可玩Demo,阿里多模态模型加持,中文适用

阿里发布了Qwen2-Math数学大模型的Demo,用户可以通过截图或扫描上传数学题目进行解答。该模型具备强大的数学推理能力,能够处理多种数学问题,并且支持中文提问。尽管目前主要针对英文场景,未来将推出中英双语版本。Qwen2-Math在数学大模型中表现优异,准确率达到84%,超越了多个竞争对手。
 

⏩浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

该文章介绍了浙江大学李玺团队提出的一种新方法ScanFormer,用于指代表达理解任务。该方法通过迭代感知框架,在图像金字塔中逐层扫描,从粗尺度图像开始,逐步过滤掉与指代表达无关的区域,使模型更关注任务相关区域。文章提出的方法在视觉语言任务中具有较高的实用性和创新性,可以提高指代表达理解任务的精度。该研究由浙江大学李玺教授团队进行,发表在机器之心上。
 

⏩特斯拉聘请「动捕师」训练人形机器人Optimus,时薪最高48美元

特斯拉正在招募人员穿上动作捕捉服来模仿预期动作,以获得所需的大量机器人训练数据。该职位的时薪最高可达48美元,还有现金、股票奖励和其他福利。特斯拉的人形机器人Optimus需要大量的训练数据才能为其在特斯拉工厂工作做好准备,这造成了非常高的成本。特斯拉计划在明年小批量生产人形机器人,并在2026年进行大批量出货。
 

⏩哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合

谷歌DeepMind首席执行官Demis Hassabis透露了公司的规划和对当前AI领域的看法。他认为AI在短期内被过度炒作,但在长期来看被低估。他提到AI领域需要更好的基准测试,特别是在多模态理解、长期记忆和推理能力等方面。谷歌计划结合游戏智能体和大语言模型的专业知识,开发具备更强智能体行为的系统。此外,他还谈到了开源模型的问题和AI在数学问题上的潜力。

Loading...
【AI资讯】8月21日

【AI资讯】8月21日

8月21日的AI资讯包括:英伟达投资的Luma AI推出Dream Machine 1.5版本,专注文生视频,用户反响积极;英伟达的LongVILA全栈解决方案在长视频处理上实现99.5%准确率;腾讯混元大模型负责人王迪分享了万亿MoE大模型的研发历程;微软发布三款小语言模型,表现超越多款大型模型,适用于内存受限设备。

【AI资讯】8月19日

【AI资讯】8月19日

8月19日的AI资讯包括:1) 抱抱脸团队推出可在浏览器中运行的小模型,强调真实数据的重要性;2) Astribot S1是一款多功能AI机器人,计划于2024年商业化;3) 国内首个UI大模型Motiff在设计领域表现出色,能优化UI设计工作流;4) 昆仑万维发布AI短剧平台SkyReels,简化短剧制作;5) DeepMind创始人预测十年内实现AGI,将影响医疗、能源和气候等领域。