slug
summary
tags
icon
password
⏩哪里不会扫哪里!全球最强数学大模型发布人人可玩Demo,阿里多模态模型加持,中文适用
阿里发布了Qwen2-Math数学大模型的Demo,用户可以通过截图或扫描上传数学题目进行解答。该模型具备强大的数学推理能力,能够处理多种数学问题,并且支持中文提问。尽管目前主要针对英文场景,未来将推出中英双语版本。Qwen2-Math在数学大模型中表现优异,准确率达到84%,超越了多个竞争对手。
⏩浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余
该文章介绍了浙江大学李玺团队提出的一种新方法ScanFormer,用于指代表达理解任务。该方法通过迭代感知框架,在图像金字塔中逐层扫描,从粗尺度图像开始,逐步过滤掉与指代表达无关的区域,使模型更关注任务相关区域。文章提出的方法在视觉语言任务中具有较高的实用性和创新性,可以提高指代表达理解任务的精度。该研究由浙江大学李玺教授团队进行,发表在机器之心上。
⏩特斯拉聘请「动捕师」训练人形机器人Optimus,时薪最高48美元
特斯拉正在招募人员穿上动作捕捉服来模仿预期动作,以获得所需的大量机器人训练数据。该职位的时薪最高可达48美元,还有现金、股票奖励和其他福利。特斯拉的人形机器人Optimus需要大量的训练数据才能为其在特斯拉工厂工作做好准备,这造成了非常高的成本。特斯拉计划在明年小批量生产人形机器人,并在2026年进行大批量出货。
⏩哈萨比斯:谷歌想创造第二个Transformer,还想把AlphaGo和Gemini强强联合
谷歌DeepMind首席执行官Demis Hassabis透露了公司的规划和对当前AI领域的看法。他认为AI在短期内被过度炒作,但在长期来看被低估。他提到AI领域需要更好的基准测试,特别是在多模态理解、长期记忆和推理能力等方面。谷歌计划结合游戏智能体和大语言模型的专业知识,开发具备更强智能体行为的系统。此外,他还谈到了开源模型的问题和AI在数学问题上的潜力。
- 作者:AI学长小林
- 链接:https://ai.linbintalk.com/article/c20d306f-e533-4d35-80df-5a105487e2ab
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。