【AI资讯】8月20日 | 小林的博客-AI学长

slug

summary

⏩哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

阿里发布了Qwen2-Math数学大模型的Demo，用户可以通过截图或扫描上传数学题目进行解答。该模型具备强大的数学推理能力，能够处理多种数学问题，并且支持中文提问。尽管目前主要针对英文场景，未来将推出中英双语版本。Qwen2-Math在数学大模型中表现优异，准确率达到84%，超越了多个竞争对手。

🔗：http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247745007&idx=4&sn=07c25f8f09394b6e4495d2671728fbb4&chksm=e9efc623b1a85d3c0e971bbdb7b4f0468b14d4572a966e17e8e7558326c8ebf635581886e223&scene=0#rd

⏩浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

该文章介绍了浙江大学李玺团队提出的一种新方法ScanFormer，用于指代表达理解任务。该方法通过迭代感知框架，在图像金字塔中逐层扫描，从粗尺度图像开始，逐步过滤掉与指代表达无关的区域，使模型更关注任务相关区域。文章提出的方法在视觉语言任务中具有较高的实用性和创新性，可以提高指代表达理解任务的精度。该研究由浙江大学李玺教授团队进行，发表在机器之心上。

🔗：https://www.jiqizhixin.com/articles/2024-08-20-2

⏩特斯拉聘请「动捕师」训练人形机器人Optimus，时薪最高48美元

特斯拉正在招募人员穿上动作捕捉服来模仿预期动作，以获得所需的大量机器人训练数据。该职位的时薪最高可达48美元，还有现金、股票奖励和其他福利。特斯拉的人形机器人Optimus需要大量的训练数据才能为其在特斯拉工厂工作做好准备，这造成了非常高的成本。特斯拉计划在明年小批量生产人形机器人，并在2026年进行大批量出货。

🔗：https://www.jiqizhixin.com/articles/2024-08-20-3

⏩哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合

谷歌DeepMind首席执行官Demis Hassabis透露了公司的规划和对当前AI领域的看法。他认为AI在短期内被过度炒作，但在长期来看被低估。他提到AI领域需要更好的基准测试，特别是在多模态理解、长期记忆和推理能力等方面。谷歌计划结合游戏智能体和大语言模型的专业知识，开发具备更强智能体行为的系统。此外，他还谈到了开源模型的问题和AI在数学问题上的潜力。

🔗：https://www.jiqizhixin.com/articles/2024-08-20-5

⏩哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

⏩浙大李玺团队：指代表达理解新方法，ScanFormer粗到细迭代消除视觉冗余

⏩特斯拉聘请「动捕师」训练人形机器人Optimus，时薪最高48美元

⏩哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合

AI学长小林

交流频道

加入我们的社群讨论分享