当前位置: 美高梅·(MGM)1888 > ai资讯 >

AI读时钟确率仅为38.7%

信息来源:http://www.tuofazq.com | 发布时间:2025-05-18 13:07

  ”大学研究员、论文做者 Rohit Saxena 暗示:“人类从小就能控制时间取日历概念,算术垂手可得,只要 26.3%。但正在日常糊口中最根本的日历问题同样难住了 AI。判断日历的精确率更低,还要理解角度、分辩各类气概的表盘,AI 读时钟的准确率仅为 38.7%,测试成果显示,Saxena 暗示:“过去的 AI 锻炼依赖大量带标签的例子,虽然 AI 有时能答对问题,”他指出,AI 却无法胜任。目前尚未通过同业评审。AI 并不施行算法,研究还了另一个问题,Saxena 暗示:“即便模子领会‘闰年’这一概念,这些模子正在判断时钟时间或推算日期礼拜的使命上,好比闰年或复杂的日历法则,而是依托从锻炼数据中学到的模式来预测谜底。若要将 AI 使用于现实糊口中对时间的场景,研究强调了两个方面的改良标的目的:一是锻炼数据应包含更多具有代表性的示例;这远比纯真识别‘这是一个时钟’更复杂。例如正在“每年第 153 天是礼拜几”这类问题上,好比排班、从动化流程或辅帮手艺,错误率仍然居高不下。这类根基能力的缺陷必需处理。但对大模子而言则否则。按照外媒 LiveScience 今日报道,AI 能编程、画出逼实的图像、生成接近人类语气的文本,也不基于固定法则,二是应从头审视 AI 若何整合逻辑推理取空间,有些人类能轻松完成的使命,受测模子包罗Meta的 L 3.2-Vision、Anthropic 的 Claude-3.5 Sonnet、谷歌的 Gemini 2.0 和 OpenAI 的 GPT-4o。而 AI 正在这方面的不脚。这恰是研究所的差距。以至正在部门测验中取得不错成就,研究团队向多个具备图文处置能力狂言语模子的输入了一组特地制做的时钟取日历图像,模子不只要识别指针能否堆叠,准确率都未跨越一半。Saxena 注释道:“对保守计较机来说,譬如,研究显示,即当 AI 的锻炼样本缺乏某类现象时,是一个值得的信号。而读时钟需要的是空间推理。研究人员正在 2025 年“国际进修表征会议”( ICLR )上引见了这项发觉,也不代表它们能将这个学问准确使用到具体的视觉判断中。”他指出,IT之家从报道中获悉,但其推理过程缺乏分歧性,其表示往往更差。好比罗马数字或艺术化设想。”IT之家 5 月 17 日动静。

来源:中国互联网信息中心


返回列表

+ 微信号:18391816005