研究发现大多数AI模型看不懂时钟及日历 * 阿波罗新闻网
新闻 > 科教 > 正文
研究发现大多数AI模型看不懂时钟及日历

英国爱丁堡大学的研究显示,大多数AI模型看不懂时钟和日历。图为一个闹钟。

近年来,人工智能(AI)被广泛应用在多种领域,替人类解决了不少问题,但这种炙手可热的技术并非万能。最近就有研究发现,AI尚未掌握人们能轻易完成的一些技能。比如说,大多数AI模型看不懂人们熟悉的时钟和日历。

英国爱丁堡大学(University of Edinburgh)在新闻稿中指出,该校的研究团队表示,最先进的AI模型无法可靠地解释时钟指针的位置或正确回答有关日历上日期的问题。

该团队说,有别于简单地识别形状,看懂时钟和日历需要结合空间意识(spatial awareness)、背景和基础数学——这对AI来说仍具有挑战性。

该团队测试了处理文字和图像的AI系统——称为多模态大型语言模型(Multimodal Large Language Model)——是否可以经由查看时钟或日历的图片来回答与时间相关的问题。

他们测试了各种时钟设计,包括带有罗马数字的时钟、带有和不带有秒针的时钟以及具有不同颜色的表盘的时钟。

结果发现,AI系统准确判断时钟指针位置的次数不到四分之一。当时钟上有罗马数字或格式化的指针时,错误更容易发生。

该团队说,当时钟的秒针被移除时,AI系统的表现也没有任何改善,这意味着这些系统对于秒针的检测和角度的解读存在着根深蒂固的问题。

而在日历方面,研究人员要求AI模型回答一系列与日历有关的问题,例如识别假期以及计算过去和未来的日期。

他们发现,即使是表现最好的AI模型,也有五分之一的次数会出现日期计算错误。比如说,当被问到“今年的第153天是哪一天?”时,AI模型的错误率就挺高的。

这项研究的主要报告撰写人、该校研究人员萨克塞纳(Rohit Saxena)说:“大多数人从小就能分辨时间和使用日历。我们的研究结果凸显了AI在执行人类基本技能方面所存在的巨大差距。”

该校另一名研究人员杰玛(Aryo Gema)说:“当今的AI研究经常强调复杂的推理任务,但讽刺的是,许多系统仍难以执行比较简单的日常任务。”

萨克塞纳还表示,如果人们想把AI成功地融入现实世界中对时间很敏感的应用领域(例如排程和自动化)的话,这些问题就必须解决。

上述研究成果发表在线上预印本资料库arXiv上。研究人员也在4月28日举行的国际表征学习大会(International Conference on Learning Representations)上发表了该研究的论文。

责任编辑: 李华  来源:..;记者陈俊村 转载请注明作者、出处並保持完整。

本文网址:https://d3icyu3vmjgcad.cloudfront.net/2025/0520/2221591.html