DeepMind在处理数常识题方面达到里程碑——东谈主工智能的下一个紧要挑战

发布日期：2024-09-30 20:58 点击次数：201

2024年7月25日 DeepMind在处理数常识题方面达到里程碑——东谈主工智能的下一个紧要挑战 AlphaProof在本年的数学奥林匹克(Mathematical Olympiad)问题上展示了我方的实力——在用东谈主工智能创建本质性解释的竞赛中迈出了一步。大卫·卡斯特尔韦奇

图片

主题为“2016年第五十七届海外数学奥林匹克”的邮票袖珍张特写海外数学奥林匹克中的问题来自几个数学限制。鸣谢:David Wong/南华早报via Getty 谷歌DeepMind在从围棋游戏到政策棋盘游戏的所有这个词限制齐打败了东谈主类，刻下它暗意，它行将在处理数常识题方面打败宇宙顶级学生。这家总部位于伦敦的机器学习公司于7月25日晓谕，其东谈主工智能(AI)系统仍是处理了本月在英国巴斯举行的2024年海外数学奥林匹克(IMO)上向学校学生提议的六个问题中的四个。东谈主工智能产生了严格的、一步一步的解释，由两名顶级数学家标志，并获取了28/42的分数——离金牌范畴仅差一分。 “这昭着是一个特地紧要的最初，”英国剑桥的数学家约瑟夫·迈尔斯说，他与菲尔兹奖获取者蒂姆·高尔斯通盘审查了这些处理决议，并匡助弃取了本年IMO的原始问题。 DeepMind和其他公司正在进行一场竞赛，最终让机器给出解释，处理数学中的本质性参谋查题。该公司暗意，在海外数学家大会(IMO)上建立的问题——宇宙上最迫切的年青数学家竞赛——仍是成为达成这一盘算的进展基准，并被视为机器学习的“紧要挑战”。 “这是第一次任何东谈主工智能系统大略达成奖牌级别的性能”，DeepMind负责科学的东谈主工智能副总裁Pushmeet Kohli在向记者发布的一份简报中说。“这是构建高等定判辨释器的旅程中的一个关节里程碑，”Kohli说。分支就在几个月前的一月份，DeepMind系统AlphaGeometry在处理一种类型的IMO问题(欧几里德几何中的问题)时，仍是达到了奖章获取者级别的性能。第一个在举座测试中发达出金牌水平的东谈主工智能——包括代数、组合学和数论等频频被以为比几何更具挑战性的问题——将有阅历获取500万好意思元的奖励，称为东谈主工智能数学奥林匹克(AIMO)奖。(该奖项有严格的次第，如开源代码和有限的策动智商，这意味着DeepMind刻下的戮力不合适条目。) 在他们最近的戮力中，参谋东谈主员使用AlphaGeometry2在20秒内处理了几何问题；DeepMind策动机科学家Thang Luong暗意，东谈主工智能是他们创记录系统的矫正和更快版块。关于其他类型的问题，该团队设备了一个全新的系统，名为AlphaProof。AlphaProof处理了竞赛的两个代数问题，外加一个数论问题，花了三天期间。(试验IMO的参与者有两次会议，每次4.5小时。)它无法处理数学的另一个限制组合学中的两个问题。

图片

又名罗马尼亚选手在第63届海外数学奥林匹克竞赛中获取金牌的特写镜头。数学奥林匹克是宇宙上学龄数学天才的首要竞赛。信用:MoiraM/Alamy当试图用话语模子修起数常识题时，参谋东谈主员获取了休戚各半的成果——这种类型的系统为ChatGPT等聊天机器东谈主提供了能源。无意，模子给出了正确的谜底，但不行合理地解释他们的推理，无意他们吐出谣言。就在上周，来自软件公司Numina和HuggingFace的一组参谋东谈主员使用一种话语模子赢得了AIMO中级“最初奖”，该奖基于IMO问题的简化版块。这些公司将他们的所有这个词系统开源，供其他参谋东谈主员下载。然则获奖者告诉《当然》杂志，要处理更难的问题，单靠话语模子可能还不够。 a级求解器 AlphaProof将话语模子与强化学习技艺相聚首，使用该公司已到手用于抨击围棋等游戏以及一些特定数常识题的“AlphaZero”引擎。在强化学习中，神经汇聚通过反复老到来学习。当它的谜底不错用一些客不雅的度量次第来评估时，这种时势很有用。出于这个方针，AlphaProof被老师用一种叫作念Lean的厚爱话语读写解释，这种话语被用在数学家流行的同名软件包“解释助手”中。为此，AlphaProof通过在精益包中运行它们来测试其输出是否正确，这有助于填充代码中的一些设施。老师任何话语模子齐需要大齐的数据，然则在精益中险些莫得可用的数学解释。DeepMind机器学习参谋东谈主员托马斯·休伯特(Thomas Hubert)说，为了克服这个问题，该团队想象了一个特地的汇聚，试图将现存的用当然话语写的100万个问题的记录翻译成精益，但不包括东谈主类写的处理决议，他是AlphaProof的设备负责东谈主之一。“咱们的时势是，咱们能学会解释吗，即使咱们最初莫得老师东谈主类书写的解释？”(该公司对围棋选拔了访佛的时势，其东谈主工智能通过与我方对弈来学习棋战，而不是像东谈主类那样。) 魔法钥匙很多精益翻译齐是意外旨的，但迷漫好了，足以让AlphaProof启动它的强化学习周期。高尔斯在新闻发布会上说，成果比预期好得多。“IMO中的很多问题齐有这种神奇的特色。巴黎法兰西学院的高尔斯说:“这个问题来源看起来很难，直到你找到一把神奇的钥匙来解开它。在某些情况下，AlphaProof似乎大略提供特地的创造性飞跃，在无穷大的可能性范畴内提供正确的一步。高尔斯补充说，然则还需要进一步的分析来笃定谜底是否莫得看起来那么令东谈主骇怪。在DeepMind的AlphaGo机器东谈主在2016年打败宇宙顶级东谈主类围棋选手的著名比赛中选拔了令东谈主骇怪的“37步棋”之后，访佛的辩白随之而来——这是东谈主工智能的分水岭。迈尔斯在新闻发布会上说，这些技艺是否能完善到在数学限制作念参谋水平的责任还有待不雅察。“它能延长到其他种类的数学吗？在这些数学中，可能莫得一百万个问题需要老师。” DeepMind策动机科学家大卫·西尔弗(David Silver)说，“咱们刻下不错解释，他们不是公开的参谋查题，而是至少对宇宙上最优秀的年青数学家来说特地具有挑战性的问题，”他在2010年代中期是设备AlphaGo的主要参谋东谈主员。doi::https://doi.org/10.1038/d41586-024-02441-2

本站仅提供存储功绩，所有这个词内容均由用户发布，如发现存害或侵权内容，请点击举报。

DeepMind在处理数常识题方面达到里程碑——东谈主工智能的下一个紧要挑战

热点资讯

相关资讯