1. 首页
  2. 相关资讯 > 正文

「皇冠最新网址多少」AI魔方大师:1.2秒解魔方超世界纪录2倍,平均移动28步

 2020-01-10 11:29:32  来源:互联网 

「皇冠最新网址多少」AI魔方大师:1.2秒解魔方超世界纪录2倍,平均移动28步

皇冠最新网址多少,导语:1.2秒是什么概念呢?要知道,目前破解三阶魔方的世界纪录保持者,用时也需3.47秒。

智东西7月16日消息。近日,加州大学欧文分校(university of california,irvine,简称uci)的研究人员研发出了一个名为deepcubea的ai算法,它利用深度强化学习(deep reinforcement learning)的方法,可以在没有任何领域知识或人类游戏指导的情况下快速破解魔方,并且速度是人类极限的两倍。

在人类领域,第10届世界魔方协会(wca)锦标赛于今年7月14日在墨尔本举行,来自德国的菲利普·威尔(philipp weyer)获得冠军,而他的成绩则是在6.74秒内解出3×3×3的魔方。

然而,目前该项世界纪录的保持者是来自中国的杜宇生,他只用了3.47秒就破解了这个难题。

deepcubea人工智能程序的研究成果已于美国时间2019年7月15日发表在《自然机器智能》杂志上,名为《用深度强化学习和搜索破解魔方(solving the rubik’s cube with deep reinforcement learning and search)》。

该论文的第一作者、uci的博士生forest agostinelli表示,deepcubea系统由一个深层神经网络组成,可以在1.2秒内破解魔方,平均移动28步。

在这项研究中,deepcubea算法能够破解100%随机打乱的魔方方块,并在60.3%的游戏时间里计算出最短的目标解决路径,将魔方的六个面都解成同一个颜色。

研究人员表示,该算法还适用于其他组合游戏,如15拼图、24拼图、35拼图、48拼图、lights out和推箱子游戏。

▲lights out游戏

uci的计算机科学教授皮pierre baldi表示,这项研究为人们展示了一个人工智能系统,它可以自动学习如何破解标志性的魔方和其他类似的问题,这些问题的特点是有许多的可能性和非常少的解决方案,并且通过随机移动的方式也几乎无法提供解决方案。

deepcubea是使用强化学习来进行训练的。

在这项研究中,研究人员想要了解人工智能是如何采取行动,以及需要多长时间才能完善自己的方法。

因此,研究人员先用电脑模拟出一个完整的魔方,然后将魔方打乱。deepcubea的任务则是需要尽快地找到最低的“功能成本”来破解方法,其中包括计算成本和移动量。

另一方面,由于魔方有大约43万亿个可能的组合,这使deepcubea随机开始进行训练是不实际的。因此,研究人员选择反向训练,将deepcubea放置于序列中的一个特殊状态,让它从已经破解的部分中开始进行深度强化学习。

随后,研究人员用100亿个不同的魔方组合,对deepcubea进行了为期两天的隔离训练,并要求它在30步之内破解所有的魔方。

除此之外,研究人员还用1000个魔方难题对该算法进行测试,结果显示,该算法不仅解决了所有的难题,并且还能在60.3%的时间里,以最少的移动步数完成了测试。

baldi表示,顶级魔方玩家需要大约50次移动,才能在4秒内破解魔方,但deepcubea可以在20步内完成,这证明了ai的策略和人类的推理策略是不同的。

结合符号、数学和抽象思维

baldi认为,虽然魔方是一个玩具,但破解魔方问题需要更多的符号、数学和抽象思维,因此一个能够破解魔方的深度学习机器,也将越来越接近成为一个能够思考、推理、计划和决策的系统。

“机器人和一些需要进行规划才能解决问题的其他领域也具有这些特征,”baldi补充说。“想象一下,一个机器人负责清理厨房,它需要做出许多动作,但让厨房变得干净的步骤却很少,随意移动脏盘子的方法是行不通的。”

他还表示,从广泛层面来说,deepcubea能将机器学习ai和符号ai连接起来,以帮助人类进行规划和推理,以解决更多更复杂的问题。

▲魔方创造者erno rubik

一直以来,破解魔方都被人们认为是一个经典的规划问题。deepcubea的ai算法通过把神经网络与符号ai相结合,能够将复杂的环境提取为知识,并进行推理以解决问题。

deepcubea不仅是对人类速度领域的进一步超越,同时在未来的工作中,它也许能应用在其他具有复杂特征的各种问题中,例如机器人操作、蛋白质结构预测等领域,为人们提供更高效得解决方案。

论文连接:https://www.nature.com/articles/s42256-019-0070-z

文章来源:forbes、the registe

相关文章

  • 奥数天才“坠落”?界面:不过是回归社会常态

    奥数天才“坠落”?界面:不过是回归社会常态

    在他看来,把曾经的奥数冠军,变成奥数竞赛教练、变成普通院校老师看成“坠落”的认知体系,是错误的。不得不说,如果一定要从所谓“奥数天才坠落”这个故事中汲取什么教训,那么付云皓本人的感悟,更有感染力,也更深刻。所以,曾经的奥数天才如今不过是回归正常人的身份,非要说什么“坠落”,倒是隐含了值得警惕的不正常价值观。

  • 教科书式散场是城市送上的巨大惊喜  | 长江评论

    教科书式散场是城市送上的巨大惊喜 | 长江评论

    在一座城市的运转体系中,哪有什么“细”节,那是没有看到它身后巨大的靠山。18日晚,武汉体育中心,观众坐在放有垃圾袋的座位上观看军运会开幕式。记者金振强 摄相比辉煌绚烂的军运会开幕式舞台,一次“教科书式”散场,更能清晰触摸这座城市的脉搏。正因如此,这次“武汉版散场”才给人巨大惊喜。人群疏散更可谓“细节见真章”。这一次散场如此漂亮,恐怕也不在很多武汉人意料之中。

  • 2016.10.19|要素市场:北京互联网金融整治方案落地

    2016.10.19|要素市场:北京互联网金融整治方案落地

    北京互联网金融整治方案落地 明年3月底前完善制度10月18日,北京市人民政府办公厅关于印发《北京市互联网金融风险专项整治工作实施方案》的通知称,已成立北京市互联网金融风险专项整治工作领导小组,负责组织实施本市互联网金融风险专项整治工作。相比较全国互联网金融整治方案,北京市互金整治方案要求保持一致。

  • 香港立法会议员区诺轩助理被捕

    香港立法会议员区诺轩助理被捕

    根据香港警方的消息,一名32岁姓叶本地男子于9月1日上午在西区涉嫌“刑事毁坏”及“袭警”被捕,现正被扣留调查,案件由西区刑事调查队第五队跟进调查。有消息称,此人为立法会议员区诺轩的助理叶锦龙。区诺轩此前于8月30日被捕,此后于31日获保释。

  • 吉格斯:D-詹姆斯正沿C罗的轨迹成长 他会成为伟大球员

    吉格斯:D-詹姆斯正沿C罗的轨迹成长 他会成为伟大球员

    直播吧11月10日讯 日前,曼联传奇球星吉格斯在接受采访时谈到了曼联小将丹尼尔-詹姆斯,吉格斯认为詹姆斯目前正在沿着c罗的轨迹成长,在比赛中表现出与c罗一样的勇敢。现年22岁的丹尼尔-詹姆斯,在曼联的足球生涯有着近乎完美的开始。“詹姆斯也是一个出色的球员,他会成长为一个伟大的球员。”

  • PIERRE HARDY二十周年,复刻经典“刀锋”鞋跟

    PIERRE HARDY二十周年,复刻经典“刀锋”鞋跟

    在2019年9月,这一已成经典的作品正式复刻,为pierre hardy二十周年节点上赋予纪念意义的精彩一笔。作为顶级鞋履设计师,pierre hardy先生在与其他奢侈品牌多年合作后,希望能够在时尚界留下属于自己的灵感印记。因此,他于1999年夏季在巴黎创办了个人同名品牌pierre hardy。pierre hardy先生渴望通过blade系列达成对细高跟鞋的借鉴和反思。自2019年9月起,复

  • 《光影对决》:这一次,用放置重新定义moba

    《光影对决》:这一次,用放置重新定义moba

    而现在,《光影对决》新玩法破空而出!全新的放置moba玩法,快速多变的战略分配,简单上手的操作,精美绚丽的原画,重新定义moba手游。在不久前推出的新版本中,《光影对决》推出了moba手游史上浓墨重彩的一笔,放置moba模式对战——超神决赛。有如此可爱的雅娜在《光影对决》中等待你,还不心动吗!《光影对决》是一款二次元放置漫改moba手游,玩家三分钟即可享受一场moba对决。

  • 我国新旧动能接续转换稳步推进 塑造中国发展新优势

    我国新旧动能接续转换稳步推进 塑造中国发展新优势

    ⊙记者 于祥明 ○编辑 林坚记者从国家发展改革委获悉,今年以来,经济新动能正在深刻改变生产生活方式、塑造中国发展新优势。在营造创新生态环境方面,国家发展改革委系统推进全面创新改革试验,形成并复制推广36项经验举措。国家发展改革委相关负责人介绍说,其突出表现在三个方面:一是以新技术新产业新产品为代表的高技术产业保持较快增长。