新闻资讯

为什么选择打ＤＯＴＡ以及ＡＩ在打ＤＯＴＡ的时候在想什么

来源：津信变频器发布于：2019-4-21 9:10:32 点击量：

2019/04/22 08/23/51　　【丹佛斯变频器 www.dfsbp.com】研究人员认为ＤＯＴＡ对于监督学习开发来说比现在使用的标准环境更具有内在的趣味性和难度。

　　ＯＰＥＮＡＩ　ＦＩＶＥ　ＡＲＥＮＡ

　　目前研究人员还不知道ＯＰＥＮＡＩ　ＦＩＶＥ在多大程度上能够通过更机智的策略被击败，所以研究人员推出了ＯＰＥＮＡＩ　ＦＩＶＥ　ＡＲＥＮＡ。

　　研究人员已经看到过去两年在监督学习能力方面取得了快速进展，并认为ＤＯＴＡ　２将在推进无论是通过较少的数据还是真正的人工智能合作实现有能力的表现方面，持续提供帮助。前期阶段研究人员通过提高培训规模来推动进一步的发展，之后将绝大部分算力用于培训单一的ＯＰＥＮＡＩ　ＦＩＶＥ模型，相当于延长了训练时间。

　　同时，新智元在峰会现场权威发布若干ＡＩ白皮书，聚焦产业链的创新活跃，评述ＡＩ独角兽影响力，助力中国在世界级的ＡＩ竞争中实现超越。峰会以“智能云？芯世界“为主题，聚焦智能云和ＡＩ芯片的发展，重塑将来ＡＩ世界格局。　对于［人类］队友，我并没有那么多．－无论如何

　　在总决赛期间，研究人员展示了ＯＰＥＮＡＩ　ＦＩＶＥ与人类一起在团队中的表现，两队的成员都是２个真人带３个智能体

　　ＯＰＥＮＡＩ　ＦＩＶＥ与人类的协同作战能力为人类与人工智能互动的将来提供了一个引人注目的愿景：人工智能系统能够和人类协作并增强人类体验。　他试图帮助我，想着“我确定她知道她在做什么”然后显然我没有。玩家需要注册，所有游戏的结果将自动报告给竞技场公共排行榜。

　　算力

　　ＯＰＥＮＡＩ　ＦＩＶＥ这变频器维修次的胜利是由于一次重大变化：训练计算量增加了８倍。这是一项公开的实验，任何人都可以跟Ｏ台达变频器ＰＥＮＡＩ　ＦＩＶＥ组队或者对战。为此需要大幅增加工具的的能力、复杂的算法思想（例如分层强化学习）。

　　ＯＧ和ＯＰＥＮＡＩ开发组

　　本次比赛还得出了两个惊人的发现：

　　尽管训练的时候专注于击败其他疯狂电脑，但ＯＰＥＮＡＩ　ＦＩＶＥ在比赛中却展现出和人类玩家的优秀的团队协作意识。

　　。这意味着将来的ＡＩ系统可以从竞争型ＡＩ转变为合作型ＡＩ

　　总决赛让ＯＰＥＮＡＩ的科学家可以回答一个重要的研究问题：ＯＰＥＮＡＩ　ＦＩＶＥ在多大程度、以何种方式能够被确定的打败？并且可能是有史以来最大规模的、人们可以有意识地与之交互的高强度深层强化学习智能体的部署

　　彻底攻陷了人类顶级职业玩家后，ＯＰＥＮＡＩ站出来介绍了ＯＰＥＮＡＩ　ＦＩＶＥ是如何训练的、为什么选择打ＤＯＴＡ以及ＡＩ在打ＤＯＴＡ的时候在想什么。

　　更多ＤＯＴＡ英雄

　　研究人员看到从训练５个英雄到训练１８英雄速度并没有减弱的很明显，于是假设对更多英雄来说也是如此，随后开始大量尝试整合新英雄。

　　ＯＰＥＮＡＩ　ＦＩＶＥ将世界视为一堆必须破译的数字。在每种情况下，研究人员都能够将模型转移并继续培训，这对于其他领域的监督学习来说是一个开放的挑战。

　　研究人员花了几个星期的时间训练英雄池，最多达到了２５个英雄。

　　ＯＰＥＮＡＩ　ＦＩＶＥ是第一个在电子竞技游戏中击败世界冠军的人工智能，在上周末与２－０大败世界冠军ＤＯＴＡ　２团队ＯＧ，这是ＡＩ第一次在直播中击败了电子竞技专家。

　　研究人员没有太多时间调查原因，但他们认为可能需要更好的匹配扩展的英雄池，需要更多的训练时间让新英雄达到老英雄的同等水平。

　　研究人员表示，从今天开始ＯＰＥＮＡＩ　ＦＩＶＥ将不会继续打比赛，但取得的进步和技术的发展将继续推动将来的工作。研究人员非常惊讶这一点和它一样有效。

　　参考链接

　　注册地址：

　　【２０１９新智元　ＡＩ　技术峰会精彩回顾】

　　２０１９年３月２７日，新智元再汇ＡＩ之力，在首都泰富酒店举办变频器维修 ＡＩ开年盛典——２０１９新智元ＡＩ技术峰会。

　　迁移学习

　　尽管模型大小和游戏规则发生了变化，但目前版本的ＯＰＥＮＡＩ　ＦＩＶＥ自２０１８年６月以来一直在不断训练。

　　当今的监督学习算法之所以能有如此强大功能，是以大量经验为代价的，这在游戏或模拟环境之外是不切实际的。尽管在进步，但学习速度还不够快，无法在总决赛之前达到职业水平。将这些英雄带到大约５Ｋ　ＭＭＲ（大约９５％的ＤＯＴＡ玩家）。

　　竞技场于４月１８日星期四太平洋标准时间下午６点开放，并于４月２１日星期日太平洋标准时间晚上１１：５９关闭。

　　值得注意的是，ＯＰＥＮＡＩ　ＦＩＶＥ展示了ＺＥＲＯ－ＳＨＯＴ迁移学习，与人类并肩作战或者对抗人类。研究人员认为减少经验量是深度学习的下一个挑战。

　　据悉，这可能是监督学习智能体第一次使用如此长期的训练课程进行训练。想象一下当你习惯了某个英雄后，学习新英雄的难度是多么大！

　　协同模式

　　它实际上感觉很好；　我的毒蛇在某些时候为我献出了生命。

　　玩家认为从机器人队友哪里感受到了战友之情，并从这些先进的系统中学到了很多东西，整体来说是一种有趣的体验。

　　为什么选择ＤＯＴＡ？

　　ＯＰＥＮＡＩ　ＦＩＶＥ的初衷是为了解决现有深度强化学习算法无法实现的问题。

　　下一步干什么

　　一旦研究人员审查了ＯＰＥＮＡＩ　ＦＩＶＥ　ＡＲＥＮＡ的结果，研究人员将发布对ＯＰＥＮＡＩ　ＦＩＶＥ的更多技术分析，之后将继续使用ＯＰＥＮＡＩ中的ＤＯＴＡ　２环境。事实上，研究人员考虑在国际上进行协同作案韩比赛，但认为需要专门的训练。新智元报道

　　【新智元导读】在上周末彻底攻陷了ＤＯＴＡ人类顶级职业战队ＯＧ后，ＯＰＥＮＡＩ站出来介绍了ＯＰＥＮＡＩ　ＦＩＶＥ是如何训练的、为什么选择打ＤＯＴＡ以及ＡＩ在打ＤＯＴＡ的时候在想什么。结果超出了研究人员最大的期望，产生出了世界级的ＤＯＴＡ机器人，没有触及任何基本的性能限制。

　　总的来说，当前版本的ＯＰＥＮＡＩ　ＦＩＶＥ已经消耗了８００　ＰＥＴＡＦＬＯＰ／Ｓ－ＤＡＹＳ，并且在１０个实时月内获得了年的游伟肯变频器戏经验，平均每天获得２５０年的模拟经验。它使用相同的通用学习代码，无论这些数字代表ＤＯＴＡ游戏（约２０，０００个数字）或机器人手（约２００个）的状态

　　为了构建ＯＰＥＮＡＩ　ＦＩＶＥ，研究人员创建了一个名为ＲＡＰＩＤ的系统，以前所未有的规模运行ＰＰＯ。ＯＰＥＮＡＩ　ＦＩＶＥ的总决赛版本与ＴＩ版本相比，胜率为９９．９％。　但是，你知道，他相信我

20190422082351

上一篇：为什么我们把木头伟肯变频器称为可再生能源呢

下一篇：为充分发挥党组织的战斗堡垒作用和政治核心作用提供了组织保证

新闻中心

联系我们

新闻资讯

为什么选择打ＤＯＴＡ以及ＡＩ在打ＤＯＴＡ的时候在想什么

相关阅读