微软开源TextWorld框架,以文字游戏来训练增强学习AI

admin
admin
admin
80678
文章
0
评论
2018年7月17日20:33:33 评论 63 次 980字阅读3分16秒

微软开源的TextWorld包含游戏生成器和游戏引擎两个组件,除了可以用来生成文字游戏外,游戏引擎具备简单的推理算法,能够玩市场上的文字游戏,供研究人员评估人工智能。

微软开源TextWorld框架,以文字游戏来训练增强学习AI

在人工智能中,增强学习以及自然语言识别都是重要的技术,但是这两项技术却很难合适的应用在一起。微软实验室发布了,用来制作文字游戏的可扩充Python框架TextWorld,开发人员除了可以使用TextWorld来训练或是测试人工智能的语义识别、记忆或是规划等能力外,也能进一步执行文字游戏,用以评估人工智能与人工设计环境互动的情况。

文字游戏为游戏环境与玩家的互动,仅由或是主要透过文字表现的游戏,玩家可以透过游戏的文字叙述,来理解游戏世界的环境,并透过文字命令来进行操纵角色等游戏控制。在典型的文字游戏中,玩家需要解决一系列的问题,在过程中收集宝物并到达指定位置,目标可能是明确指定的,也可能需要玩家从游戏过程取得的线索自行推理。

微软开源TextWorld框架,以文字游戏来训练增强学习AI

人工智能要完全可以玩文字游戏,除了需要有产生连贯的文字命令外,还被要求以正确的顺序产生命令,只容许些微或是完全没有错误发生。文字游戏结合了以有限制的解析器(Parser )探索空间,以及积极回应玩家的游戏世界,因此仔细观察游戏中文字提供的线索,并采用创造性的理解与行动,则是在游戏中获胜的重要能力。

增强学习以及自然语言识别刚好适合应用在这样的素材上,TextWorld包含游戏生成器和游戏引擎两个组件,游戏生成器可以将高阶游戏设定转换成文字游戏语言Inform 7,诸如房间数量、物体数量、游戏长度或是获胜条件等。而游戏引擎则是一个简单的推理机器,透过简单的算法,产生合法的一连串往前往后等动作的游戏控制链。

微软开源TextWorld框架,以文字游戏来训练增强学习AI

透过TextWorld可以来训练和测试人工智能的语义识别与探索等技能,同时研究人员也可以使用泛化以及转移学习来进行研究,并让TextWorld玩市场上的文字游戏,以评估人工智能在复杂人类设计环境中的表现。

微软实验室首席研究经理Geoff Gordon提到,增强学习与自然语言两项技术都很重要,但事实上他们却不那么适合,而TextWorld确为这两者找到了一个良好的结合方式。他表示,虽然增强学习在近年来已经有重大的进展,如围棋,但是这些相较于文字游戏都是较简单的应用,TextWorld的人工智能需要同时阅读并产生自然语言,在许多情况下,都需要面临更为复杂的情况。

  • 我的微信
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2018年7月17日20:33:33
  • 转载请务必保留本文链接:https://yu72.com/tech/3570.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: