匹兹堡大学的研究人员测试了视频游戏中的人工智能算法。
研究人员对电子游戏中的人工智能测试以及多人在线竞技游戏中的最佳决策策略进行了观察。
人工智能的重要性
《福布斯》的一项分析预测,人工智能的收入将从2018年的16.2亿美元增加到2025年的312亿美元。匹兹堡大学斯旺森工程学院工业工程师助理教授Daniel Jiang博士说:“看到近年来取得的巨大成功和进步令人兴奋。为了延续这一趋势,我们正在寻求开发更复杂的算法来学习策略,以做出最优决策。”
完善算法
匹兹堡大学解释说姜为机器学习设计算法。算法学习不确定和复杂环境下的决策策略。
在模拟环境中测试这些算法可以让研究人员从他们的错误中学习并强化成功的策略。仿真需要反映真实世界,以实现有效的测试。天富平台的骗局
蒋博士解释了数据不能模拟真实世界的问题。他说:“历史数据可能会成为一个问题,因为人们的行为修正了后果,不提供其他可能性。换句话说,算法很难提出这样的问题:“如果我选择了B门而不是A门,情况会有什么不同?”从历史数据来看,我们只能看到a号门事件的后果。”
电子游戏中的人工智能
电子游戏为复杂的决策制定提供了测试环境,而不会让不成熟的人工智能承担全部责任的风险,因此是一种探索算法错误的安全方式。
蒋补充道:“电子游戏设计师开发游戏的目的并不是为了测试模型或模拟。他们通常设计带有双重任务的游戏:创造模拟真实世界的环境,并挑战玩家做出艰难的决定。这些目标碰巧也与我们所寻找的一致。另外,游戏也快得多。在几个小时的实时时间内,我们可以评估成千上万的游戏决策结果。”
什么是多人在线战斗竞技场?
多人在线战斗竞技场(MOBA)是一种游戏类型。moba的一些例子是《英雄联盟》和《风暴英雄》,在这些游戏中,玩家控制一个角色去摧毁对手的基地并保护自己的基地。蒋用MOBAs测试他在视频游戏中的人工智能算法。
根据匹兹堡大学的研究,电子游戏中的人工智能算法必须克服几个挑战,包括:
实时决策;和
长期决策视野(决策的结果直到以后才知道)。天富平台如何?
获胜的算法
Jiang解释说蒙特卡罗树搜索是一种生成数据并将其输入神经网络的方法。玩家在视频游戏中随机移动,然后算法分析游戏结果以给予成功行动的权重。在游戏多次迭代后,越成功的动作越占优势,玩家在游戏中也越成功。Jiang评论道:“我们的研究也给出了一些理论结果,表明蒙特卡罗树搜索是一种有效的策略,可以训练agent在实时成功地做出困难的决定,即使在不确定的世界中操作。”