AI打《星际争霸II》新进展,网友当场表白

来源:爱酷猪责编:网络时间:2024-05-05 21:02:36

刚刚,我们和暴雪联合宣布,北京时间周五凌晨2点,我们将公开展示AI玩《星际争霸II》(以下简称星际争霸II)的新进展!

届时将在星空卫视、频道直播。

CEO哈萨比斯表示,《星际争霸2》是一款复杂的即时战略游戏,对AI来说是一个长期的巨大挑战。 我们将展示我们的进步! 你绝对不想错过直播!

消息一经发布,就在推特上引发近千条转发和热议。

不少网友表示有兴趣观看! 即使工作了一整天,熬夜后还是要看! 绝对不容错过。

甚至在论坛上给自己设置一个提醒:过两天提醒我! 42小时内提醒我!

有网友当场“深情告白”:当宣布要开始玩星际争霸时,我也开始玩,只是为了更好地体会这门高深的技术。

对某些人来说,这是一个时代的结束。 最初,它们用于我们的 Chess & Go,现在它们用于我们的星际争霸。

如何迎接这样一个时代? 有些人说他们已经感到恐惧了。 也有人为自己的发展制定了规划:第一步是精通星际争霸; 第二步,精通魔兽世界; 第三步,精通企业战略咨询。

也有一些好人评论,和打Dota的AI比怎么样? 一起“战斗”一定会很精彩。

好管闲事的人问:2019年会开和平会议吗?

不过,也有网友不满,表示如果能打败职业选手,就当场吃掉鞋子! 也引发了其他网友的共鸣。

还有专业网友在猜测《星际争霸2》是用什么技术征服的,大家也可以一起猜测一下。 以下是他列出的选项:

用AI玩星际争霸2有什么难的?

2016 年 11 月的暴雪嘉年华上,工程师们宣布了训练 AI 玩星际争霸 2 的计划。现在已经过去两年多了。

与暴雪合作的目标之一是开发一个足以在星际争霸2中击败人类玩家的人工智能系统。就像击败李士斗和柯洁一样。

然而,最终目标是将其中使用的技术应用到现实世界,而不是保留在游戏中。

“我们正在努力了解人类以及我们的大脑是如何工作的,”暴雪首席软件工程师雅各布·雷普此前表示。 “如果我们能够获得这种高质量的数据流——人类玩游戏的原始输入及其结果——这可能是研究人们行为的有用数据。”

对于人工智能研究人员来说,星际争霸2是一个有趣的挑战。

与国际象棋或围棋不同,《星际争霸》玩家面临的是不完美的信息游戏。 “战争迷雾”意味着玩家的计划、决策和行动的结果需要一段时间才能看到。

团队负责人 Oriol 表示,在《星际争霸 2》中,玩家可以看到对手的侦察兵,然后从视野中消失。 对于人工智能来说,要记住他们遇到的事情并理解这可能表明敌人正在某处建立基地,该记忆不仅需要保留,而且还需要在将来回忆起该特定信息。

“在《星际争霸 2》中,这是一种将未来与过去联系起来的非常重要但微妙的方式,”他说。 “很难确定因果关系,因为游戏中发生了太多事情。”

就连大名鼎鼎的“人臂”黄世杰也被调到了星际争霸2项目中。 很多人认为在即时战略游戏中,AI的反应速度会是很大的优势,但事实并非如此。

黄士杰此前解释魔兽争霸作弊码,围棋只有361个棋局,所有对弈内容对AI都是可见的。 然而,星际争霸2游戏有大量的全黑地图。 玩家需要探索地图,察觉对手的动向,以便制定相应的策略。

几乎每次鼠标移动都算作一次移动。 这种不确定性使得《星际争霸 2》对于人工智能来说比围棋更加困难。

这里有一个6分钟的视频,有中文字幕,可以更直观地解释AI玩星际2时发生的事情。

其中,凸显了AI星际游戏的三大问题:

1、不完全信息博弈

2.需要同时控制数百台机组

3、最困难的是需要制定长期战略

星际争霸2中AI战争的进展

为了教AI玩星际争霸2,暴雪于2017年8月发布了SC2LE,这是一个加速星际争霸2中AI研究的工具。入口在这里:

在推出工具包的同时,他们还开源了一套星际争霸2小游戏,这些小游戏是星际争霸2部分操作的抽象产物,AI可以从中练习移动、采矿等技能和单位建设。

到2018年6月,终于宣布这些小游戏已经使用关系型深度强化学习来解决,在6款小游戏中达到了目前的最佳水平,其中4款超越了人类大师级玩家。

然而,《星际争霸2》中还有更雄心勃勃的玩家。

去年9月,腾讯AI实验室发布论文称,他们构建的AI首次在完整的虫族VS虫族比赛中击败了星际争霸2的内置机器人Bot。 虽然它并不是严格意义上的“自学习”,而且人工智能仍然严重依赖人类生成的信息,但到目前为止,这是我们在星际争霸2项目上看到的最丰硕的成果之一。

腾讯实际上开发了两种AI,一种是基于扁平动作结构的深度强化学习代理,另一种是基于分层动作结构规则控制器的代理。

两个AI都可以在一场完整的战斗中击败1~10级内置游戏机器人(1v1虫族对抗,地图:深海礁石)。 其中8级、9级、10级机器人为作弊AI,享受额外加成。 远景及水晶矿、天然气资源。

拥有一系列扁平化的大规模运营。 在此基础上,利用强化学习来训练智能体采取策略; 而操作控制也是人工编码的,但是它具有大小分层操作的混合集,可以自行组合。

此外,去年11月,塔尔图大学还开源了《星际争霸2》深度强化学习(DRL)代理。 这个模块化框架主要用于训练《星际争霸2》的各种任务,在单机环境中提供比大多数开源解决方案更快的并行化能力。

它可以适应多种环境。 除了适用于星际争霸2的SC2LE外,还支持Gym、Atari等常用的强化学习任务。 它使用简单的Keras模型来定义神经网络,并且配置和共享配置也非常方便。

最重要的是,培训规模触手可及,简直爆炸。 在普通的4核CPU笔记本上,每秒采样率可以达到5K,10秒-0就可以学会立杆游戏。

事实上,仍然有一群人在研究如何用AI征服星际争霸(不是星际争霸2)。

最后附上直播地址,别忘了设置闹钟哦~

明星频道:

的:

最近的选择

猜你喜欢
最新游戏更多
热门专题更多
最新资讯更多