近日,聚焦人工智能+游戏赛道的初创公司超参数科技,对外发布其在游戏领域的进展。在西山居研发中的吃鸡类游戏《荣耀之海》里,双方合作的3D生存类AI“猎户座α”通过从零开始的强化学习训练,具备了复杂3D环境感知、物资搜索/使用、作战、团队配合等能力,展现出了广阔的应用前景。
超参数科技成立于2019年初,已获得晨兴资本、高榕资本A轮融资。创始人刘永升是原腾讯AI Lab总经理、T4技术专家。团队成员包括来自腾讯AI Lab和IEG游戏的多位人工智能科学家、技术骨干,以及海内外优质院校的精英伙伴。在腾讯期间,刘永升与团队主导了围棋AI“绝艺”、王者荣耀AI“绝悟”的研发工作。
成立以来,超参数科技主攻深度学习、强化学习、大系统工程等技术领域。通过将AI能力和游戏场景进行深度结合,为棋牌类、休闲类、角色扮演类、开放生存类等不同品类的游戏公司提供人工智能解决方案,帮助游戏厂商提升开发效率、开启全新玩法,在游戏设计、开发、运营等多个环节创造价值。
自2016年AlphaGo的横空出世,星际、Dota2、德州扑克、麻将相继被AI攻克。随着OpenAI Five和AlphaStar血洗天梯竞技场,游戏领域成为AI研究的主战场之一。
然而,游戏AI仍有两个悬而未决的问题始终萦绕,其一是环境的复杂度问题,其二是AI的拟人度问题。
基于上述两点,超参数科技判断,具有复杂3D环境、要求多人在线的3D生存类游戏将成为AI的下一大挑战。西山居研发中的新游戏《荣耀之海》作为一款3D游戏,复杂度相比一般2D游戏已经上了一个台阶,而吃鸡类游戏的超大地图、百人同局等要素又进一步增加了技术难度。
在《荣耀之海》里,超参数科技训练了名为“猎户座α”的AI智能体,取意宇宙星光,寄望游戏AI指引人类迈向通用人工智能(AGI)的星辰大海。经过本阶段研究,“猎户座α”已经具备了复杂3D环境感知、物资搜索/使用、作战、团队配合等全方位的能力。
AI出生后会快速搜集物资,观察到毒圈外有高级物资时,选择快速出去拾取后再尽快返回安全区
超参数科技介绍,猎户座α采用了深度强化学习方法,从零开始,通过与环境的交互和试错,学会观察世界、执行动作、合作与竞争策略。AI没有使用任何人类玩家的对战数据,完全基于自我对战(self-play)的方式进行学习。在该项目中,“猎户座α”训练一天相当于人类玩家打了10万年。“猎户座α”的训练在超参数科技自研的通用分布式强化学习引擎Delta上进行,该引擎可以部署在任何公有云上,目前已经支持了多款游戏的AI训练。
在AI的训练过程中,超参数科技研究团队还观测到了许多与人类生存进化过程相似的地方。人类在进化过程中,先学会采集食物补充能量、应对恶劣天气,然后学会各种工具的使用,掌握记忆等高级认知能力,进而学会与族群内同伴分工合作、与其他族群竞争对抗。AI通过多智能体的自我训练的方式,也表现出了类似的进化现象。随着训练局数的增加,AI逐渐涌现出了物资搜集、物资使用、空间感知、认知能力和复杂策略等智能行为。
AI学会团队配合,队友互相掩护、击倒后实施救援、救活后望风等待队友打药
超参数科技表示,未来还将逐步去掉地图、队伍、物资、武器的限制,让AI在完整地图上进行100人的“吃鸡”对战,进一步提升“猎户座α”的各方面能力。
超参数科技表示:“3D生存类游戏可能是较为接近真实物理世界的。AI智能体在其中学到的能力,包括3D环境感知与理解、对复杂环境变化的适应、对不确定性的评估与推理、对各种战略战术的灵活应用,以及多智能体间的竞争与合作等,将能从虚拟反哺现实,在无人驾驶、智慧城市、医疗等更广泛的领域带来价值。“
关注微信公众号:游戏陀螺(shouyoushouce),定时推送,游戏行业干货分享、爆料揭秘、互动精彩多。
元宇宙数字产业服务平台
下载「陀螺科技」APP,获取前沿深度元宇宙讯息
110777025(手游交流群)
108587679(求职招聘群)
228523944(手游运营群)
128609517(手游发行群)