游戏测试
如何进行游戏测试,然后收集/分析数据
最后更新于
游戏测试是指有人玩你的关卡,然后你观察你的关卡是否有效。
游戏测试是游戏设计中的基础技能和必要流程。
游戏测试就是去观察你的关卡对于玩家来说是有趣还是无聊、清晰还是混乱、令人愉悦还是令人厌烦。如果玩家讨厌你的关卡,你应该尽快处理这个问题。“尽早并经常进行游戏测试”
关卡设计需要耗费很长时间,在项目过程中失去动力是很自然的事情。但当你看到别人仍然喜欢你那糟糕的、半成品式的地图时,这毫无疑问会可以唤醒你的动力。
商业游戏行业非常重视游戏测试,通常需要进行多次测试,如用户研究、问卷调查、市场调研,易用性研究等。最大的游戏公司甚至经营着自己专门的游戏测试实验室。
每次游戏测试都有不同的目的,取决于受众。
自我游戏测试:自己进行测试。
作为设计过程的一部分,你应该每天都测试你的关卡
适合发现明显的问题(关卡是否能加载?门口是否足够宽?)
批评:其他人(通常是专业的游戏开发者)测试你的关卡,并在测试结束后给你专业反馈。你甚至可以和他们讨论如何解决问题。
理想情况下,在每个阶段之后都要执行此操作:布局、白盒、脚本和艺术处理等之后。
适合于学习和协作,在工作场所非常常见
公开游戏测试:其他人(理想情况下是“普通人”,而不是开发人员)对关卡进行游戏测试。
观察他们的行为比他们的反馈更重要
对于发现隐藏的问题(“未知的未知数”)非常重要
但普通人很难通过白盒进行游戏测试,你可能需要先进行艺术处理
“盲测”游戏测试:公开的游戏测试,但几乎没有指导或提示;假装他们独自一人玩这个关卡,看看他们会做什么
批评:加入一个在线关卡设计社区,最好是一个具有该类型游戏或游戏引擎特定经验的论坛或 Discord。
如果可能的话,尝试进行现场游戏测试。看看当地是否有国际游戏开发者协会 (IGDA) 分会和/或独立游戏聚会。
您需要具有足够游戏设计经验的人员来适当地阐述他们的反馈——他们知道如何忽略未完成的系统、明显的错误或占位符艺术,并找到设计核心的真正问题。
公开游戏测试:将您的关卡展示在朋友或家人面前,他们通常会因为社交或情感上的原因而有兴趣参加你的游戏测试。
进行游戏测试的方法有很多种。
以下是现场公开游戏测试的一般流程:
在进行游戏测试之前,你应该弄清楚你要测试什么!将其视为科学实验, 提出假设并设计程序。
以下是基本的游戏测试准备清单:
范围:你需要测试多少游戏/关卡?需要多长时间?
(例如:“第二个关卡的前半部分,最多 15 分钟”)
重点:测试中哪些部分最重要?你最大的疑问是什么?
(例如“关卡出口是否足够明显?boss 是否太难?”)
简述:你会给游戏测试员什么指示?有什么内容警告吗?
(例如“使用 WASD 移动,但不要按空格键,因为我还没有修复...游戏中有蜘蛛,你能接受蜘蛛吗?”)
数据:你正在收集什么数据?你将如何收集这些数据?
(例如,使用计时app来计时他们到达boss#1需要多长时间)
笔记:您是否用笔记来记录观察结果?如何做,在哪里做?
(例如用笔在笔记本上写笔记...哦不,我忘了带笔!...)
给出游戏测试的大概持续时间,以尊重游戏测试员的时间和精力。如果游戏测试包含jump scares、蜘蛛或昆虫、闪烁灯光、性内容或暴力画面,则给出内容警告并征得玩家的同意。
你还可以告诉游戏测试员你希望得到的反馈,并为游戏测试设定一些基本界限和重点。如果您的游戏测试员是专业的设计师,更具体的指示会非常有帮助,这样他们就可以根据你的需求来量身定制反馈。
指示示例:
“使用 WASD 和鼠标......玩得开心”
“我正在寻找战斗的灵感,请告诉我这些遭遇战是否可行”
“我的关卡还没有进行艺术处理,所以请只关注布局,这些都是占位符”
“尝试多使用二级跳,我想看看它是否适合这个关卡”
“布局是最终版本,由于预算原因我们无法更改,请给我关于敌人位置和拾取物的反馈”
但要简短。不要过于简短,也不要过多地关注免责声明,尤其是当你让其他开发人员进行游戏测试时。作为设计师,我们经常因为担心自己的作品是否能够被他人接受而感到焦虑,但我们理解你的关卡尚处于开发阶段,到处都有占位符资产和bug是正常的。
大部分时间应该花在观察屏幕、记录玩家行为、反应或任何需要修复的地方。确保在游戏测试员身后不远处观察。
您可以随意询问一些简短的问题,以了解游戏测试员的行为或思维过程,但不要打断游戏测试来道歉或解释。每当游戏测试出错时,请让这种不适和焦虑在您的脑海中停留一段时间。但是,如果游戏测试员确实陷入困境,或者关卡显然有问题,那么请进行适当干预。
如果不是线下面对面的游戏测试,请让测试人员录制他们的游玩过程并将其发送给你。更好的办法是,游戏测试人员可以进行视频通话以聊天或语音形式来回答问题。对于多人游戏地图,最好让现有的玩家群体或战队在地图上游玩并允许观战。
收集数据/遥测
跟踪基本统计数据,例如游戏时间、死亡次数、获胜百分比等。大多数统计数据收集不需要任何特殊插件或工具,只需要细心记录即可。
有些游戏可以自动汇总玩家数据并进行可视化,尤其是多人地图。玩家是否在狙击地图上太频繁地使用霰弹枪,或者太多玩家在重生点附近死亡?
遥测可以自动收集数据并发送到统计服务器,跟踪玩家行为并在表格/电子表格中显示。遥测类型包括:
数据表,包含最常见武器、进度或装备的战斗统计数据
热图,自上而下的显示玩家频繁移动、获得积分、击杀或死亡的位置。
为游戏测试员准备一些调查问题。您可以问一些关于游戏理解的问题(“您注意到门上方的橙色灯光了吗?您认为它是什么意思?”)或询问更主观的意见(“Boss 战感觉容易还是困难?”)
即使测试人员给你的反馈不是你愿意听的,也要对他们友善和尊重。如果有人真诚地提出建议,无论如何都要微笑着接受。建议本身可能是一个糟糕的解决方案,但建议的理由——以及它所强调的问题——几乎总是真实有效的。
但也要记住,游戏测试环节并不是为了测试员的利益。如果游戏测试员态度恶劣或给出辱骂性反馈,尤其是在面对面的游戏测试中,那么你完全可以结束他们的游戏测试。
游戏测试结束后,您需要弄清楚到底发生了什么以及您要做什么。
“我们在工作室进行了大量游戏测试,并且我们有非常好的遥测工具来记录游戏测试的数据,以便我们在事后进行分析。
这份遥测数据 [如下图所示] 来自 20 名玩家的游戏测试。[...] 每行是不同的护甲套装,从左到右显示不同的进度。这些让我认识到了装备受欢迎程度的模式,包括它在游戏中的流行程度、玩家使用同一装备的时长、他们何时更换装备……我使用这些图表来找出不理想的聚集现象。
... 游戏开始时可用的盔甲并不多,所以每个人都在使用前三种盔甲中的一种 [...] 但这里发生了什么?很多人都坚持使用这种 Alfheim 盔甲。这是我应该研究的问题吗?(剧透,我们确实削弱了 Alfheim 盔甲......)因此,关键在于查看数据以达成你的期望。”
游戏测试的目的是帮助设计师预测他们的游戏是否适合他们的受众。这与玩家的表现无关。请注意以下常见趋势:
游戏开发新手/游戏新手:太“好”,不会用语言表达问题或挫折感
游戏高玩:太挑剔,夸大小问题,表现过度
简述
如果您不熟悉该类型或设计风格,请说出来。
询问“您想要什么反馈?”
询问“在开始之前我应该知道什么吗?”
游玩
大声思考,尝试不断说出你的想法。不说出来就没人知道你的想法。同时,如果开发人员忽略了你的话,也不要为此感到生气。
除非开发人员要求,否则不要吹毛求疵。如果您破坏了游戏,请告诉开发人员,然后继续。除非开发人员要求您重复破坏游戏的行为以进行分析,否则不要继续以同样的方式破坏游戏——不要试图让开发人员难堪或羞辱他们。
诚实地表达你的情感。如果你喜欢某件事,就说出来。如果某件事让你困惑或惊讶,就说出来。
反馈
说一下令你难忘的事情,无论是积极的还是消极的。
询问有关想法和解决方案的问题,并将其变成对话。
在 Valve Software,关卡设计师每周五都会与各种不同类型的测试人员(同行设计师、非设计师、非开发人员,有时是“公开”测试)进行游戏测试。游戏测试是他们设计流程的基础,每周都会推动他们做出许多相关决策。Valve 关卡设计师 Phil Co 分享了他们的流程:
在 Valve 的一个典型项目中,小组(团队中较小的一个子集,由 6-8 人组成)以周为周期进行工作。每周五,我们都会与团队外的某个人(甚至是公司外的,取决于我们的进度)一起测试我们负责的游戏部分。我们一周中所做的一切都集中在周五的游戏测试上。
我们每周一都会开会,决定游戏测试的目标以及每项任务的负责人。[...] 您可能需要设计一个新机制的原型,这需要程序员的参与,或者您可能需要对关卡进行艺术处理,这需要艺术家的参与。
我们从游戏测试中了解到了一切,然而1我们可能会因为过多地进行某种特定的玩法测试,导致游戏测试员对此感到疲惫与倦怠。我们会通过多种方式来解决这个问题。
例如,在《半条命 2》第 2 章中,玩家在桥上得到车,我们决定增加一个战斗高潮。关卡的大部分过程都是战斗,但每次只与几个敌人战斗。它被设计成了一个僵尸快乐屋。根据我们的游戏测试反馈,我们添加了一个可以打开屋顶的建筑,这样 Alyx 就可以使用狙击步枪来帮助你。
非常适合在上寻求帮助——这些问题非常复杂,你甚至无法描述问题,更不用说解决它了
-- Rob Meyer,
-- Phil Co,
GDC 2009: "Valve's Approach to Playtesting"(,免费),涵盖了游戏测试基础知识。Ambinder 概述了 Valve 的核心工作“直接观察”和迭代过程,这对普通关卡设计师来说无疑是最有帮助的。有两个重要的记录:(1)数据科学/遥测现在在行业中变得更加重要,(2)心率监测/脑电波记录/眼球注视跟踪等生物识别技术在行业中很少见,其他工作室认为它对关卡设计来说“得不偿失”。(Ambinder 是一位实验心理学家,所以他当然支持生物识别技术。)
GDC 2017: "Playtesting - Avoiding Evil Data"(,)介绍了现代游戏测试的实践,并提供了如何以及何时进行游戏测试的实用技巧。De Jongh 认为“恶意数据”是“分散注意力、不明确或误导的游戏测试结果”,因此,重要的是要专注于对各种游戏测试人员进行频繁的直接观察。不要费心填写表格/调查/问卷,而是向远程游戏测试人员发送模板电子邮件,让他们使用OBS软件录制他们的屏幕和声音,然后上传视频。