本文来源NGA艾泽拉斯议事厅,本文作者:renzhuohan
暑假在家比较闲,作为一个魔兽世界冰霜数学家, (因为沉迷吃鸡导致肝的时间有限 ,)因此想知道如何更有效率不靠玄学地肝橙,于是就写了一个爬虫,来看一下各种来源的橙装出率到底如何。
这篇帖子的主要目的是探索魔兽世界什么活动出橙效率更高,因此可以在时间不足以刷爆所有东西的情况下做出合理的取舍。不是讨论玄学,也不是讨论防脸黑,每周通刷爆所有难度副本的甘地可以无视。
一句话结论:世界任务和抗魔联军箱子很重要,各个团队副本各个难度掉率差距不大,5M和大米不给力,如果时间不足,那么先保证世界任务箱子,然后优先多刷简单的团本boss,先保证数量,再保证质量。
一、数据来源
数据的来源分为两部分:
第一部分是获取一些活跃强力角色(最好是没有2橙以下的新手保护的角色,以免影响准确性)。在此从wcl上,选取了美服和欧服所有打过H格罗斯(萨墓H1),并且DPS在100万以上的猛男,共约10万人,排除有些已经改名导致404的(25仔) ,最后大约有92500个人。
第二部分,是根据这些角色的ID和所在的服务器,获取这些人的boss击杀记录/拾取记录等等。[暴雪官方的API]可以提供这些数据,可以获取到任意一个角色最近50条活动记录(包括boss击杀,一些重要拾取,成就等等),我们根据这些信息来分析不同活动的出橙率。
二、最终数据
这个数据包含了欧服和美服的。
注:黄色背景的比率指的是出橙率的倒数,越小表示出橙率越高,也就是说,如果比率是150就说明平均刷150次这个活动可以出1件橙。
置信区间的算法是:把每次出橙看成独立同分布的二项分布,根据中心极限定理估计的95%置信区间。可以大致理解为统计误差的上/下限。
三、初步结论
1. 即使是对于这些深度副本玩家(可以从数据看出,几乎每个人都清了H萨墓的CD,有一半多人清掉了PT萨墓的CD,还有好多打其他副本的)而言,绝大多数(约四分之三)的橙装都来源于副本之外(包括但不限于世界任务箱子、抗魔联军箱子、世界boss、PVP箱子、路边箱子)。根据个人以及公会内对于这些副本外渠道出橙的体感,我猜测世界任务箱子/抗魔联军箱子的出橙率是相当高的,务必不要浪费这些箱子。
2. 不同难度的团本之间,出橙率的差距并没有想象中的那么大,M萨墓的出橙率,甚至不到随机萨墓的2倍,远远没有之前的KP理论所计算的那么夸张(那篇帖子中,M难度的出橙率为随机难度的3倍,各难度KP值为6:4:3:2)。考虑到M的难度与消耗的时间,单纯为了出橙的话,不应当以M难度(尤其是M萨墓)为首选刷橙方案,比起击杀boss的质量,击杀boss的数量更为重要。
3. 不同的团队副本的出橙率差距也不大,在考虑到统计误差的情况下,几乎可以认为没有区别,因此利用通刷各种难度的翡翠和暗夜来刷橙,是效率很高的合理选择。
4. 值得一提的是,在这次统计以及之前的几次小范围统计中,各难度的翡翠出橙率都偏高,虽然因为翡翠的样本相对较少,这些数据都落在了置信区间里面,但是每次都偏高从来没有偏低我感觉也不正常……有可能真的是阿三弄错了代码导致翡翠的出橙率真的偏高(笑)
8.18更新:在增大了样本之后,翡翠各难度的出橙率依然很高,我感觉就是翡翠的掉率出了什么事情……当然也欢迎有理有据的对于统计偏差的分析
5. 5M和大米的出率差不多,整个副本约等于一个(普通/随机)团本boss,因此通过通刷5M来刷橙的效率并不高,时间不足的话,优先通刷翡翠和暗夜要塞的各难度为宜。
6. 低保箱子确实很勇,和大家的感觉,包括与KP理论都符合。
7.(8.18更新)极其不靠谱的,把这个结论用来修正KP理论的尝试:
(郑重声明:下面这段文字与数值只是强行用概率代入KP理论的模型,纯属YY,仅供参考,本人不对此结论负任何责任)
下面是使用KP理论的模型,结合本文数据得出的修正版KP——
(M/H/N/R难度)萨墓每个boss:5/4/3/3
全难度暗夜要塞每个boss:3.75
全难度翡翠梦魇每个boss:4.75
大米每次:3
5M每个boss:0.75
低保箱子:9
世界任务箱子:10~15
抗魔联军箱子:5
pvp箱子:我也不知道
世界boss:我也不知道
四、其他说明和误差分析
由于暴雪API能获取的内容十分有限,在此我做了一些必要的假设与估计,因此可能造成的误差与错误均列在下方。
1. 样本结构。为了避免新手保护(也就是2橙以内的高出橙率)的干扰,在此选取的是H1打到100万以上的玩家,能打到这个数值的选手几乎没有在新手保护期的。当然,如果某个猛男突然切了一个别的专精拾取触发了另一个专精的新手保护,这种情况就没法判定了。但是我相信这两种特殊情况相当少,影响也可以忽略不计。
2. 样本数量。
不考虑防脸黑机制的情况下,每次boss击杀判定是否出橙可以近似视为独立同分布的二项分布变量,统计出橙率p在1/150左右,其方差为p(1-p)≈1/150,标准差σ约为1/12。根据中心极限定理,在总样本为10000的情况下,真实出橙率的95%置信区间约为[ p - 1.96*σ/sqrt(10000) , p + 1.96*σ/sqrt(10000) ],误差波动项1.96*σ/sqrt(10000)的大小约为1/600;而在总样本为100000的情况下,误差波动项的大小仅有约1/2000。前者可能导致真实出橙率在统计的出橙率附近±40左右的波动,后者只会导致±12左右的波动。
简单来讲,样本数量低于10000的统计的可信度相对较低,而样本数量高于100000的基本可以认为非常准确。为了减小因为样本不足导致的统计误差,过几天可能再去扒一点其他服务器的数据汇总一下。
新一版统计增加了95%置信区间(算法是把每次出橙看做独立二项分布)
3. 对于5人副本的统计方法。因为5M或者大米只有击杀尾王的记录,而这个记录是不区分大米与5M(都是Mythic xxxxxx)的(以下这两者统一称为5人本)……因此在此使用了一些假设来分别估计这两者的出橙率。
首先,判定是否是大米的方法是看这个人摸出的装备(大米获取的装备有记录而且有特殊标记“challenge”)。
一个普遍认同的事实就是大米出的装备与出橙无关,因此可以通过估计出装的同时出橙,与只出装备这两者的比例来计算大米的出橙率。
大米出橙率 ≈ (出装备同时出橙的次数)/(出大米装备的次数)
另外一个重要的问题是如何估计大米的总次数,在此做了一个关键假设是“每次大米每个队伍平均获取3件装备”,也就是1箱。这个假设我没有数据,也无从获取数据,并不知道合不合理,但是必须做一个类似的假设才可以估算出大米次数,欢迎大家提出意见。
如果认同了这个假设,那么每个人平均打的大米次数约为获取大米装备次数的5/3倍,据此可以获取大米的真实出橙次数与完成次数。
真正的大米出橙次数 = 出装备同时出橙的次数 * (5/3)
真正的大米通关次数 = 出装备的次数 * (5/3)
由此就可以算出真正的5M通关次数与击杀次数了。
真正的5M出橙次数 = 统计的5人本出橙次数 - 真正的大米出橙次数
真正的5M通关次数 = 统计的5人本通关次数 - 真正的大米通关次数
至此5人本的问题解决完毕。
值得一提的是,还有一个误差来源就是5人本内出橙的判定。因为只有尾王的击杀记录,因此我设定的是,尾王击杀前的1000秒(约16.7分钟)到尾王击杀后的30秒。
大米前面的boss不会有掉落因此没什么影响,但是5M的话,如果有一些人击杀老一到击杀尾王超过了1000秒,那么老一掉落的橙可能就不会被计算到5人本出橙的数量里面了……(可能对于klz不太友好不过实在没有什么太好的处理方法)。
还有就是如果有人通关之后过于兴奋忙于庆祝导致开箱时间离boss到底时间超过了30秒,可能也不会被统计进去……
或者心够大的人刷本的过程中不捡东西等邮政长送的……这个很有可能直接就算到其他来源的橙装里面了(
不过上面几种情况应该都不多,不会过分影响结论。
4. 至于副本外获取的橙装占到3/4这件事情,会不会是因为有些只做世界任务不进副本的玩家导致的。这个我觉得不会,因为我挑选的都是能打100w的猛男,而且从样本数量与击杀boss数量的比例就能看出,这些人打的副本一点都不少……
——————————分割线——————————
关于之前一些问题的集中解答:
Q1:已经拾取完三系所有橙装的人,可能都是深度玩家,这些人没有必要刷翡翠和暗夜,只会打H/M萨墓,这些人拖低了萨墓的掉落率,导致了萨墓掉落率低。
A1:好问题,我确实意识到了这些玩家会造成误差。但是着实没有任何办法判断一个人是否全系满橙。不过我们可以估算一下这些玩家造成的影响。
如果假设在9万样本中,这些玩家占到了2%(我感觉这种甘地极其稀有,2%已经算是往多了估计的了),那么这2%玩家共约1850人,假设他们所有人都全通了一次H/M难度的萨墓而没有打其他副本,那么分别会产生1850*9=16650个击杀记录。
在记录中减去这么多玩家再算比率,两者分别降低到了115与141,由此可见,降低的幅度并不高,这个偏差并不会影响后面的大体结论。
Q2:关于副本顺序对数据造成的影响:
[@bek37133]
他这个统计还忽略了玩家打副本的顺序问题。
假设桌子上放了10个馒头,馒头的大小是依次减小的
大家都从最大的开始吃,假设不同人的胃口是一个随机值,那么大概率很多人会在吃第8或者第九个馒头的时候就吃饱了
那么,你得出结论说,第8个馒头最大?
这个显然有问题
A2:确实不同人的胃口是随机值,如果只有一次吃馒头的行为,那么无疑,后面的第7~10个馒头吃饱的人数更大。
但是,这位朋友忽略了一个重要的问题,就是,刷本/出橙的行为,不是一次一次的独立行为,而是一个连续、循环的行为。
首先一个关键问题是,你们认为,绝大多数玩家每周的活动模式是以下哪一种:
(A)依出橙率高低打完各项活动,直到出橙为止,出橙之后立刻下线下周再上,如果不出就一直肝。
(B)根据自己的肝度,肝固定的几个副本或者活动,不管出不出橙都肝这么多,不会因为这周一直不出橙就无限肝下去。
我认为绝大多数玩家都是模式B,比如每周固定打M/H/pt萨墓,大米低保,H暗夜,日常箱子,打完就下线,橙靠随缘而不是靠硬肝。如果你认为A占多数,那这个怀疑很有道理,你如果能证明大多数玩家按照模式A行动,那我一定会承认统计方法存在严重问题。
反之,如果你和我一样,认为绝大多数玩家都遵从模式B,那么请看下面分析。
还用吃馒头作为例子,但是,一个关键事实是:即使你每周打副本的顺序都一样(就比作这10个从大到小的馒头)。
但是你每次吃饱之后,下次不是从第1个馒头重新开始吃,而是接着上次吃剩的继续接着吃(因为你不会在某次副本出了橙之后立刻下线这周再也不上线了),如果吃完了10个就再按顺序拿10个(相当于新CD)。因此,在多次吃饱之后,每次从哪个馒头开始吃,是完全随机的,而在每个馒头吃完之后吃饱的概率的比例,在很多次重复后,也会趋向于馒头的大小比例。
而这些玩家已经多次出橙,吃饱之后新一轮从哪个馒头开始吃(出橙之后打的第一个副本是哪个)也是完全随机的,因此只要统计足够多的数据,无论大家打本的顺序有没有统一的规律,最后的出橙比例都会趋向于真实的出橙率之比。
Q3:防脸黑机制是否会影响数据准确性:
[@tgb4581]
比如A每周顺序是所有能打的H本,M本,PT本,随机本,插入每天的箱子和5H,最后还不出橙会选择清理5M本,竞技场等。
假设他是0KP开始肝橙,可以预见到由于一开始防脸黑机制不生效,即使M本给6KP,实际上出橙率也仅有0.4%x6=2.4%(0.4%假定为每KP无防脸黑的出橙率)
而由于把随机本打完后,KP到达了防脸黑生效线,防脸黑开始生效(假设400点KP开始生效)
此时M本即使6KP也没用了因为已经打过了,但此时一次5M的3KP出橙率到达了0.8%x3=2.4%的高度,也就是一次5M的出橙率与一个M本boss相等
这不公平对吧
A3:其实和上面那个问题类似。
这也是吃馒头的问题,根据上面结论,在多次出橙,以及大量统计样本之下,大家防脸黑值清零(新一轮吃馒头)的时间点是完全随机的。因此,即使大家都按固定的顺序刷各种副本或者活动,最后防脸黑机制很高的时间段,也是随机的。
比如,一个玩家每周固定依次打10个出橙率由高到低的活动。那么多次出橙之后,这个人防脸黑清空的时间点,是随机的。相应地,防脸黑积累到高水平的时间点,也是随机的。
你如果从活动10出了橙,那么从活动1开始积累防脸黑,大约在7~10的时候防脸黑达到水平,此时7~10的掉率高于基础掉率。
但是你如果这一次从活动7出了橙,那么你下次的防脸黑,就是从活动8开始积累了。这个时候,防脸黑积累到高水平的时间段,很有可能就是活动4~6了。
经过大量循环与样本,可以认为,防脸黑机制的加成,均匀地作用在每一项可能的活动上,因此并不会影响各项活动相对的掉落率高低。