编者按:在产品经理的工作中,应结合具体业务、数据分析和数据工程三个方面进行数据分析,涉及的步骤工具可分为六个模块。本文作者分析并阐述了其中一个模块-指标建模。让我们看看。
产品经理的数据分析应结合具体业务、数据分析、数据工程三个方面,整个数据分析涉及的步骤工具可分为指标建模、数据工具、数据处理、数据分析基础、数据分析先进、数据采集六个模块。今天,让我们来谈谈指标建模模块。
一、指标建模概述作者首先提出了几个问题作为本文的介绍——什么是数据指标?常用的数据指标是什么?它们是如何定义的?检查这些指标在日常工作中会遇到什么坑?如何选择数据指标?选择数据指标会遇到什么坑?
选择数据指标的常用方法论:
如果老板问:“新推出的社区产品最近表现如何?
新产品:“很好——日常生活每天都在上升,还有很多新产品。
资深产品:“现状令人担忧——日常生活一直在按设备数量上升,但根据注册用户数量并不乐观。只有20%的新用户转化为注册用户,这表明我们的社区没有动机促进用户注册。
三个月后,老板想知道是否要开始推广。
新产品:“最近生活稳定,新用户减少,要不要推广不准确?”-表现平平
资深产品:“虽然最近日常生活的上升趋势不大,但是:1. 与刚上线时相比,用户人均发帖量翻了一番,2. 用户之间的朋友密度每月上升30%。我认为社区氛围已经形成,3. 也可以验证新用户第二天的保留率从上个月的35%增加到50%。因此,我认为我们可以开始大规模推广。”-非常可靠
二、了解常见的数据指标什么是数据指标?即对当前业务有参考价值的统计数据。进一步说明,当前业务 有价值——并非所有数据都被称为指标,与当前业务无关,意义不大;可统计——数据不是凭空产生的,不能脱离现实。
举个直截了当的例子,为了提高食堂的营业额,老板开展了促销活动。为了衡量促销效果,他首先记录了每天经过食堂的人数为3,进店人数为2,购买人数为1,即统计数据(可观察、统计、记录);然后计算出进店率为67%,购买率为50%,这是对业务有参考价值的数据(衡量活动是否有效)。
常见的数据指标是什么?也就是说,如何量化“谁做了什么,结果如何”这句话,谁-用户数据,做了什么-行为数据,结果如何-业务数据。
1. DAU/MAU
DAU/MAU=Daily/Monthly Active User
1)理解Daily/Monthly
2)理解Active
方法一:定义数据统计系统
基于活跃的事件报告判断:有事件报告->活跃的用户。
tips:报告可能有坑——假设事件报告必须由用户主动操作;谨防活动激增,其他数据没有明显增加。
预制报表统计系统(友盟、百度统计)GA、……)统计是基于事件报告,其统计逻辑是:今天报告的事件(->主动操作用户)->这个用户很活跃。
然而,有时报告并不意味着用户的真实行为,如手机在收到PUSH后报告事件,这属于背景回报,而不是用户的行为。
这个坑的最终来源可能是运营前一周向RD提出要求:“我想统计一下。PUSH,有多少PUSH指导已经到达用户设备,否则推送转换无法优化。RD采用以下解决方案:“我在后台给你写一个Service,APP当我收到PUSH时,我向友盟报告了一件事,说我收到了。
方法二:业务定义
基于关键事件的报告:用户执行关键事件->活跃的用户。
tips:维护成本-日常活动需要持续维护列表;沟通成本-团队内外对[活跃]的认知需要统一。
需要制作日常事件列表,定义哪些事件需要报告。
3)理解User
认人:每个注册用户都是唯一的ID,但未登录的用户将被遗漏。
具体操作:给每个用户一个独家ID,只适用于强注册/登录环境,用户数量=访问服务的ID数。
识别设备:每个设备都有一串唯一的识别符,但不能对应设备背后的用户。
具体操作:在网页cookie中购买长随机字符串,作为设备的唯一标识符,用户数量=访问过服务的设备数量。
作者对是认人还是设备的总结如下:
2. 如何定义新增每个人都在提[新添加],每个人嘴里说的新添加其实是不一样的。
渠道提供商:“只要您点击您产品的下载按钮,即使您添加了一个新的”操作:“您必须成功下载,用户每天最多计算一次”产品:“让我们按启动计算。没有打开应用程序,数据质量太差了。RD:“注册后称为新增[用户],否则后台根本没有这样的数据”因此,需要根据具体业务统一[新定义]。
1)增-选择合适的节点,定义[增]
因为渠道提供商往往很强大,所以在哪个节点结算应该清楚地讨论。
2)新-用适当的方法判断[新]
基于设备:IOS、Android、web基于账户关联的各种方式:与后台现有账户对比匹配3. 如何理解保留为什么要看保留,这个表格可以简要概括保留的作用。
以7日保留的三种算法为例,对某一渠道的质量进行评估。
算法一:(第七天/第一天)x100%-7天保留,只关心特定日期的保留,避免其他日数据的干扰。例如,比较渠道Day当7的保留情况被引入时,Day2~Day7用户数据反而影响判断。
算法二:(第二天~第七天去重后/第一天)x保留100%-7天,引入其他日数据,适用于使用周期固定、周期长的业务。有时需要介绍Day2~Day7.例如,在某些情况下,用户访问特别集中(如kfc疯狂星期四,大量肯德基应用程序访问集中在星期三和星期四),只看Day7.评价往往不能反映真实情况。此时,关注7天内的活动,可以更好地描述渠道质量。
算法三:( 第七天/第0天)x100%-7日保留,新增日为第0日,下一天为1日,使第7日与新增日对齐,可以在一定程度上抵消一些周级的周期性差异。
同样,当不再以日为统计单位,而是以更长的时间周期进行统计时,每周保留/月保留,可以更好地观察整个市场。请注意,用户在计算过程中必须更重要。公式如下:
无论使用哪种算法,最重要的是在公司内部结合业务特点达成相互认同。
4. 如何看待渠道来源?关于“用户来自哪里?”我们通常可以看到渠道来源的指标来解决这个问题。在实际工作中,产品经理将通过公司合作的数据机构提供的各种报告进行查看。在这里,作者简要总结了几个主要的渠道。
不同的网站统计工具和分析工具不同于网站流量获取渠道,但基本上可以分为几个渠道:
直接访问(Direct)引荐流量(Referral)自然流量的搜索引擎(Organic Search)付费搜索流量(Paid Search)社交媒体(Social)直接访问(Direct):它是指用户直接访问网站,而不是从其他网站或搜索引擎。包括但不限于:用户在地址栏中输入网站访问网站,从浏览器收集夹访问,用户点击QQ聊天记录中的链接等聊天工具中的链接。
引荐流量(Referral):点击用户的非搜索引擎和社交网站进入网站。如友链互惠网站、百度贴吧等站外社区论坛。
自然流量的搜索引擎(Organic Search):流量从搜索引擎的自然搜索结果链接到网站。区别于Paid Search,一般来说,搜索引擎自然排名结果的链接是非竞价非付费搜索引擎排名页面链接。此外,值得一提的是,百度等一些具有中国特色的搜索引擎不仅提供搜索引擎服务,还提供百度贴吧、百度知道等多种内容产品和服务。从这些非搜索引擎搜索页面进入的流量不属于自然流量,而是推荐。
付费搜索(Paid Search):也就是说,搜索引擎竞价,许多没有搜索引擎优化资源的网站,短而快速的流量获取方式。在中国,竞价流量已成为许多网站流量获取的主要渠道。
社交媒体(Social):社交网站流量没有单独列出在绝大多数国内网站统计工具中。然而,在世界上最大的搜索引擎谷歌搜索排名因素中,社交媒体因素占了10%以上的权重,因此也应引起重视。
国内互联网圈也有几类不太提:Email、展示广告和其他广告。此外,如果许多数据工具无法计算用户的渠道来源,则默认为直接访问(Direct)。
5. PV UV 转化率 访问深度PV(Page Views),即次数;UV(Unique Visitors),也就是人数。然而,在衡量完成目标行为的潜力时,通常使用它PV/PV表示页面触发下一行为的能力;UV/UV表示用户的行为倾向;PV/UV表示人均行为次数。
1)PV/PV;UV/UV
2)PV/UV
3)访问深度
算法1:用户访问某些关键行为的次数。
算法二:将网站内容/功能分为几个层次,用户此次访问的最深层次计算。
6. 访问时常1)为什么统计访问时间?
通过统计特殊事件,支持业务需求。例如,在记录暂停/关闭页面后,播放器中视频进度条的当前位置可以统计视频的消耗程度,并评估内容质量。
2)如何统计访问时间?
Web时代,直接统计页面打开的时间(但如果我没有关闭它,或者去洗手间……)APP时代统计前台经常停留(如果我在开APP的时候被叫去聊天)……)通过瞳孔和注意识别,即摄像头观察瞳孔是否注视屏幕(需要外设和隐私授权……)总之,如何统计访问时间必须回归业务本身。
7. 与业务相关的数据指标例如:食堂的老板想知道他卖了多少钱?消费水平如何?有多少人来了?有多少人买东西?有多少人是老顾客?我们的商品好卖吗?……这些涉及总量、人均、支付数量和支付率,通常取决于业务数据指标。
8 弹出率(Bounce Rate)
一般来说,用户在不进行任何下一步操作的情况下,一点点打开一个页面就会立即退出。一般统计是整个网站产生的所有会话的弹出率。
本文由 @DarcyAI 每个人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
声明:易商讯尊重创作版权。本文信息搜集、整理自互联网,若有来源标记错误或侵犯您的合法权益,请联系我们。我们将及时纠正并删除相关讯息,非常感谢!