思尘

和女神一起去海洋馆、记录美好的一天

【数据产品研究】聚焦于用户行为分析的数据产品(二)

Heidi格物志:

转载请注明出处,关注我请点击:heidixie 

上篇《【数据产品研究】聚焦于用户行为分析的数据产品(一)》后,有些同学询问我如何寻找这些Fancy的网站——肯定不是通过百度来的(以后专门分享这个话题)。有些同学问我是否能够赶快继续分享出第二篇(咱这就来了),有同学建议我是否能够对目前研究或打算研究的数据产品进行一个梳理和分类,便于他们有的放矢去深入解析。所以我大概对目前有过涉猎的数据产品做了一个大概的梳理。

首先,聚焦于“消费者体验提升”领域,数据产品大有可为,见下图:


要提升消费者体验:

1. 要先明确目前的现状

消费者到底哪里体验不好了,或者哪里不满意了要先有数据——这里的数据,不必局限于具体的数值类指标,用户的声音、用户的反馈都可以认为是数据。那么这一步是为后续的各种分析、挖掘提供原材料,同时也进行一些可视化展现工作。一般来讲,很多数据可以帮助我们去还原现实:

  • 用户的声音(他通过问卷、Feedback、或者客服系统提交的直接需求)

  • 用户的行为(与声音相比,行为的采集成本更高,但是相比声音,行为有时更能体现用户真正的需求。用户的行为主要体现在点击、轨迹、注意,可被录屏、可被可视化为热图或鼠标轨迹图、眼动图,然后可以被聚合成路径、漏斗、报表等)

  • 用户的属性(通过各种方式聚合的数据,能够知道用户的性别、年龄、偏好、注册日期、星座等等人口学特征,另外,要知道用户的行为也可以处理为他的属性,比如活跃还是不活跃)

  • 业务数据(行为产生的结果数据,比如订单量,交易金额等等) 通过这些数据的采集、聚合、可视化、分析能够帮我们再现用户的现实。接下来的数据产品研究,主要是集中在这个环节中的用户行为分析产品。

2. 要对现状进行分析和挖掘

有的时候,现状能够直接告诉你发生了什么事情,是什么原因。但是大多数时候,现实需要经过进一步的挖掘,才能找到原因,进而找到解决方案。比如,当现实告诉你,从购物车到订单的转化漏斗不够健康,尤其是新版本发布后,此漏斗转化率大幅度下跌,如果这期间没有其他因素影响,或许你可以推论出是新版本的变更导致,但是若有别的因素,比如渠道活动,比如大量新用户涌入……所以,要经过多维交叉分析,才能进一步锁定原因,比如按用户类型分布,发现大部份下跌来自新用户,再看新用户的上涨幅度等等。有时,还有必要结合定性的调研予以验证或进一步挖掘。

3. 要有改善计划和方案:

当清楚了现实又知晓了原因后,就可对症下药做出改善计划。可能是流程的完善,可能是规范的落实,也有可能是产品系统的可用性、易用性改善。值得一提的是,通常我们说的数据产品是指从数据的采集、计算到报表展现的平台,也即是商务智能系统。改善环节也可以做数据产品,只是非传统意义上的报表型数据产品,而是数据驱动的系统,比如可以把前两个环节沉淀的数据回流到业务系统中,做一些机制触发,比如CRM平台,当某个用户被判断属于环节一中的某个用户群体后,向他发送定制的个性化消息。或者设计一个算法模型,去改善搜索结果等等。

4. 有了改善方案,必然要评估方案的效果

  • 可以事先评估——在方案未正式发布前,借助A/B TEST或在Userbilla上上传高保真的原型邀请用户做认知走查,当然,也可以借助你的团队里用研团队的力量,做实验室测试、用户调研等。

  • 也可以事后评估,方案已经正式发布,那么可继续使用环节一中的数据产品对用户之后的行为做还原,并和发布前的版本做对比分析。

以上四大环节,都有众多数据产品涵盖,但是一口气吃不成胖子,目前还是聚焦于环节一之用户行为研究吧, 先给出我有兴趣的网站,最后我会找机会围绕用户行为研究横向做个贯通评测和分析。

所以,接上篇继续:

1. VWO (https://vwo.com)


作为一个可视化控,我太喜欢这个网站了。我对里面的各种内容可视化配图爱不释眼。

VWO是什么意思呢?看看全称:Visual Website Optimizer,是一个定位于可视化网站优化服务网站。

这个网站的第一印象,可视化太赞了。然后,太有信心了,随便取下他怎么描述自己的产品的形容词:


好用,世界一流,及其简单,加上界面很美貌——像糖果一样可爱,清新,除了价格是个考虑因素,确实可以试试。

特色:

从界面上讲,VWO上两个频道比较突出,一个是Create(创建),一个是Campaigns(活动)。
Create是让我们去创建一些Campaigns(活动),比如A/B Test. 而Campaigns(活动)是数据分析报告以及热图点击报告,用来分析之前创建的Campaigns(活动)。



VWO列举了它引以为傲的特色:


1. Testing & Experimentation(测试与实验)
VWO平台提供了以下4种方式做网站以及APP的测试。
 

 

  • 常规的A/B Testing:VWO的特色在于你无需自己开发多版本的页面,你可以使用Visual Editor很方便地修改原版本的颜色、任何元素的布局、规格,甚至JavaScript的动态效果。然后生成若干个版本进行在线的测试。请见下文对于Visual Editor的介绍。

  • 多变量测试:常规的A/B Testing是同一个页面不同的版本做测试,比如A/B/C三个版本。而多变量测试是同一个页面的不同元素的多版本测试。具体是如何投放并做测试的,我没有办法一窥究竟。大家脑补下。

  • 分离URL测试:也是A/B Testing的一种吧。给我的感觉是A/B Testing是同一个URL,但是面向用户抽取一定的比例显示不同的版本内容。而分离URL测试是截然不同的两个URL,同时上线发布。

  • 移动A/B Testing工具:应该是刚出的Beta版本,所以还处于邀请才能使用的状态。同样,你也可以向常规的A/B Testing一样很方便地修改APP里的页面,而无需经过开发工程师来协助。甚至是Native App……

2. 可视化配置(Visual Editor)

可视化配置的目标就是:向IT团队说拜拜!当然,IT团队更大的价值在于实现工具,然后让产品、运营去玩。



在可视化配置界面上,你可以选择原页面(版本A)上的任何一个区块,然后拖拽移动到新的位置,或修改一个文案,或改变它的大小,保存为一个新的测试版本(版本B)。


不仅是拖拽、改变形状那么简单,如果你可以,可以直接修改某个版本的CSS样式表。或者让攻城师帮你调整下新版本的Javacrip动态效果:


3. 分析报告
再来看看VWO提供的分析报告。


热图:可视化用户行为

更多的,大家自己猛击以下链接去探索下吧。https://vwo.com

2. Clicktale(http://www.clicktale.com)


Clicktale向你讲述所有关于点击(Click)的故事。传统的网站分析工具一般会向你讲述用户从哪里来,用户在你的网站里去了什么页面。Clicktale想要尽可能让你知道更多细节,比如他们都具体在页面里做了什么,点击了什么,滚了多少屏,表单如何填写……对,它就是想让你知道用户如何用网站就如同你就站在他背后。

特色功能:



1. 会话回放(Session Playback

其实和上篇提到的Mouseflow网站类似,提供录屏及回放功能。这里就不具体介绍了。

2. 热图(Heatmap)

热图是对各Session的聚合,从而体现群体特征。热图是Clicktale的主打功能,所以热图的类型也非常多。


2.1 鼠标移动热图:用户的鼠标在何处移动

我们可以很简单去统计用户的业务数据,比如购买了什么,我们也不难统计用户点击了什么,但是过去想要统计用户看了什么,却是一件相当麻烦的事情。

只有少数大公司有专门的用户研究团队,也只有少数的大公司会购买高级的眼动仪,设置专门的用户研究实验室,然后邀请用户来到实验室,监测他如何看网站。眼动仪在测试广告、设计效果上,确实会非常直观。但是毕竟测试成本较高,且不可避免受到少数样本的影响。而Clicktale引用一个独立的研究结论,认为鼠标和眼珠的运动有着84%到88%的相关性,所以他们提供了高精度的鼠标移动热图,目的是用此来表达用户实际上注意到了什么。

2.2 点击热图:用户点击了什么

不一定是你期望他们点击的链接!这里记录的是用户的任何点击,包括空白区域以及像链接的静态图片上的无效点击。

从而可以看看当一个静态图片不断被用户点击时,是否应该调整成真正的链接,否则你就让用户失望了~

2.3 注意热图:用户对什么产生了注意

本来我看了鼠标移动热图基于的理论基础时,因为鼠标移动轨迹和眼球的移动有着很大的相关性,所以在没有办法获取对于用户研究轨迹的跟踪前,是使用鼠标移动轨迹来代替的。

但是Clicktale却另外还提供了注意热图(Attention heatmaps)。 Attention的可视化分析,专门有一个术语:Visual Attention。其价值当然是不言而喻的。按照AIDA模型,消费者要产生行动,一般要经过四大步,首先要能够注意到,其次会产生兴趣,有了兴趣后能够自己主动去发掘细节、进行对比研究,之后产生行动。所以能够吸引到用户注意是转化的第一步。



这个功能我一直不知道背后的原理是什么,有兴趣的小伙伴可以一起研究吗?具体介绍点击这里

2.4 滚屏深度热图:多屏的页面,用户滚屏所能到达的深度以及停留时间

好像Clicktale认为单纯有鼠标轨迹以及注意力热图还不够!假设当用户确实滚动到了页面底部后,确实对某个Banner产生了注意力,这证明这个Banner的设计确实达到了预期可是,可是,事实的结果是该Banner确实很少有人注意到,那是否是因为用户压根就没浏览到页面底部呢? 所以好的内容,还必须给予它足够的曝光机会。

通过滚屏深度热图可以看看用户最多看到你的长页面的哪个屏幕。从而可以帮你发现,哪些页面应该被设计得更短一些,哪些页面应该更长一些,哪些内容应该调整它的位置到上面的屏幕。

滚屏深度热图的DEMO:



2.5 链接分析:用户是如何点击链接的

除了点击,还有很多细节。鼠标指向你的观测页面的任何链接,悬浮框里会出现对此链接的详细监控数据:

 

  • Clicks(点击数):在这个链接上发生了多少次点击,以及这些点击占整个页面所有点击的比例。

  • Hovers(悬停):在该链接上悬停的次数,以及对整个悬停次数的占比。

  • Hover Conversion(悬停转化):很可能你的链接吸引了用户的注意,但是悬停后并没有发生点击,通过这个指标可以看到每个链接的悬停转化率(尼玛要不要这么细啊。。。)

至于还有更加细节的指标,大家自行研究吧,比如什么Time to Click(页面加载完毕到鼠标点击的时间消耗),Hover Order(悬停的次序)…………

除了录屏回放以及各种热图外,Clicktale也会提供一些更具分析意义的报告。比如:

3. 转化漏斗(Conversion Funnels)

能够生成实时的访客基于页面到页面的转化漏斗,展示最有价值的路径以及用户在哪里流失。并且能够从转化漏斗直接连接到会话回放。

结合高级筛选器,可以选择某种特定特征的用户群体,看他们的行为以及漏斗的转化情况:

具体介绍:高级筛选器    转化漏斗

4. 表单分析(Form Analytics)

表单是不令人愉快的。用户讨厌填写任何表单!有时表单是影响转化率的最大因素。

但是为了商业利益、或者更好给用户服务,我们可能无法避免让用户填写表单。

那么就像医院里的护士让小孩子去打针一样,需要一些伎俩,既能完成任务又不至于让用户讨厌或者中途流失。

那么首先应该对现状足够地了解:用户在表单上每个字段的填写时长、哪些字段会被留空不填,哪些字段被多次修改,在什么字段上用户流失!

表单行为分析利器:



4. 页面分析工具

热图基于页面,漏斗很多也是基于页面,表单也是在页面上。但是去哪里能够看到网站所有页面的表现,以及监控我的重点页面,对其中的关键指标一览无遗呢?

Clicktale提供以页面为核心的分析工具,让你基于页面,串联起以上的所有工具——充分考虑业务诉求啊。

运作模式:

据说,只要十几分钟的安装(其实也就是一段JS代码),Clicktale即可开始运作。之后你的网站上,用户的任何行为会被采集到客户端,然后以一个压缩包的方式传送数据到Clicktale的服务器,服务器会同时将用户的会话中的屏幕截取快照,然后将数据进行联结,让数据和图片发生作用。之后你即可登录你的Clicktale账号来享受丰富多样的行为数据可视化服务。



其他的功能,大家一起研究下。点击这里直达:http://www.clicktale.com/ 

在看以上两个网站的同时,还遇到了一些同类的网站,大家也可以去看看:

 

【数据产品研究】聚焦于用户行为分析的数据产品(一)

Heidi格物志:

转载请注明出处,关注我请点击:heidixie 

因为工作需要,我的收藏夹里收集了很多数据相关的产品,其实加入收藏,也一直没有时间好好去研究。这几天恰好有时间翻出来逐个体验了番,顺手贴出来,大家一起研究。

受篇幅所限,这里只贴了4个,更多的请期待后续。

1. Heap


是什么?
之前我研究了一个网站叫FullStroy(https://www.fullstory.com), 主要是提供用户的行为录屏、回放以及记录用户的每步操作日志并可视化出来。Heap聚焦于用户行为的数据分析。但是它没有提供录屏功能,而是打造了更加轻量的接入方式以及实时数据卖点。

面向市场:
Web+iOS

特色功能:

  1. 可视化配置事件(Heap并不自动采集各种行为,而且要你配置,但是它提供了一个非常方便的可视化配置功能)

  2. 实时数据(一旦配置,立即有数据,无需等待,且是实时的数据)

如何运作:



首先,需要触发数据采集,即安装Heap,安装Heap的办法很简单,只需要在你的产品、网站里集成Heap提供的代码。

Define(我理解成配置),主要是两块,一个是配置事件,另一个是配置用户细分群体。

定义事件:配置事件上区别于侵入式的编码(比如目前的移动统计工具,可能都需要你在代码里埋各种事件),Heap提供可视化的配置,让不懂编码的人能够很快配置好所需的事件。

比如,你想要观测example页面上的Sign Up按钮的点击情况,不用去找开发工程师给你埋点,只需要打开Define频道,定义一个事件,选中这个页面,然后在可视化的页面上点击这个按钮,命名,然后配置是不是该页面独有(假设某个按钮在多个页面上都存在,那么如果不设置为该页面独有,数据统计则是所有按钮的点击了),然后事件就配置成功了。见下图:

定义用户群:无细分,不分析。只有有了用户细分,才更好观测每一类用户的具体行为,根据行为的不同再针对不同的用户采取不同的推送、设计等个性化策略。下面就是Heap定义一个用户群的界面,你可以使用“已经购买了至少5次”的条件来定义一个“高价值客户”群体,或者使用“至少登陆了2次“且”上传了自己的档案照片”的条件去定义一个“活跃用户”。一旦你定义了一个用户群体,你就可以使用不同的用户群去看他们的行为路径、转化漏斗和其他的群体以及剩下的用户有何不同。

至于用户分群的选择条件,应该也基于之前定义的各种事件,加上一些用户的属性。在我们的内部产品无线数读平台上,我们也提供了用户分群工具,可以让开发者根据终端属性(品牌、机型、网络类型、运营商),以及使用行为(比如启动次数在某段时间内大于多少次且某段时间内小于多少次等),加上用户的属性(性别、年龄段、地域、爱好……)等多种标签对用户进行细分。其实背后都是一个道理。

有了事件和用户群的定义后,Heap就可以展开分析了。

在分析这块,Heap做得还比较简单,无非就是一个趋势图(研究各种事件的走势,这是最基本的),还有转化漏斗(Funnels), 使用者可以将之前配置的事件,按一定的次序配置成一个漏斗,进而监测转化情况。


在配置漏斗这块也有可取之处,比如它提供了更多维度对漏斗进行细分,可以看不同类型的用户的转化漏斗有何不同。

此外,Heap虽然没有提供用户行为的录屏,但是通过路径流的方式予以呈现:



Heap的另一个卖点是,全部的实时数据。配置成功后,无需等待数据采集上传计算展示等流程,即可就能够看到实时数据。对于心急的数据消费者来讲,这绝对是个利好消息。不过这背后肯定是较高的存储成本,因此Heap是一款价格不菲的收费产品。

不过,它提供14天的免费试用,有兴趣的同学不妨先试试。

2. Trak 



是什么?
与其说Trak.io是一个用户行为分析工具,不如说它更偏向用户管理(Customer manage )。
Trak.io页面的口号是:See Who is using your product and send automated emails based on their behavior. 意即:知道哪些人在使用你的产品,并且可基于他们的行为向他们发送自动邮件。无疑,这些邮件只所以自动,背后是有一套规则,比如定期向长久不来的用户发送唤醒邮件,或者向近期比较活跃的用户发送新版本测试邀请。 

面向市场:
Web+APP

特色卖点:

  1. 360°的用户档案及实时的全程操作行为记录

  2. 自动邮件系统以及用户状态变更提醒

Trak.io的重心是触达正确的用户,和他们建立联结,不管是提升用户的忠诚度,还是维系重点用户的关系。但是要更好去实现这个目标,Trak.io必须要“记录数据”。

运作模式:
从界面上看,Trak.io的模式很简单明了:

不好意思,因为LOFER压缩了大图,我再来一张局部图:


可以看到,Trak.io提供的服务就两类,一个是数据方面,提供用户档案、行为记录,还有用户群的数据。一个就是各种触达用户的方法。

数据方面:

  1. People: 360°的用户档案

  2. Segments: 人群细分,除了单个用户的档案外,还可以把满足某种特征的用户放到一个群体进行分析及触达。



太可怕了。

虽然没有太高的技术含量,就是把用户的能够被抓取到的信息集中起来,然后还原TA的操作日志。

你设想下,如果聚焦于某个个体是多么可怕的一件事情,任何人只要被授权,就知道你的一切信息……奇怪了,老外不是很注重个人隐私的吗?

不过以上的档案,显然在服务用户时相当有用。假设一个网站的客服,接到一个用户的反馈或投诉,电话一接通,录入对方的账号,电脑上就可显示该用户的档案,以及最近的浏览日志,操作记录一览无余,就确实节省了很多沟通成本。不至于再三询问用户,你是在什么环节遇到了什么问题了。

Trak.io提供这两个信息,也不是自己YY玩,毕竟平时没事有事去偷窥用户档案的人还是少数的,而且应该很多人不会被授权看用户档案。最好的方法就是根据这些信息提供一些系统工具,能够按某种规则触达用户。所以,Trak.io提供自动邮件功能——比如设定规则,当某个用户符合此规则时,自动调用配置好的邮件模版进行发送。  

用户细分方面,提供了这样的分群工具:


管理及触达方面:


1. 自动触发的邮件
这个不用多说了,无非就是一些规则设定,在恰当的时间发送预定义好的邮件给恰当的人。

2. 用户状态的变更提醒
当你是被分配要服务好某些特定的VIP会员的时候,你应该比较关心这些会员的状态变化,比如他们是否被加入了一些细分群组里,他们是否出现了账号异常?Trak.io可以让你设定某些规则从而再发生这些异常的时候主动发送邮件给你,从而你能够提前做好应对,而不是在用户打过来电话是询问:what can i help you, sir?

3. 团队协作管理
可以授权团队其他成员。

怎么使用呢?
提供给几段段代码,分别用于获取用户档案、记录用户行为,更多使用信息可在http://trak.io/help/sending_your_customer_data.html查询。
另外,这个产品是有偿使用,但是你可以申请14天的免费试用。

3. Mouseflow



是什么?
顾名思义(怎么老用这句话……看来名字是多么重要啊),Mouseflow是记录用户的鼠标轨迹的。

看似比上面的网站更具技术含量。因为记录点击的结果已经不是太高的门槛,通过一些URL的特征埋点即可实现。但是用户虽然最终点击了某个按钮,可是他的鼠标却在屏幕上反复游移不定,可能说明这个按钮的位置和外观设计不符合用户的认知和预期。所以观察用户的鼠标轨迹是很多用户研究同学和交互设计同学很喜欢干的一件事情。

Mouseflow能够让我们很方便地录制用户访问的轨迹并生成实时的点击热图,显示他们点击了哪里,在哪里滑动甚至注意到了什么。

你可以尝试下他们的录屏DEMO:http://mouseflow.com/demo/

面向市场:
好像目前只有WEB。APP的类似产品也有,请见下文的APPSEE。

特色功能:

1. 直观的鼠标轨迹录屏

不用从各种数据报表去猜测用户怎么用的,直接去看好了。

2. 实时的点击和移动热图

直观的鼠标轨迹是很赞,但是我们怎么会有时间去一个个看视频呢?所以热图是一种数据的聚合,从而能够帮我们判断大多数人是如何点击如何滚屏。

3. 滚屏热图

这个功能我还是第一次遇到,有时提升转化不仅仅是用户发生了点击,而是要注意到。我们没有办法去装个眼动仪捕获用户的眼球轨迹和视觉热点,但是内容有没有被用户使用滚屏出现在当前屏幕上,我们却是有办法去抓取的。所以Mouseflow提供了Scroll Heatmaps,快来看看你辛辛苦苦做的Banner有没有机会被用户看到吧。没有看到则想办法去换个更优的位置,看到不点则是Banner可能设计得太烂。

4. 页面分析

除了直观的轨迹和热图,简单的数据统计报表是必不可少的了,毕竟单个群体很难代表大众,热图也不可能直接转化成数据从而做更多二次加工和处理。所以定量的用户行为分析报表可以作为一个基本补充。

不过仔细去看,Mouseflow既然聚焦于用户行为分析,提供的页面分析报表也有不少可取之处,比如它除了提供简单的PV\UV\停留时长\退出率\点击次数等,还提供了页面的更多信息,比如页面的大小、下载的时长等信息。

如何使用?
分不同的平台提供不同的对接方案。比如面向WordPress是提供一个插件,有些平台则提供嵌入的代码。详见http://mouseflow.com/integrations/
另外,也是收费的,不过据说可以申请试用,享受多少次的免费录屏。

By the way,在我写这篇文章的时候,恰好看到了UI Pattern网站上有一篇对比同类工具的文章,其中提到了Mouseflow,有兴趣的同学可以读一下。其中提到的Clicktale工具,提供了手机APP上的热图功能,这里先记录一笔,待后续研究。

4. AppSee 



是什么?

专门面向手机应用(App)的用户行为分析工具。顾名思义(o(╯□╰)o),AppSee致力于让你亲眼看到,而不猜测用户的行为。在此之前,无论是功能强大的Google analytics还是聚焦于APP分析的Flurry, 抑或是我们国内声名大噪的友盟平台,都是比较传统的数据报表系统,提供各种各样的报表帮助你去洞察用户的行为。AppSee则采用了“直接录屏给你看”的简单商务模式。

聚焦于单个用户的行为路径再现,其实在分析领域被颇受诟病,因为从统计学的意义来讲,个体很难在需求上代表广泛的用户群体,尤其当一个APP的用户数以千万、亿级时,单体的特征就愈加不被重视。那么AppSee为何还取得了很大的成功呢?(几个月前,APPSEE已经完成100万美元的融资)。

我想可能是因为,数据分析类产品无外乎按几个层次进行进化:1. 告诉你发生了什么(反映现实)?2. 告诉你为什么发生(分析原因)?3. 告诉你这些发生是否正常(评价体系)?4. 告诉你接下来会发生什么?(预测未来)。在反映现实这块,他们致力于提供一个更加全面的用户信息,让其能够足够代表大多数用户。但是某些潜在的机会点却被淹没在这“大多数”里,可能一些潜在的产品的改进点反而是由少数人引起的,因为大多数淹没了他们。此外,基于大多数,很难去重现用户的遭遇。比如当我们发现某个页面崩溃率比较高,但是它是如何崩溃的?从这其中捞到一个个体,还原TA的操作路径,能够帮助开发快速重现错误发生。

另外,传统的用户研究团队,做的很多工作,其实也是基于个体。小样本量可能无法告诉你大多数人想要什么,但是可能也足以帮助我们知道网站大概出了什么问题(据统计5名用户大约可以发现85%的问题)。而线下招募志愿者参与可用性测试显然成本较高,且用户在知晓处于测试期时的行为表现可能也无法代表真实状态下的表现,而使用AppSee不但可以节省可用性测试的高额成本,而且还让可用性测试随时、用户不知道的情况下进行。甚至可根据你设定的规则抽取符合某些要求的用户。

特色功能:

1. 用户录屏(User Recordings)

直接看到用户的每一步操作, AppSee能够记录每个屏幕,用户的每次点击以及各种手势动作。说实话,鉴于移动APP里面有很多隐形的交互,确实直观来看会比较激动人心,给你一个点击按钮的列表,谁愿意看啊。值得一提的是,现在很多聚焦于APP分析的产品都提供了系统崩溃的报表,但是很多没有解决开发者想要重现错误的需求。只有重现才能帮开发者更好去分析崩溃产生的原因。AppSee帮助你重现错误,你可以单独看看CRASH的录屏。


2. 触摸热图(Touch heat maps)

从个体聚合为整体的热图。目前貌似没有看到触摸热图和用户细分结合的功能。



3. 分析报告(In-App analytics)
除了上面显示的Overview外,令我垂涎欲滴的还有页面路径和转化漏斗,其中页面路径可以显示每个屏幕的图片啊啊啊啊啊……再也不用看着英文名字想到底是什么页面了。转化漏斗更为简单些,但是结合了简单的用户细分,还是能够看到新老用户的转化差异的。再加强些用户细分就更赞了。

总结:

除了上述网站外,大家还可以研究下列聚焦于用户行为分析数据产品:

1. Clicktale: http://www.clicktale.com

2. Stacklead: https://stacklead.com

3. Iterable: https://iterable.com

4. Popcornmetrics: http://www.popcornmetrics.com

5. Trialfire: http://trialfire.com

6. Fullstory:https://www.fullstory.com

从设计到数据——写给非数据人的数据世界入门指南

谢谢~!对于这这种数据小白来讲很有帮助~!

Heidi格物志:



转载请注明出处及URL地址,商业转载请微博联系,谢谢。

供非专业人士学习交流,望专业人士勘察纠错。 

一. 一段经历,一点心得

一直追我博客的人想必是清楚我之前做交互设计,然后去轮岗过行业运营,然后突然就开始做产品经理了。我也觉得奇怪的是,上次发了一个招聘启事后,来加我微信的同学们,既有做交互的,也有做产品经理的,甚至还有在IBM做了5年BI数据分析师的……这样看来,我的博客逐渐成了一个交叉学科。

 

 
简单来说,也差不多如上图所示。

当时是一个新业务开拓,仅仅4个月的轮岗(非正式的轮岗,当时就是老大给了各个部门体验其他团队工作的机会,但是组织架构可以在轮岗结束后再恢复原岗位),结果成了职业历程上的分水岭。为什么呢?

行业运营除了日常的商家管理、活动策划以及选品外,当时的商业模式还需要我们介入整体的供应链管理。而虽然当时身处家居行业,供应链管理却是在不同行业之间有较大的共通性。所以后来又成立了一个横向的部门——供应链管理。于是从垂直行业里调出的部分同学加入这个横向部门。而供应链管理,离不开大量的数据分析工作,供应链整体效能如何?需要和BI部门通力合作,所以供应链管理部门合并到了BI部门。

于是我就“随波逐流”地成了BI部门的一员——虽然我们并不做具体的数据分析,更多是向分析师提需求。

 再后来,供应链整体效能的数据统计和分析,是靠分析师们每天出手工报表和报告发送给各部门管理人员的。发了一段时间后,分析师苦不堪言,接收方也过于被动,当他在邮件里看到某个数据异常时,无法自己主动地进行探索钻取,所以自然而然有了将供应链报告“产品化”的需求。

要求:短、平、快。

资源:极少。没有设计师、PD、以及充足的开发人员支持。

 原因很正常:大部分人都投入到了业务系统建设中(彼时,供应链管理系统、物流管理系统、认证系统、以及前台都处于开荒建设阶段)。

所以,因为我做过交互设计——会画DEMO;和PD接触时间长——多少知道PRD怎么写;又给分析师提过需求——知道数据大概怎么回事……

所以,我就“随波逐流”成了数据产品的产品经理。

插句后话,以后在晋升面试或者转岗面试时,当面试官问我怎么就突然从交互设计师转成数据产品经理时,最早我也是讲的随波逐流的故事……然后被挑战比较严重,后来换个说法:Why not?

有这个机会,大家都信任你,又不给你压力,又能学习到新领域的知识,和新的人打交道,同时还能继续沿用交互设计的技能知识,Why not? 然后对方就颔首了,所以讲故事的角度是多么重要。

说点这段故事中,让我真正坚定起来的两句话:

 一个老大说:“给你机会去试错,错了大不了重头再来。”

 另一个老大说:“设计师盯着皮肤看,产品经理要了解整体的经络组织和骨骼,更重要的是要知道数据作为血液如何在流通。你有机会深入皮肤之下看一下,再回来看皮肤感觉又不一样了。”

 
所以我是带着这个人体经络图的即视感忐忐忑忑接下了数据产品经理这个新的岗位的。

不用别人说,我也知道有两座大山需要翻:1. 数据 2. 产品经理。

 
二. 本文的目标

不指导就业,不提供数据分析解决方案,不承诺对任何人都必要有效。根据个人仅有的经验、心得,我只能:

1. 面向对数据分析、数据产品有兴趣但是又有点畏惧的交互设计师、产品经理

2. 希望能够让你们“减少对于数据世界的恐惧”,使用数据的语言“顺畅沟通”。

三. 欢迎进入数据的世界

 

还记得你学习游泳的经历吗?记得我当时就是怎么都不敢下水。

我的教练告诉我的最有用的一句话是:你会憋气吧?你试试在浅水区里什么都不要做,松开栏杆,憋住气,让自己沉下去。如果你受不了了,反正你一站就站起来了。

我一想,也对,反正浅水区嘛。于是第一次松开了栏杆。

奇怪的事情发生了。我居然不会沉入水底耶~甚至透过泳镜看别人的脚扑腾扑腾!原来水里的世界没有那么的可怕!

克服了这个对水的恐惧后,才开始慢慢学习各种动作,开始享受水的乐趣。

数据的世界对于不了解它的人而言,正如这神秘的水一样。

那么我提供的让你不怕“水”的心得有:两个词、一个立方体、一张流程图

你准备好了吗?

1. 两个词

先复习一下你可能也听过的两句话:  

  • 如果你无法量化,那就无法很好管理。

  • 无细分,不分析。

第一句话来自管理大师彼得德鲁克,第二句话则是分析界的金玉良言了。

这两句话里就隐含着我说的这两个词。

接下来,再来看一句话:成交10亿人民币!

肯定没有人单独说这样的话,一般情况,这句话前都要加上一些“定语”,比如“今年截至到7月份,全国蔬菜市场”,或“去年9月,女装市场”,或“过去N年,东三省猪肉市场”……等等。

这些语境里,也隐含着这两个词。

再来看一张图:

这是刚入门时,为了追求PPT的好看,做的一张概念图。虽然当时还没有体会到两个词的重要,但是从感觉上,我画了以上的图,有位前辈说,维度还不够。

哦,我后来才知道,中间的圈里,我大部分呈现的是度量,而下面的几个圈,我列了重要的一些维度。至于上面的几个圈里,应该是呈现的分析专题或功能。

至于你平时有机会接触到的各种数据可视化,报表,也基本上脱离不了这两个词,比如,若你去客服部门分析客户来电量(下图仅供演示,非真实场景数据)

1. 你按时间趋势来看总体来电量。当你发现某个月或某周来电量波动较大,你就需要添加别的“角度”来进一步细分。

2. 你按热线来细分来电量,看看来电拨打的什么热线。

3. 当你发现某个热线来电量波动异常后,你又需要进一步细分,看看此热线的来电是被什么接起公司承接的……

下面不卖关子了。有些人可能已经猜到了,我要分享的这两个词就是:维度+度量。

下图中,我将重点放到大道至简几个字,以及维度+度量上,而维度和度量下面分别放了所在家族的一些其他常用词汇,我稍后会解释。

 
我始终认为在这条路上,我有一个两词之师,当我比较迷茫的时候,他就像当时教我游泳的导师一样,告诉我:你不需要了解那么多,只要了解数据的世界没有那么复杂,知道有什么维度,看什么度量,然后怎么呈现出来即可。

对,他没有时间教我别的,也没有分享过任何文档给我,只告诉了我这句话,但是让我受益至今,因为那一刻,就是恍然大悟。所以我现在也分享给你们。

定义:

1. 度量:即Metrics, 指量化的数值。一般都有个名称,比如网页浏览次数,网页浏览时长,支付宝成交金额等等。平时,我们一般会叫成“指标”,但是在专业语境,你需要知道,指标和度量还是有些差异,比如某些场合,他们会用指标特指一些经过计算的度量结果,比如拿度量A(网站总浏览次数),除以度量B(网站总浏览人数),得到一个新的指标(网站人均浏览次数),用以衡量网站粘性。但是我建议你平时使用两者可以通用。

2. 维度:即Dimension。指我们平时看事物的角度。比如,同样是网站浏览次数(PV),我们可以从日期角度去看,也可以以流量来源去看(来自直接访问的、来自微博的、来自搜索的等),也可以以新老用户分群来看。更多的场景是同时以两个维度的组合去看,比如这样的图,就是同时结合了时间、来源两个维度对网站流量进行分析:

两者你知道如何清楚区分吗?

虽然从定义上,你可以看出明显不同,但是现实中,却还是有人喜欢乱用——把明明属于维度的东西写成“我要看什么指标”,或者喜欢用“我想从收藏人数这个维度去看”,虽然我属于强迫症,喜欢帮别人的需求纠错,被冠以扣字眼的“名号”,但是在这件事情,我一定要抠到底。

而且,你抠清楚了,以后你的世界也清晰很多。

区分的一个方法:维度,一定是有成员值的,且成员值是可以枚举出来的——不管它有多少,大不了你多花点时间去枚举,总之是一定可以枚举的,且会维持一定的稳定性。

比如,日期这个维度,几月几号一定是有限的,一年也就365天,如果是年这个维度,也是一样的。城市这个维度更好理解了吧?

其他你需要了解的:

1. 度量:

  • 除了指标这个有着略略差异的俗称外,有时还会遇到衍生指标这个说法,比如拿指标A和指标B做运算得到的指标C就叫做衍生指标。此外,还要注意可累加以及不可累加的度量说法,比如网站UV(独立访问用户数),这个指标就是典型的不可累加的度量:

  • 除了指标这个有着略略差异的俗称外,有时还会遇到衍生指标这个说法,比如拿指标A和指标B做运算得到的指标C就叫做衍生指标。此外,还要注意可累加以及不可累加的度量说法,比如网站UV(独立访问用户数),这个指标就是典型的不可累加的度量:

  • 某网站1月1日UV=100个,1月2日UV=200个,但是这两天的UV不等于300个,因为1月2日的独立用户数里可能包含了1月1日的用户,所以如果要得到2天的UV,需要重新计算而不能直接相加。而像成交类的金额,不涉及到去重的问题,就叫可累加的度量。

2. 维度:

  • 维度的层次:即Level。有些维度是独立并列的关系,比如城市维度和时间维度。但是有些维度之间有层次关系,比如省份维度和城市维度,行业维度和类目维度,年级维度和班级维度等。有层次关系的维度,则可用于“钻取”场景中,先汇总到比较粗的维度,当有需要的时候,可以层层钻取到更加明细的维度,此时,也会把这些维度叫做某维度类型的不同“粒度”——比如会有一个虚拟的维度类型曰地区维度,而把省份、城市、区叫做地区维的粒度。维度的层次根据不同的需求,可能会钻取到很细(Details),那就是通常我们说的"明细数据"了。比如分析成交金额时,从行业维度,细分到一级类目乃至叶子类目,最后,钻取到某个独立的商品ID(不能再细了),商品ID就是最细小的层次维度。

这么说可能会把你绕晕,那么还是画个图吧(我真的适合当唐僧似的老师……o(╯□╰)o)


 
 如上图所示,左列也即维度,不管是国家、省份、城市,都是维度,但因为他们有层次关系,所以,有时会被描述为地区维度的不同粒度或层次(明白了吧)。而右侧就是每个维度的维度成员了,有时也被叫成维度值。在可累加的度量中,每一个维度值相加,应该等于上级维度的某成员值总和。比如若城市A只有三个区,这三个区的人口总数应该等于城市A的。 

  • 维度的属性:用以描述维度的一些属性,比如上图中“城市”这个维度吧,它可能会有一些属性特征,比如城市类型:省会城市、地级市、县级市等,那么有一个分析需求,可能还会按不同城市类型汇总细分。这种情况,维度的属性会成为分析中的维度。

这时,你可能会明白,平时为什么那么多表单要填写各种字段,这些字段,都可能是分析时的维度哦~

码了这么多,休息一下,给你们放张图:


当时小贝和马云一碰面,无论在阿里还是网络上,都出现了一个两难的问题:到底是选谁当老公呢?(能有这个问题的妹子,你真想多了……),其实这里仔细分析,无非也是涉及到维度和度量两词:

  • 维度:人啊。

  • 维度成员:马云、小贝

  • 度量:众位妹子和弟弟们无非就是按自己心目中的算法给两位成员计算颜值、财富,以及自己心目中的权重,衡量一个综合指数了……我可不敢随便填。

最后,发现两难的选择,只能得到一个结论是:左边的当老公,右边的当爸爸。

点评:做梦吧您。

总结一下:

两个词的应用:无论你听怎么复杂的需求,以及无论你有多么复杂的需求,请有倾向地提炼这两个词,因为这是你做数据产品、数据分析或者可视化设计的基础的基础:


翻了自己的电脑半天,终于翻出一个不敏感的文档,供参考,下图就是移动数据分析中的需求交付模版之一:左侧列举度量,右侧标注出此度量需要看的维度,有时还会注明维度之间是否要交叉组合查询。不展开。


2. 一个立方体

其实本文的精华就在两个词之间了。下面您看不看都成。


立方体在数据的世界里叫做Cube。我想为何有立方体这个概念,应该是它很形象地能够表达出多维的概念,至少有3维,如上图所示,成交100亿的金额,是一个大立方体的总量。如果按季度、行业、地区三个维度来分析,我们可以清楚地知道第三季度A地区女装行业有多少——也即我用橙色标注的那一个切块的量,是吗?

那如果是我要知道B地区女装行业四季度的成交总和呢?你怎么切给我?

空间感好的同学已经知道怎么切了,你知道吗?


 
这只是切块。我们还可以切片,比如我想要知道B地区所有行业的四个季度的成交总和,怎么切?我想要知道男装行业所有地区四个季度的成交总和怎么切?

具体怎么切,你们自己意会吧,篇幅有限,不展开。

现实分析场景中,恐怕不只三个维度,比如还要加上销售部门维度、销售渠道维度呢~ 那么立方体可就复杂了,空间感差一些的同学,就想想不出来这个立方体什么样子了吧,事实上,数据开发同学会用雪花模型或者星型模型去建设这些立方体。你只要有这个立方体的概念就可以了……数据分析就是像玩魔方一下,拨弄着这些立方体。

在网上找了一个包含了我刚才说的钻取、汇总的概念的立方体再给你们感受下,想要详细学习的同学可以搜索“数据立方体”继续研究。


 
我刚才举的那几个切块、切片的案例有毛用啊?

现实生活中,你提需求的时候,不可能让你画个立方体吧?是的,我们是以表格的方式去看数据的,比如第一个切块,是什么表格呢? 站在行业负责人,尤其是女装负责人的视角,可能是这样的一个报表:


 当然,如果是某地区销售经理,有可能是这样的:


所以就有各种数据透视分析的视角。

总结: 

数据分析就是在拨弄各种数据立方体,你可以切片、切块、钻取、汇总,你所玩的魔方每一块,就是一个具体的度量值,是什么数字,则是多种维度交叉后的结果。

工作实践中,数据产品经理会考虑做出更加方便易用的“立方体玩法”以供普通用户使用:

如,在分析客户来电的自动语音导航服务中,我们就可以按不同的维度去对比看用户在导航菜单里按键量,下图所示是“按菜单对比”的界面,在“对比按”中可以进行切换其他对比视角。

至于左侧的两个筛选,也即指筛选数据集合(切片或切块了),比如限定某几个热线和菜单去看。



3. 一张图片

了解了维度、度量两个词,又有了立方体之概念,让我们再来看数据是怎么产生,怎么被放到用户界面上供查询使用的。  

  • 巧妇难为无米之炊。数据不是凭空产生的,当需求方提出想要什么样的数据分析的时候,首先要检视的是,TA需求中涉及到的维度是否确定被采集到?度量的计算成本是否高?比如若一个需求想要分析不同买家分层的留存,买家分层是一个新维度,需求方是按骨灰级、高级、新手等对买家进行分层。且什么叫骨灰级?系统里并未对买家进行打标记,且不同类目的骨灰级算法还不一样,加上算法定义本身也在磨合。这种情况下,我们应该和需求方一起推动业务系统完成打标,而不是自己接下这个需求,在数据仓库ETL环节完成。

  • 了解ETL:这个是做数据工作绕不开的术语,E(抽取、清洗)——T(转换)——L(装载),抽取是从各个业务系统中抽取所需的数据,然后完成语义层、逻辑层的转换,比如不同系统中记录销售渠道这个维度,有的叫做saleschannel,有的叫做channel,需要转化为同一个概念。装载,也可以理解成抽取、清洗、转换好了,装载到另外一个空间里,供多维查询服务应用调用。

 

当然,则个领域,水很深,我只能简单描述一下,再深的也担心大家晕菜了——毕竟本文是写给非数据人的。(其实作者本人也讲不粗来了……哈哈)

四. 应用


我说了,我无法教你具体复杂的数据分析案例。我希望能够借助本文和你分享下如何建立起比较专业的数据分析思路——数据产品经理本身也应该可以是优秀的数据分析师。

1. 三部曲——建立分析框架

  • 建立分析框架:了解业务、以及业务想要什么(目标)。

  • 提交数据需求:  根据你的访谈、梳理,得到业务流程、业务愿景以及目标,那么就可以和需求方共同确认“看什么”以及“怎么看”。好的数据产品经理或者数据分析师,永远不是坐等需求方提出他要看什么度量和维度,而是要引导对方看更合适的东西以回答他关于目标是否达成的问题。

  • 进行数据分析:使用多种维度,进行总体的、细分的、多维的分析,当发现问题时,能够使用这些维度的组合帮助用户找到影响原因。

一切都基于你有多了解业务:

下图是几年前的老图了,左侧是业务流程图(业务流程图怎么画),右侧是概念中的数字体系示意(可视化是为了更好和需求方沟通)。

 

PPT里因为存在具体业务的案例,不便分享,到此为止吧。如果有时间的话,我还是会编脱离具体业务的案例的……这就是写博客的苦逼之处,工作中都是工作的案例,为了写篇博客,还得自己再编一套有板有眼的故事……

2. 三部曲——提交数据需求

 

 故意放了张你可能看不清楚的图(o(╯□╰)o),所以别问我要大图了,谢谢~

左侧就是度量分类和度量,从标注了颜色底色开始的就是维度了,标了颜色的也即此指标需要被计算到所需的维度,灰色的表示不需要,黄色和绿色(以及上面的数字1、2),表示优先级不同,黄色的当然是高优先级了。比如黄色上我写的数字应该是1,也即第一优先级。

实际上,依据不同的场景,当然可以有很多简化,比如无需标注优先级之类的。

此外,还需要单独提供维度和度量的详细口径定义说明表格,这时最好和分析师一起,详细进行确认。

3. 三部曲——进行数据分析

 你提的需求不管是做成报表、还是做成具体可视化的界面,总之如果已经开发出来了,就来玩魔方吧。只是报表有可能你得导出来在EXCEL里玩魔方。(即使是可视化的界面,也依赖于对方设计得是否易用)

 最简单的分析是逐级钻取,如:

复杂的则需要多维交叉:

比如,当分析某个APP的Active users, 当我已经锁定某个省份有问题的时候,我们既可以继续钻取到城市去明晓细节,又可以交叉到品牌,看不同省份间品牌偏好的问题。比如是否小城市中安卓品牌的人更加活跃。




五. 留点作业:要记得思考哦

1. Detail页面的设计师被追责,怎么应对?

某日,负责搜索结果页(LIST)的设计师来找商品详情页(Detail),他好容易做了LIST页面的改版,而且结果也确实喜人,从List页面到Detailye页面的转化率确实提升了(比如原来100万的人来到List页面,只有40万继续点击到Detail,改版后,变成了50万)。但是不幸的是,从Detail到订单的转化率却没有提升,却下降了。

 
请问,如果你是Detail的分析师,如何和List的分析师一起想办法分析什么原因?

2. 挂羊头卖狗肉的Banner,怎么用数据证明其反而有害无益?

有时为了爆眼球效应,你的老板会要求你做个华而不实的banner,比如明明活动页(Landing Page)里都是一些屌丝产品,却偏偏在banner上用屌丝的价格放一些高大上的产品图片。想要吸引人点击进去。而确实点击效果很好!过去放凤姐一晚,100个人里只有5个人点,现在放了林志玲一晚,100个人居然有99个人点击。老板很高兴,而且确实成交额似乎是比过去略微高那么一点点了。现在,除了用道德说辞说服老板不要这么做,还有别的方式吗?


五. 最后,唠叨几句

最后,分享给各位的心得是:

  • 你现在也知道,数据本身需要经过分析师的定义、数据源系统的采集、数据开发的开发以及展现设计,任何一个环节,可能会产出错误的数据,所以数据本身未必100%靠谱。

  • 此外,数据的解读,需要保持谨慎批判之心。比如同样是小明语文得了59分,如果你不了解上下文以及历史趋势的话,会认为小明没考好,有的人甚至会得出小明语文不好的结论。而要是了解他上个季度每次语文考试都只有30多分,又会得出小明虽然语文不好但是明显进步了。而要是了解到这个班级平均分数只有49分,你又会觉得小明简直太赞了!所以,单纯的一个数字本身没有任何意义,要窥一斑,更要知全貌。

  • 此外,数据会被有心计的故意利用,而向你呈现部分事实(他不是在弯曲事实,而是只呈现对他有利的一面),数据本身有那么多维度以及层次,导致解读的方式完全可以被利用。

所以,要记得我本文的最后提点:


对于产品经理和分析师来讲,最针对的是我们基于对于业务的深入理解而产生的直觉。不要盲目被数据拉着走。只有有较好的直觉,我们才能有更合理的假设,有了这个合理的假设,才能够更好解读数据以及提数据的需求。而不是在各种数据的海洋里玩数据的游戏而浪费时间。


————————关于文末的思考题更新——————————

多谢大家的回复,其实思考题没有对与错,只是不同的思考分析方式。

我这里也放一下个人的建议,但是未必是最佳答案,请大家拍砖。

思考题一: 如何和LIST的设计师一起使用数据找到原因?

首先,我面对这些问题,喜欢先做极端的假设,即假设一个场景,真的会发生题目中的故事。比如,LIST页面放出了一些极其吸引人的元素,然而诱惑用户点击后,到了DETAIL揭晓谜底的时候,发现噱头并不是真的,那么这批上当的用户,当然不会再点击到订单页面下单了。但是,碰巧这部分冲着这个诱惑点来DETAIL的用户,也对商品有了兴趣,也会漏掉一些量到Order页面,但是可想而知,这个转化率的增量绝对不如从L到D。 

如果基于这样的一个假设,肯定不是先从数据出发……首先得了解LIST页面到底做了什么吧?是去掉了一些有助于用户决策要不要点击到D的关键信息?还是添加了一些Detail页面无法很好承接的承诺?或许,当了解了客观现实后,答案就迎刃而解了。

那么,万一有人继续纠结,凭什么是这些改动点造成的呢? 那么回归到数据上,我会继续假设,如果是以上的故事,按说如果老的用户被List页面骗了一次后,第二次肯定会减少尝试点击。而新的用户可能继续会点击。那么可以对用户进行区分数据统计,分成有过N次转化行为的老访客,以及从来没有过转化行为的新访客(或转化次数小于N次),看两者的转化率是否有区别,如果发现新访客的转化率大大低于老访客,那么就可以推导是否LIST增加的元素主要吸引的是新用户(首次点击)。 后续,为了避免陷入数据的迷思,建议做个定性的验证,抽样一些用户,做个简单的可用性测试或电话调研。 

总之我个人喜欢先定义一个假设,然后用简单的维度分类对数据进行切分,看是否能够找到分析点,然后借助部分定性的调研方式挖掘下可能的原因,再对原因做定量的数据观测。 

思考题二:如何说服老板不要挂羊头卖狗肉?

其实是同样的思路。假设你第一次被志玲姐姐骗了,点击进去之后发现是凤姐,之后又被志玲姐姐骗了一次,点击进去发现是凤姐,那么请问,当第三次来了以后,你还会那么冲动地点击志玲姐姐吗?基于这个假设,我也会考虑把用户进行区分新老,然后看两者的点击率区别,可能会得到一个结论,点击率的增加来自新用户。其次,考虑点击到凤姐之后的转化率,看新老对于后续转化的贡献,可能会发现,老用户的转化率程下降趋势,即使新用户的转化率可以弥补,但是长远的趋势也是不乐观的。