写个关于GA和GTM的PDF

想写个PDF的最初想法是首先自己工作中大量使用GA和GTM相关东西,在使用的过程中苦于中文文献太少,在电商平台也发现鲜有这类专业书籍,基本遇到问题都是Google一大堆英文的资料;其次在一些社交平台发现还是有不少人在交流这个工具的使用,但大部分都是比较简单的问题,所以心生写一个给大家做参考,让大家少走弯路。

关于我个人,我是GA小站的博主 微风诗雨,多年事数据分析工作:毕业之初在深圳电视台电视购物频道的电子商务中心做数据分析,主要负责web端流量、产品品类和用户行为分析;之后进入一家O2O创业公司,历经天使轮和A轮,主要负责运营数据分析和部分SEO工作;目前在一家外企研发部任职数据分析工作,工作中大量应用Google Analytics和Google Tag Manager,积累了不少的经验,对这两个工具还是比较熟悉,当然也用其他软件,如R和Python。

下面是我构思这个初步框架,如果觉得有哪部分遗漏的可以给我发邮件,初步计划是在年底写完,邮箱haran.huang@gmail.com.
文章框架:
undefined
各章节目录:
undefined

undefined

 

undefined

undefined

undefined

 


来源:GA小站

GA301-常用数据分析方法及工具

写在前面,本文是根据触脉的公开课目录按照本人理解写的,如果有理解错误的,还请指出。

GA301-常用数据分析方法及工具

1、常用的定量分析方法
a、象限分析:数据图形化
1、四象限分析
四象限分析方法也叫波士顿分析方法,四个象限具有不同的定义和相应的战略对策。主要应用在市场营销领域,对这个的认识还要源自于大学的市场营销课程,这个分析方法在定位和分析问题上还是蛮有用的,下面举一个实际的例子,关于广告评估的,利用CVR传化率和CTR点击率来分析
GA301-常用数据分析方法及工具

横纵轴划分出四个象限,分成四类:
第一象限的点击率和转化率都比较高,这是满意消费者,需要促进,加大投入,力促取得规模效应(这是经济上的一种分析方法,用于最优化,取的最好效益)
第二象限是低点击率,高转化率,问题是处在广告上面,属于糟糕的广告,这就需要定位是Banner还是广告语的问题,再针对性调整
第三象限是低点击和转化,这是由于受众的问题,是广告定位不精准用户导致,这就需要对广告的受众做重新定位
第四象限是高点击率和低转化,这部分受众有兴趣,但进到页面后地转化,产品难以满足需求,可能是价格因素,也可能是知名度等导致用户迟疑不转化,这个需要具体分析后在做策略,如果是价格因素,可以选择在再营销的时候降价,或捆绑销售,降低访客的心里价位;或赠送等,如果是知名度问题,则找知名的第三方做背书~
这就是通过波士顿分析方法来定位问题和通过不同的策略来解决问题的实例,可以看懂这种方法通过分类,提供的解决方法更具针对性。

2、二维象限分析
是波士顿矩阵分析的一个变形,只是使用第一象限,在通过两个维度交叉分成四块,针对四块区域使用不同策略
GA301-常用数据分析方法及工具
明星:需要持续投入,扩大规模
现金牛:增长空间有限,需要通过促销维持产品,适当退出新的
问题:增长率高,市场占有率低,这个是后续的主力,需要调整策略,提高市场份额
瘦狗:需要砍掉的

b、频数分析:数字的形状
图形的作用都是直观展示
1、直方图
GA301-常用数据分析方法及工具
可以看到2~6到达的人数最多,其他时间段较少

2、热力图
GA301-常用数据分析方法及工具
清晰看到用户的点击渠道在左上角

选择图形也有一定的技巧:
单个指标是用柱状或折线
多个指标时用折线
涉及比例的用饼图
要看两者关系的用散点图
多维比较的用雷达图
维度和比例一期的用组合图
此外还有可视化,如地图上做柱状图,页面的热力图等

c、平均数、中位数和众数哪一个更具代表性
GA301-常用数据分析方法及工具
分布均匀用平均数
数据有极值是用中位数
数据存在明显集中趋势时用众数
所以想知道那个更具代表性的时候需要知道数据的分布,比如看数据的描述性统计,箱形图,再决定哪一个指标描述数据

d、相关性分析:发现变量之间的内在关系
1、相关性分析的应用场景
GA301-常用数据分析方法及工具
相关性是描述变量之间的关系,有正相关和负相关,一个变量随着另一个变量的变化而增加或减少,比如投入和产出,广告费用和访客,访客和消费

2、相关性分析的误区
相关性分析是一种非确定性关系,并没有一个明确的函数关系,只能说两者关联的强弱

e、方差和中心极限定理:问卷调查的结果是真实的吗?
方差是描述数据离散程度的一个度量,方差越大,数据越分散
中心极限定理是概率论中描述随机变量数量越多的时候的分析渐进与正太分布,也就是变量如果是随机的,数量越多,那么这个变量就应该是属于正太分布
应用在问卷调查就是,将问题选项的量化后,用检验看是否服务正太分布,判断这个问题的结果是否具有参考意义

f、趋势分析:预测分析的第一部
通过相关分析,可以知道数据的趋势,可以知道是正相关还是负相关,对数据的走势有个了解,如果是正相关,加大自变量的投入能促进因变量的增加

g、线性分析:预测分析的开始

1、散点图
2、找到‘最佳’的那根线
简单一点就这一节就是做线性回归,流程基本是:数据清洗,散点图,建模,模型检验,预测
数据清洗:对缺失值做处理,对极值剔除
散点图:主要看数据趋势走势,选择变量
建模:建立模型
模型检验:系数,模型的显著性,拟合度,如果是多元的需要做残差检验
预测:就是用建立的模型预测后面的情况
通常关于推广费用会有淡旺季,用时间序列更适合
详细参考:机器学习-线性分析(直接用Excel也可以做,Excel做线性回归)

h、回归分析:预测分析的高潮
预测后面的走势
i、边际分析:找到你关注的‘最大点’
这个是经济上的一个分析方法,主要是为了确定生产要素的合理/最优投入
在经济学上,边际是指每单位投入所引起的产出的变化。边际分析方法在管理经济学中有较多的应用。它主要分析企业在一定产量水平时,每增加一个单位的产品对总利润产生的影响。可以用以下的公式来说明。
公式:边际值=△f(x)/△X
其中,X代表投入,f(x)代表产出,表现为X的函数;△表示变量。
假设基数X处在变化中,那么,每增加一个单位的投入,这个单位所引起的产出的增量是变化的。

2、常用的定性分析方法
a、可用性测试:让用户告诉你怎么优化你的产品
本人工作的单位都没用这种方法,估计实际用这种方法的单位不多,整个周期花费较多,得到的也只是个体的结论,可能对整体还是有偏颇

b、A/B测试:最简单的分离式组间实验
1、A/B测试的过程
2、A/B测试与goolge analytics
A/B测试在GA里面有个内置的功能,详情参考:也说如何在GA中做AB测试

3、推荐一些分析和可视化工具
分析工具:Excel,R,SAS
可视化:Echarts

4、分析师工作时的注意事项
1、通用的数据分析思路,简单的就是我会一直问自己的:是什么,为什么会怎样,怎么办,详细的就是如下:
第1步:发生了什么?
第2步:问题出现在哪里?
第3步:为什么这件事情会发生?
第4步:需要采取什么行动?
第5步:下一步将发生什么?
第6步:可能发生的最好结果是什么?

2、拿到/看到数据要确定数据的统计口径和定义,数据的差异问题所有往往统计口径问题
GA301-常用数据分析方法及工具
GA301-常用数据分析方法及工具


来源:GA小站

机器学习——主成分分析

undefined
1、加载数据做成分分析:

data9.2<-data.frame(  x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7),  x2=c(92,93,96,94,100,101,105,112,112,112),  x3=c(17.1,21.3,25.1,29.0,34.0,40.0,44.0,49.0,51.0,53.0),  x4=c(94,96,97,97,100,101,104,109,111,111),  y=c(8.4,9.6,10.4,11.4,12.2,14.2,15.8,17.9,19.6,20.8))data9.2.pr=princomp(~x1+x2+x3+x4,data=data9.2,cor=TRUE) #做主成分分析summary(data9.2.pr,loadings=TRUE)

undefined
第一个主成分的方差贡献率为98.5%,已经足够选取1个主成分
2、现在生成主成分变量对主成分做回归:

data9.2.pre<-predict(data9.2.pr)data9.2$Z1=data9.2.pre[,1]data9.2$Z2=data9.2.pre[,2]lm.data9.2<-lm(y~Z1,data=data9.2)#对主成分建立回归分析summary(lm.data9.2)#模型检验

undefined
可以看到模型各项检验都良好
3、接下来做系数变换:

beta<-coef(lm.data9.2) #系数变换A<-loadings(data9.2.pr)x.bar<-data9.2.pr$centerx.sd<-data9.2.pr$scalecoef<-(beta[2]*A[,1])/x.sdbeta0<-beta[1]-sum(x.bar*coef)c(beta0,coef)

undefined
回归方程:Y=-23.7777186+0.02992643X1+0.13365158 X2+0.08361156X3+0.16965187X4
源码:

data9.2<-data.frame(  x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7),  x2=c(92,93,96,94,100,101,105,112,112,112),  x3=c(17.1,21.3,25.1,29.0,34.0,40.0,44.0,49.0,51.0,53.0),  x4=c(94,96,97,97,100,101,104,109,111,111),  y=c(8.4,9.6,10.4,11.4,12.2,14.2,15.8,17.9,19.6,20.8))data9.2.pr=princomp(~x1+x2+x3+x4,data=data9.2,cor=TRUE) #做主成分分析summary(data9.2.pr,loadings=TRUE)data9.2.pre<-predict(data9.2.pr)data9.2$Z1=data9.2.pre[,1]data9.2$Z2=data9.2.pre[,2]lm.data9.2<-lm(y~Z1,data=data9.2)#对主成分建立回归分析summary(lm.data9.2)#模型检验beta<-coef(lm.data9.2) #系数变换A<-loadings(data9.2.pr)x.bar<-data9.2.pr$centerx.sd<-data9.2.pr$scalecoef<-(beta[2]*A[,1])/x.sdbeta0<-beta[1]-sum(x.bar*coef)c(beta0,coef)
评论

/upload/1_14_o.png” alt=”undefined” />
1、加载数据做成分分析:

data9.2<-data.frame(  x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7),  x2=c(92,93,96,94,100,101,105,112,112,112),  x3=c(17.1,21.3,25.1,29.0,34.0,40.0,44.0,49.0,51.0,53.0),  x4=c(94,96,97,97,100,101,104,109,111,111),  y=c(8.4,9.6,10.4,11.4,12.2,14.2,15.8,17.9,19.6,20.8))data9.2.pr=princomp(~x1+x2+x3+x4,data=data9.2,cor=TRUE) #做主成分分析summary(data9.2.pr,loadings=TRUE)

undefined
第一个主成分的方差贡献率为98.5%,已经足够选取1个主成分
2、现在生成主成分变量对主成分做回归:

data9.2.pre<-predict(data9.2.pr)data9.2$Z1=data9.2.pre[,1]data9.2$Z2=data9.2.pre[,2]lm.data9.2<-lm(y~Z1,data=data9.2)#对主成分建立回归分析summary(lm.data9.2)#模型检验

undefined
可以看到模型各项检验都良好
3、接下来做系数变换:

beta<-coef(lm.data9.2) #系数变换A<-loadings(data9.2.pr)x.bar<-data9.2.pr$centerx.sd<-data9.2.pr$scalecoef<-(beta[2]*A[,1])/x.sdbeta0<-beta[1]-sum(x.bar*coef)c(beta0,coef)

undefined
回归方程:Y=-23.7777186+0.02992643X1+0.13365158 X2+0.08361156X3+0.16965187X4
源码:

data9.2<-data.frame(  x1=c(82.9,88.0,99.9,105.3,117.7,131.0,148.2,161.8,174.2,184.7),  x2=c(92,93,96,94,100,101,105,112,112,112),  x3=c(17.1,21.3,25.1,29.0,34.0,40.0,44.0,49.0,51.0,53.0),  x4=c(94,96,97,97,100,101,104,109,111,111),  y=c(8.4,9.6,10.4,11.4,12.2,14.2,15.8,17.9,19.6,20.8))data9.2.pr=princomp(~x1+x2+x3+x4,data=data9.2,cor=TRUE) #做主成分分析summary(data9.2.pr,loadings=TRUE)data9.2.pre<-predict(data9.2.pr)data9.2$Z1=data9.2.pre[,1]data9.2$Z2=data9.2.pre[,2]lm.data9.2<-lm(y~Z1,data=data9.2)#对主成分建立回归分析summary(lm.data9.2)#模型检验beta<-coef(lm.data9.2) #系数变换A<-loadings(data9.2.pr)x.bar<-data9.2.pr$centerx.sd<-data9.2.pr$scalecoef<-(beta[2]*A[,1])/x.sdbeta0<-beta[1]-sum(x.bar*coef)c(beta0,coef)

来源:GA小站

Leave a comment