棋牌游戏数据分析案例参考:GA的界面

GA的界面

GA的界面
1、导航区
Home:返回到GA账户界面
Reporting:标准报告,数据为非抽样,次日GA会计算出昨天的准确值,保存在内部(注:是非抽样数据)
Customization:自定义报告(非标准报告),数据可能因为session数量而抽样,每次打开时都重新计算
Admin:Account、Property和Views设置相关

2、菜单栏
Dashboards:报告界面,来源可以是标准报告和自定义报告,可以共享出去
Shortcuts:报告快捷键,来源主要是标准报告和自定义报告,不能分享
Intelligence Events:智能事件,主要用于异常监控,同时可以定位异常源
Real-Time:实时,主要是目前访客所在地区,页面,来源,事件等,主要用于事件测试
Audience:受众,主要是受众属性
Acquisition:获取来源,主要是渠道来源相关
Behavior:用户行为,用户在网站的行为,事件记录
Conversions:转化相关,主要是目标,电商,多渠道转化相关

3、报告区
主要报告展示区

4、其他
右上角:
时间筛选:可以筛选不同事件长度和对比
抽样比例:调整抽样比例和计算精度
右下角:
报告生成时间:报告生成的时间

5、细分
做过滤和分类对比,最多能够加4个,加越多会越卡


来源:GA小站

Python中做logistic回归模型

data1 是40名癌症病人的一些生存资料,其中,X1表示生活行动能力评分(1~100),X2表示病人的年龄,X3表示由诊断到直入研究时间(月);X4表示肿瘤类型,X5把ISO两种疗法(“1”是常规,“0”是试验新疗法);Y表示病人生存时间(“0”表示生存时间小于200天,“1”表示生存时间大于或等于200天)
试建立Y关于X1~X5的logistic回归模型
1、读入数据做数据清洗和特征选择:

# -*- coding: utf-8 -*-import pandas as pdfrom sklearn.linear_model import LogisticRegression as LRfrom sklearn.linear_model import RandomizedLogisticRegression as RLRdata1=pd.read_table(r'C:/Users/Administrator/Desktop/data1.txt',sep='s+',encoding='gbk',usecols=(1,2,3,4,5,6))X=data1.iloc[:,:5].as_matrix()y=data1.iloc[:,5].as_matrix()#特征筛选rlr=RLR()rlr.fit(X,y)print(rlr.get_support())print(u'通过随机逻辑回归模型筛选特征结束。')

Python中做logistic回归模型
用随机逻辑回归用于特征筛选,可以看到只有x1 符合
2、将x1做逻辑回归

#建议逻辑回归模型lr=LR()x=data1.iloc[:,:1].as_matrix()lr.fit(x,y)print('模型建立结束')print('模型平均正确率:{0}'.format(lr.score(x,y)))

Python中做logistic回归模型
可以看到模型正确率达到75%。


来源:GA小站

产品优化系列(13)——关键页面的转化与分析

关键页面的识别
对于关键页面,通常可以通过业务理解就可以确定了,比如说:对于电商就是产品列表和产品详情页面;对于门户网就是主页和新闻页面;论坛就是帖子和导航页面。

关键用户行为的识别
就是使用户最终支付购买的是哪些因素,比如用户点击了什么,停留了多久,其实就是找到用户转化或购买前的相关性最高的那个行为,这个行为就是关键用户行为,通过促进该行为来提高转化或购买。
通常这类行为需要通过数据布局来获取数据,简单的可以通过表格将行为数据和销售数据关联起来,用于判断是否那个行为是关键的,严谨一些,可以通过统计学上的一些方法建立模型,量化最重要的关键用户行为。

下面举个以京东举个例子:
透过业务分析可以知道,用户在购买前大部分都会先进入产品详情页面,在产品详情有很多的行为,其中有些是和购买是高度相关的,可以说,如果有这个行为,用户就很有可能购买,我们的想法是找出这样的行为,然后在产品详情页设计上引导用户去实现该行为,从而提升购买数量。
如下图,就是京东的产品详情页面;
产品优化系列(13)——关键页面的转化与分析
假设购买量为Y,点击产品的图片为A,点击商品介绍为B,规则包装为C,售后保障为D,商品评论为D,社区互动为E,下拉为F…………通过这些建立一个多元分析模型Y=aA+bB+cC+dD+eE+fF+……,通过建模分析,检验后得出的模型为:Y=aA+bB+dD,可以知道影响的因素主要是点击产品图片,产品介绍和产品评论,参数有正有负,正的表示提高该因素出销售有促进作用,负的表示该因素会降低销售,假设a和d是正数,b是负数,那就可以确定下一阶段的产品设计方向了:引导用户去点击图片和产品评论。


来源:GA小站

0 回复

发表评论

Want to join the discussion?
Feel free to contribute!

发表评论

电子邮件地址不会被公开。 必填项已用*标注