当今移动互联网盛行,相当于应的移动广告市场也呈指数式增长。为了提高移动端的广告投放效率,实现更为精准有针对性的投放策略。本报告将对采集到的11万条关于手机客户端打开应用数据和广告点击数据进行分析研究
-
数据的提取,因果关系的确定
-
自变量太多如何筛选可能存在关系的变量
-
模型选择,当然是解释力度大的,有意义的
-
中介变量与调节变量检验
1.个人移动手机应用行为特征与移动广告类型点击行为的相关性;
2.个人移动手机应用行为特征对移动用户点击推送广告概率的影响;
3.实现广告推送的策略;
表中研究数据选取的8个字段及属性 数据集中的每一条记录就是一个用户在某一时刻打开某个应用的记录,其中字段ac记录用户对广告条的操作。一般广告在用户打开应用30秒后,移动广告商随机推送的广告条开始滚动播放,每条广告停留约10秒到15秒不等的时间。
将数据处理后,对打开广告的数据集进行分类统计:
从统计中可以看出广告类型
ad3
占到所有打开广告的67.96%,而在其中又有将近50%是在app2
中打开的,ad4
打开最少只有总量的2.27%,在app2
中有着63.84%的点击率。
针对这筛选出的11.5万条记录分类统计后,马上进行相关性分析,寻找手机应用在广告的点击分布的规律和关系,对数据标准化分析后得出该表:
表中的相关性我们可以得到不同类型的广告点击行为与用户收入、广告类型、用户的应用选择和移动网络运营商除了少数不显著相关外,其他都显著相关。但是除了
app0
和ad3
负相关其他全是显著正相关。
由于影响用户广告点击率的影响因素较多,对于手机客户端用户点击广告类型可以构建概率模型来研究其内在机制。所以采用Logit回归模型选择广告点击类型为因变量,广告分类为自变量来计量分析探究。具体模型如下:
其中,$app_i$
代表不同的应用,i$\in$
(0,14); $tc_j$
为不同的运营商,j$\in$
(1,4);GDP为该手机地区的收入水平;RC为广告滚动的条数。
通过SPSS软件把数据导入模型当中进行参数估算。获得了不同的广告类型的点击率参数估算值。编成表格如下,从中看出不同广告类型打开的概率比受到不同的应用显著影响,不同的移动运营商对不同的广告类型打开也存在显著影响,用户所在的区域GDP也显著影响着广告类型的打开。
在研究中的ad1
的广告形式是以文字为本的网站介绍和推广,出现这类广告点击率的概率比和所有客户的手机应用相关,其中在app4
上点击的广告概率最大,而app11
点击广告的概率最低;而ad2
广告是以动态图片的电商商品推荐,这类广告在app4
,app5
上;ad3
则是关于团购和各类优惠券一些应用软件下载,其中在app8
上打开概率最大。
运营商对ad1,ad2
点击率影响概率为负,而ad3,ad4
为正,说明几大运营商用户对后两类广告点击率比前两个大。
根据地区GDP客户所处地理位置对不同广告点击概率影响不同,收入水平越低的地区对ad3
点击的概率越高,因为收入越低的地区对优惠券和团购卡的下载会更加敏感,愿意下载具有折扣的广告。而GDP高的地区对于各类折扣券的来源比较普遍,可以从多种途径获取,所以弱化了该行为。
RC
是在应用中滚动推送的次数,从用户体验来说这种滚动推送的次数越多会使得用户产生厌烦感,干扰用户的正常使用,从参数中看出滚动推送对ad1
和ad2
有正向影响,而ad3
和ad4
的点击概率影响为负,所以在后两个广告类型推送的次数越多会降低用户点击广告的概率。
针对上面的讨论,通过排序来删除不显著的应用,制作出关于不同手机应用下推送广告类型的优先排序
对这个模型生成的概率影响因素做一个排序。当用户打开一个应用,公司可以通过获取该手机客户端的特征,用系统判断用户最有可能打开广告的类型,来进行广告投放可以增大推送被点击的概率。
通过Logistic回归模型可以获得不同的应用程序下用户打开某类广告的概率,但是针对于用户在点击广告条件下是否会对其他广告类型进行二次点击也是需要探讨的问题。
在这贝叶斯网络中可以将用户的点击广告类型行为当作为先验概率。而下一层用户的点击行为作为这个模型需要检验的后验概率。
首先可以先对这15类的应用分成三类便于计算:
根据Logistic模型下各应用上可能打开的广告类型的先验概率在贝叶斯网络模型中可以观察到不同层次的广告类型打开概率,然后利用