将商业问题转化为ML技术
refer to <深入浅出:如何从0开始学习大数据挖掘分析> 数盟
很多人认为数据挖掘需要掌握复杂高深的算法,需要掌握技术开发,才能把数据挖掘分析做好,实际上并非这样。如果钻入复杂算法和技术开发,只能让你走火入魔,越走越费劲,并且效果不大。在公司实际工作中,最好的大数据挖掘工程师一定是最熟悉和理解业务的人。对于大数据挖掘的学习心得,作者认为学习数据挖掘一定要结合实际业务背景、案例背景来学习,这样才是以解决问题为导向的学习方法。那么,大体上,数据挖掘分析经典案例有以下几种:
- 预测产品未来一段时间用户是否会流失,流失情况怎么样;
- 公司做了某个促销活动,预估活动效果怎么样,用户接受度如何;
- 评估用户信用度好坏;
- 对现有客户市场进行细分,到底哪些客户才是目标客群;
- 产品上线投放市场后,用户转化率如何,到底哪些运营策略最有效;
- 运营做了很多工作,公司资源也投了很多,怎么提升产品投入产出比;
- 一些用户购买了很多商品后,哪些商品同时被购买的几率高;
- 预测产品未来一年的销量及收益 (待补充)
大数据挖掘要做的就是把上述类似的商业运营问题转化为数据挖掘问题。
一、如何将商业运营问题转化为大数据挖掘问题
那么,问题来了,我们该如何把上述的商业运营问题转化为数据挖掘问题?可以对数据挖掘问题进行细分,分为四类问题:分类问题、聚类问题、关联问题、预测问题。
1、分类问题
用户流失率、促销活动响应、评估用户度都属于数据挖掘的分类问题,我们需要掌握分类的特点,知道什么是有监督学习,掌握常见的分类方法:决策树、贝叶斯、KNN、支持向量机、神经网络和逻辑回归等。
2、聚类问题
细分市场、细分客户群体都属于数据挖掘的聚类问题,我们要掌握聚类特点,知道无监督学习,了解常见的聚类算法,例如划分聚类、层次聚类、密度聚类、网格聚类、基于模型聚类等。
3、关联问题
交叉销售问题等属于关联问题,关联分析也叫购物篮分析,我们要掌握常见的关联分析算法:Aprior算法、Carma算法,序列算法等。
4、预测问题
我们要掌握简单线性回归分析、多重线性回归分析、时间序列等。