学习,大数据分析与服务推荐整体建设
大致就是数据抽取、分析、处理、建模等
1、数据抽取
在数据抽取的过程中,尽可能选择大量的数据,这样能降低推荐结果随机性,提高推荐结果的准确性,更好地发掘长尾网页中用户感兴趣的网页。
2、数据探索分析
对原始数据中的网页类型、点击次数、网页排名等各个纬度进行分布分析,获得其内在的规律,并通过验证数据,解释其出现结果可能的原因。
3、数据预处理
在探索分析原始数据的基础上,发现与分析目标无关或模型需要处理的数据,针对此类数据进行处理。其中涉及的数据处理方式有:数据清洗、数据集成和数据变换。通过这几类处理方式,将原始数据处理成模型需要的输入数据。
4、模型构建
在实际应用中,构造推荐系统时,并不是采用单一的某种推荐方法进行推荐。为了实现较好的推荐效果,大部分都结合多种推荐方法组合推荐结果,最后得出推荐结果,在组合推荐结果时,可以采用串行或者并行的方法。
#程序员##大数据#