岳阳市中小企业公共服务平台
Changsha window platform
联系人
陈***
联系电话
073***6
传真
073***6
邮箱
yyzzrc@163.com
大数据建模与分析挖掘应用
服务介绍:
柜台式服务,电话服务,上门服务,信函服务,网络服务,个人咨询,大讲坛,沙龙,其他服务
服务介绍
Service Introduction
课程大纲:
第一天业界主流的数据仓库工具和大数据分析挖掘工具
大数据分析挖掘项目的数据集成操作训练
、集成数据,整理后形成规范的数据仓库
,一个数据仓库面向一个主题,构建两个数据仓库
,可以给多个不同类型的分析挖掘任务调用
基于Hadoop的大型数据仓库管理平台—HIVE数据仓库集群的多维分析建模应用实践
、核心技术剖析
Server的工作原理、机制与应用
SQL剖析与应用实践
、表操作、数据导入导出、客户端操作技巧
,经过整理后,加载至Hadoop + Hive数据仓库集群中,用于共享访问
Spark大数据分析挖掘平台实践操作训练
,从Hive表中读取数据并在分布式内存中运行
第二天聚类分析建模与挖掘算法的实现原理和技术应用
MLlib中的实现与应用,包括:
a)Canopy聚类(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚类,即期望最大化聚类(Expectation Maximization)
e)以上算法在Spark MLib中的实现原理和实际场景中的应用案例。
分类分析建模与挖掘算法的实现原理和技术应用
MLlib中的实现与应用, 包括:
f)Spark决策树算法实现
g)逻辑回归算法(logistics regression)
h)贝叶斯算法(Bayesian与Cbeyes)
i)支持向量机(Support vector machine)
j)以上算法在Spark MLlib中的实现原理和实际场景中的应用案例。
关联分析建模与挖掘算法的实现原理和技术应用
、推荐分析建模与算法原理及其在Spark MLlib中的实现与应用,包括:
k)Spark频繁模式挖掘算法(parallel FP Growth Algorithm)应用
l)Spark关联规则挖掘(Apriori)算法及其应用
m)以上算法在Spark MLib中的实现原理和实际场景中的应用案例。
第三天推荐分析挖掘模型与算法技术应用
MLlib中的实现与应用,包括:
a)Spark协同过滤算法程序示例
b)Item-based协同过滤与推荐
c)User-based协同过滤与推荐
d)交叉销售推荐模型及其实现
回归分析模型与预测算法
(多元回归)实现访问量预测
+Spark实现回归分析模型及其应用操作
图关系建模与分析挖掘及其链接分析和社交分析操作
GraphX实现网页链接分析,计算网页重要性排名
,互联网用户的行为关系分析任务的操作训练
神经网络与深度学习算法模型及其应用实践
Network的实现方法和挖掘模型应用
a)传统神经网络的训练方法
b)Deep Learning的训练方法
a)CNN(Convolutional Neural Network)卷积神经网络
b)RNN(Recurrent Neural Network)循环神经网络模型
c)Restricted Boltzmann Machine(RBM)限制波尔兹曼机
项目实践
a)Hadoop,Spark,ELK技术构建日志数据仓库
b)互联网微博日志分析系统项目
a)电影数据分析与个性化推荐关联分析项目
上午: 下午:
08:30-10:00 培训 14:00-15:30 培训
10:00-10:10 茶歇 15:30-15:40 茶歇
10:10-12:00 培训 15:40-17:00 培训
12:00 午餐 17:00 主持人总结,培训结束