欢迎来到在线教学平台
问题答疑
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
更多
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
扫码下载Android
扫码下载iOS
教师登录
学生登录
首页
全部课程
公开课
云课直播
新闻公告
数图资源
智汇大讲堂
教师登录
学生登录
首页 - 课程列表 - 课程详情
返回
大数据采集与清洗
课程类型:
选修课
发布时间:
2024-04-11 15:29:30
主讲教师:
课程来源:
建议学分:
0.00分
课程编码:
mk002604
课程介绍
课程目录
教师团队
{1}--数据之潮:大数据采集与清洗概述
[1.1]--1.1初识大数据采集与预处理 徐建国(1)
(14分钟)
[1.2]--1.2数据清洗概述 徐建国(1)
(18分钟)
[1.3]--1.3认识ETL 徐建国(1)
(15分钟)
{2}--流动的数据江河:探索Flume和Kafka的数据采集
[2.1]--2.1 Flume简介 王子童(1)
(9分钟)
[2.2]--2.2 Flume安装 王子童(1)
(17分钟)
[2.3]--2.3 基于Flume的系统日志采集 王子童
(13分钟)
[2.4]--2.4 Kafka简介及安装 王子童(1)
(20分钟)
[2.5]--2.5 Flume+Kafka采集项目 王子童
(15分钟)
{3}--数据的炼金术:Kettle初体验
[3.1]--3.1Kettle环境部署 王娟娟(1)
(11分钟)
[3.2]--3.2Kettle之转换 王娟娟(1)
(19分钟)
[3.3]--3.3Kettle之作业 王娟娟(1)
(15分钟)
{4}--ETL之舞:探索数据的抽取
[4.1]--4.1文本抽取 王娟娟
(14分钟)
[4.2]--4.2抽取web数据 陈荣
(12分钟)
[4.3]--4.3抽取数据库数据 陈荣
(9分钟)
{5}--ETL之舞:探索数据的清洗与转换
[5.1]--5.1数据去重 陈荣
(10分钟)
[5.2]--5.2缺失值处理 陈荣
(15分钟)
[5.3]--5.3异常值处理 杜慧(改)
(17分钟)
[5.4.1]--不一致数据转换(上)
(8分钟)
[5.4.2]--不一致数据转换(下)
(18分钟)
[5.5]--大数据采集与清洗(样片)
(18分钟)
[5.6]--5.6商务规则的计算 杜慧(1)
(14分钟)
{6}--ETL之舞:探索数据的加载
[6.1]--5.7数据加载 杜慧(1)
(15分钟)
{7}--绿影探密:校内植物图像采集
[7.1]--视觉科学创新工作室“植物分类识别“项目的介绍李鹏(1)
(5分钟)