V
主页
京东 11.11 红包
【君智课堂】数据处理 | 简单数据清洗(大数据实验课程系列)
发布人
【大数据数据处理】数据源来的数据是混杂的、多制式的,如果要进行数据分析,需要对这些来自于数据源的数据进行处理。数据处理包括数据清理、数据集成、数据归约、数据变换等工作环节。 小白按照视频的指引可以一步一步进行相应实验~ 实操请点击网址【http://www.databead.com】进入君智高校大数据双实平台~ 简单数据清洗:从各类数据源来的数据,由于人为缺陷、错误和信息系统设计上的失误,会使得数据存在着在值缺失、错误或异常值,所以用户首先需要对数据进行预处理,使其更加规范化以适合后期的分析操作。“简单数据清洗”算子能够提供对数据过滤,去重,内容提取,日期格式处理等方法。 在学习大数据的路上,君智与你并肩同行! 欢迎点赞、收藏、关注,一键三连~ 关注【君智大数据】公众号,获取更多大数据相关专业知识!
打开封面
下载高清视频
观看高清视频
视频下载器
【君智课堂】Adult数据集预处理之数据变换(分析流实验课程系列)
【君智课堂】常用语言 | Java:数据接入之读取文件(大数据实验课程系列)
【君智课堂】常用语言 | Scala:数据处理之数据去重(大数据实验课程系列)
【君智课堂】分析Adult数据中部分连续变量的分布(分析流实验课程系列)
【君智课堂】常用语言 | Scala:数据处理之日期转换(大数据实验课程系列)
【君智课堂】基于Adult数据集挖掘高收入和低收入人群的关联规则(分析流实验课程系列)
【君智课堂】数据源 | 流TCP源(大数据实验课程系列)
【君智课堂】常用语言 | Scala:数据处理之排序(大数据实验课程系列)
【君智课堂】常用语言 | Java: 数据处理之日期转换(大数据实验课程系列)
【君智课堂】环境搭建 | Logstash(大数据实验课程系列)
【君智课堂】数据源 | 读远程文件至HDFS(大数据实验课程系列)
【君智课堂】常用语言 | R语言:数据处理之数据去重(大数据实验课程系列)
【君智课堂】常用语言 | Python: 数据接入之读取文件(大数据实验课程系列)
【君智课堂】数据源 | HBase动态数据读取(大数据实验课程系列)
【君智课堂】常用语言 | SQL:数据聚合(大数据实验课程系列)
【君智课堂】数据源 | 文本数据源(大数据实验课程系列)
【君智课堂】数据源 | 按目录读取excel文件(大数据实验课程系列)
【君智课堂】数据源 | 数据库并行加载(大数据实验课程系列)
【君智课堂】环境搭建 | Splunk(大数据实验课程系列)
【系列课程4】大数据主流分析算法及场景-1:求“f”算法内常用的求值算法
【君智课堂】数据源 | 文本目录数据源(大数据实验课程系列)
【君智课堂】环境搭建 | Memcached(大数据实验课程系列)
【君智课堂】环境搭建 | Mesos(大数据实验课程系列)
【君智课堂】数据源 | DF保存到HDFS(大数据实验课程系列)
【君智课堂】数据源 | Hive动态读取数据(大数据实验课程系列)
【君智课堂】环境搭建 | kettle(大数据实验课程系列)
【君智课堂】环境搭建 | Hive(大数据实验课程系列)
【君智课堂】常用语言 | Python:数据可视化之直方图(大数据实验课程系列)
【君智课堂】环境搭建 | Sqoop部署(大数据实验课程系列)
【君智课堂】环境搭建 | Storm安装与操作(大数据实验课程系列)
【君智课堂】常用语言 | Java:数据处理之map和reduce(大数据实验课程系列)
【君智课堂】数据源 | DF保存到固定前缀HDFS(大数据实验课程系列)
【系列课程4】大数据主流分析算法及场景-4:无监督-聚类-Kmeans算法
【君智课堂】常用语言 | SQL:数据的增、改、删(大数据实验课程系列)
【系列课程4】大数据主流分析算法及场景-3:有监督-预测-线性回归算法
【君智课堂】常用语言 | Scala:数据分析之获取最均值(大数据实验课程系列)
【君智课堂】常用语言 | SQL:之数据查询(大数据实验课程系列)
【君智课堂】环境搭建 | Graphdb(大数据实验课程系列)
【君智课堂】常用语言 | Python:数据可视化之饼状图(大数据实验课程系列)
【君智课堂】环境搭建 | Hbase(大数据实验课程系列)