简介
目录
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书在第3章至第8章中安排了丰富的实践操作,以便读者更好地学习和掌握数据采集与预处理的关键技术。 本书可以作为高等院校大数据专业的大数据课程教材,也可供相关技术人员参考。
Copyright(C) 人民邮电出版社电子书平台 , All Rights Reserved
京ICP备15015578号-3 | 出版物经营许可证 新出发京批字第直0673号 | 京公网安备110101000001号