使用pyplot的subplots()函数可以在规划好的所有区域中一次绘制多个子图。subplots()函数的语法格式如下查看全文>>
Spark是基于内存计算的大数据并行计算框架,比MapReduce计算框架具有更高的实时性,同时具有高效容错性和可伸缩性,在学习Spark操作之前,首先介绍Spark运行架构...查看全文>>
数据解读是数据分析师的基本功,如果不能充分理解数据分析中出现的各类指标及术语,数据分析工作将很难展开。对于数据分析师来说,了解常用的分析指标和术语是做好数据解读的前提。本节将对数据分析常用指标及术语进行讲解。查看全文>>
执行查询操作时,集合中的文档存在适当的索引,MongoDB就可以使用该索引限制必须检查的文档数量。MongoDB的索引可以分为六种,即单字段索引、复合索引、多键索引、地理空间索引、全文本索引以及哈希索引,六种索引的详细介绍,具体如下:查看全文>>
数据分析师是在不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的人员。目前世界500强企业中,有90%以上都建立了专门的数据分析部门。越来越多的企业意识到数据和信息已经成为重要的智力资产和资源,数据的分析和处理能力成为企业日益倚重的技术手段,这也对数据分析师们提出了更高的要求。然而数据分析岗位的职业前景怎么样?数据分析师有哪些职业要求?需要具备什么素质呢?本节将对这些问题详细讲解。查看全文>>
使用pyplot的boxplot()函数可以快速绘制箱型图,boxplot()函数的语法格式如下所示查看全文>>