Hive是基于Hadoop的一个数据仓库工具,主要用来对数据进行抽取、转换、加载操作。HiveQL可以将结构化的数据文件映射为一张数据表,允许熟悉SQL的用户查询数据,也允许熟悉MapReduce的开发者开发自定义的mapper和reducer来处理内建的mapper和 reducer无法完成的复杂的分析工作,相对于Java代码编写的MapReduce来说,Hive的优势更加明显。Hive利用Hadoop的HDFS存储数据,利用Hadoop的MapReduce执行查询。查看全文>>
在之前的Python培训课程中,我们实现了为3D散点图增加动画,今天我们讲一下basemap安装方法。在数据可视化中,人们有时需要将采集的数据按照其他地理位置显示到地图上,常见于城市人口、飞机航线、矿藏分布等,有助于用户理解与空间有关的信息。basemap是matplotlib中的地图工具包查看全文>>
数据发布与订阅模型,即所谓的全局配置中心,就是发布者将需要全局统一管理的数据发布到Zookeeper节点上,供订阅者动态获取数据,实现配置信息的集中式管理和动态更新查看全文>>
自2013年6月百度EFE(ExcellentFrontEnd)数据可视化团队研发的ECharts1.0发布到GitHub网站以来,ECharts一直备受业界权威的关注并获得广泛好评,成为目前成熟且流行的数据可视化图表工具,被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言查看全文>>
程序的编码风格是一个人编写程序时表现出来的特点、习惯逻辑思路等。我们在程序开发时要重视其编写规范,程序不仅应该能够在机器上正确执行,还应便于调试、维护及阅读。下面举例说明一些编程规范。查看全文>>
Python官方网站中可以下载Python解释器以搭建Python开发环境。下面以Windows系统为例演示Python的下载与安装过程。具体操作步骤如下:查看全文>>