kafka更好的替换传统的消息系统,消息系统被用于各种场景,与大多数消息系统比较kafka有更好的吞吐量内置分区,副本和故障转移,这有利于处理大规模的消息。查看全文>>
大数据中常见的数据质量问题主要包括缺失值、重复值以及错误值等问题。下面针对缺失值的清洗、重复值的清洗以及错误值的清洗进行讲解。查看全文>>
我们都知道,使用C/C++之类的编译性语言编写的程序,是需要从源文件转换成计算机使用的机器语言,经过链接器链接之后形成了二进制可执行的文件。运行该程序的时候,就可以把二进制程序从硬盘载入到内存中并运行。查看全文>>
Zookeeper对外提供一个类似于文件系统的层次化的数据存储服务,为了保证整个Zookeeper集群的容错性和高性能,每一个Zookeeper集群都是由多台服务器节点(Server)组成,这些节点通过复制保证各个服务器节点之间的数据一致。只要这些服务器节点过半数可用,那么整个Zookeeper集群就可用。查看全文>>
之前的查询都是字段与常量值进行比较,如果在查询过程中需要比较表中的字段,那么可以使用django.db.models中的F对象;查询时可能涉及一个或多个查询条件,此时可以使用Q对象。查看全文>>