我们知道,Python语言当前同时支持Python2和Python3两个版本,这两个版本的语法不完全兼容,因此在执行其他版本的程序时很可能会报错。查看全文>>
Pandas中的索引都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。例如,创建一个Series类对象,为其指定索引,然后再对索引重新赋值后会提示“索引不支持可变操作”的错误信息,示例代码如下。查看全文>>
在计算机使用中,目录构成了我们获取文件的基础,一般来说所有的文件都会存储在特定的目录之下。接下来,笔者先来介绍一下使用Python获取目录相关信息的方法。查看全文>>
Serde是Serializer and Deserializer(序列化和反序列化)的简称,Hive 通过Serde处理Hive数据表中每一行数据的读取和写入,例如查询Hive数据表数据时,HDFS中存放的数据表数据会通过Serializer序列化为字节流便于数据传输;向Hive数据表插入数据时,会通过Deserializer将数据反序列化成Hive数据表的每一行值,方便将数据加载到数据表中,不需要对数据进行转换。查看全文>>
当我们日常用Python做数据分析的时候,会利用Python的基础语法来实现我们需要的功能。除此之外,技术人员也会通过第三方库已经封装的功能,更快速、高效地处理和分析数据。查看全文>>
在搞明白“用python做数据分析难吗?”这个话题之前,我们先要对数据分析这个概念做个了解。数据分析的意思是采用统计分析、算法和建模等方法,对特定的数据集进行分析、探索和研究,提取出来有价值的信息、挖掘规律或者得到有效结论的过程。查看全文>>