爬取网页其实就是通过URL获取网页信息,网页信息的实质是一段添加了JavaScript和CSS的HTML代码。Python提供了一个抓取网页信息的第三方模块requests,requests模块自称“HTTP for Humans”,直译过来的意思是专门为人类而设计的HTTP模块,该模块支持发送请求,也支持获取响应。查看全文>>
利用json模块的dumps()函数和loads()函数可以实现Python对象和JSON数据之间的转换,下面来分别演示两种函数的用法查看全文>>
程序中与数据相关的操作分为数据的存储与读写。下面将对如何存储与读写不同维度的数据进行讲解。1.数据存储数据通常存储在文件之中,为了方便后续的读写操作,数据通常需要按照约定的组织方式进行存储。一维数据呈线性排列,一般用特殊字符分隔,具体示例如下。查看全文>>
Python变量并不是在哪个位置都可以访问的,具体的访问权限取决于变量定义的位置,其所处的有效范围视为变量的作用域。根据作用域的不同,变量可以划分为局部变量和全局变量。本节将针对局部变量和全局变量进行详细地讲解。查看全文>>
构建集合的这些对象称为该集合的元素。例如,成年人集合的每一个元素都是已满18周岁的人。通常用大写字母如A、B、S……表示集合,用小写字母如a、b、c……表示集合的元素。集合中的元素具有3个特征,具体如下。查看全文>>
目前,很多开源框架的绘图功能都是基于matplotibl实现的,pandas便是其中之一。对于pandas的数据结构来说,直接使用其自身的绘图功能要比matplotibl更加方便简单。表9-16中列举了有关pandas内置数据结构绘制图形的常用方法。查看全文>>