更新时间:2023-05-22 来源:黑马程序员 浏览量:
当用户首次登录一个网站时,网站往往会要求用户输入用户名和密码,并且给出自动登录选项供用户勾选。用户如果勾选了自动登录选项,那么在下一次访问该网站时,不用输入用户名和密码便可以登录,这是因为第一次登录时服务器发送了包含登录凭证的Cookie到用户硬盘上,第二次登录时浏览器发送了Cookie,服务器验证Cookie后就识别了用户的身份,用户便无须输入用户名和密码。
Cookie(有时也用其复数形式Cookies)是指某些网站为了辨别用户身份、进行会话跟踪,而暂时存储在客户端的一段文本数据(通常经过加密)。
在Requests库中,发送请求时可以通过两种方式携带Cookie,一种方式是直接将包含Cookie信息的请求头传入请求函数的headers参数;另一种方式是将Cookie信息传入请求函数的cookies参数。不过,cookies参数需要接收一个RequestsCookieJar类的对象,该对象类似于一个字典,会以名称(Name)与值(Value)的形式存储Cookie。
下面以登录后的百度首页为例,分别通过上述两种方式演示如何使用Requests实现Cookie登录。
第1种方式的实现代码如下:
import requests headers = { 'cookie':‘此处填写登录百度网站后查看的Cookie信息’,设置字段Cookie 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4)' 'ApplewebKit/537.36 (KHTML, like Gecko)' 'Chrome/53.0.2785.116 Safari/537.36',}€设置字段User-Agent response = requests.get('https://www.baidu.com/', headers=headers) print(response.tgkt)
第2种方式的实现代码如下:
import requests header = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) ' 'AppleWebKit/537.36 (KHTML,1ike Gecko)' 'Chrome/53.0.2785.116 Safari/537.36'} # 准备Cookie cookie='此处填写登录百度网站后查看的cookie信息' # 创建RequestsCookieJar类的对象 jar_obj = requests.cookies.RequestsCookieJar() # 以逗号为分隔符分隔Cookie.并将获得的键和值保存至jar_obj中 for temp in cookie.split(';'): key, value = temp.split('=', 1) jar_obj.set(key, value) response = requests.get('https://www.baidu.com/', headers=header, cookies=jar_obj) print (response,text)
上述两段代码的运行结果如下。
······ "userAttr":Number("")|| 0, "username":"Itcast_001122", "unametype":"2", "userIsSkined":"off", "userIsNewSkined":"off", "userSkinName":"", "userSkinOpacity":"70", ······
由加粗部分的代码可以看出,程序输出的网页源代码包含了用户名Itcast_001122。这说明我们成功地访问了登录后的百度首页。