纳速健身

标题: python爬虫-urllib库的安装及使用(urllib2 在 python3.x 中被改为urllib.request) [打印本页]

作者: awagink    时间: 2020-8-27 09:45
标题: python爬虫-urllib库的安装及使用(urllib2 在 python3.x 中被改为urllib.request)

对于刚刚接触Python的朋友来说,肯定懵逼了,根本找不到urllib2,这是因为,urllib2是以前的版本,在后面的Python3.x版本里面,urllib2与urllib合并了,然后名称还是叫urllib

注:标题这样写,是因为肯定很多人这样搜索的,但其实Python3没有urllib2

访问网页
导入import urllib.request

Python3.6如何下载urllib2模块
打开一个网址:resp=urllib.request.urlopen("http://www.baidu.com")

Python3.6如何下载urllib2模块
读取网页内容,然后把内容保存起来:str = resp.read()

Python3.6如何下载urllib2模块
打印刚才读取的内容:print(str)

Python3.6如何下载urllib2模块
END
请求头
把上面的urlopen改成Request,如下:

resp=urllib.request.Request("http://www.baidu.com")

Python3.6如何下载urllib2模块
然后添加请求头,如下

resp.add_header('Host','www.baidu.com')

Python3.6如何下载urllib2模块
创建一个连接,上面的打开网址连接是一样的,只是把网址换成了Request对象

r = urllib.request.urlopen(resp)

Python3.6如何下载urllib2模块
4
然后读取网址,打印出来就可以了




欢迎光临 纳速健身 (https://www.nasue.com/) Powered by Discuz! X3.4