返回顶部

[Python] python爬虫-urllib库的安装及使用(urllib2 在 python3.x 中被改为urllib.request)

[复制链接]
awagink 显示全部楼层 发表于 2020-8-27 09:45:52 |阅读模式 打印 上一主题 下一主题

对于刚刚接触Python的朋友来说,肯定懵逼了,根本找不到urllib2,这是因为,urllib2是以前的版本,在后面的Python3.x版本里面,urllib2与urllib合并了,然后名称还是叫urllib

注:标题这样写,是因为肯定很多人这样搜索的,但其实Python3没有urllib2

访问网页
导入import urllib.request

Python3.6如何下载urllib2模块
打开一个网址:resp=urllib.request.urlopen("http://www.baidu.com")

Python3.6如何下载urllib2模块
读取网页内容,然后把内容保存起来:str = resp.read()

Python3.6如何下载urllib2模块
打印刚才读取的内容:print(str)

Python3.6如何下载urllib2模块
END
请求头
把上面的urlopen改成Request,如下:

resp=urllib.request.Request("http://www.baidu.com")

Python3.6如何下载urllib2模块
然后添加请求头,如下

resp.add_header('Host','www.baidu.com')

Python3.6如何下载urllib2模块
创建一个连接,上面的打开网址连接是一样的,只是把网址换成了Request对象

r = urllib.request.urlopen(resp)

Python3.6如何下载urllib2模块
4
然后读取网址,打印出来就可以了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

纳速健身网成立于2006年8月,是国内优秀健身运动网站,现拥浏览人数超30万。网站是集养生、武术、太极拳和健身气功等多种健身项目于一体的多功能交流平台。平台提供大量优质的教学视频、伴奏音乐(太极拳晨练音乐,广场舞音乐,健身气功音乐)、图文教程、运动科普和经验分享,为健身爱好者提供完善的运动指导平台。
  • 纳速QQ群乙:151815303
  • 纳速QQ群丙:79104490
  • 微信交流群:微信好友搜索【nasuwang】加小纳微信进群交流健身知识,备注【纳速】
  •                     或者扫描页面底部右侧二维码添加小纳微信>>>
  • 微信公众号

  • 微信群客服交流

  • Copyright © 2006-2021, 纳速健身网. | | 辽ICP备13002388号-1 辽公安网备21050202000005号公安网备号 纳速武术-乙 QQ