爬虫06:requests请求模块1

爬虫•目录 爬虫•类别


requests是一个第三方模块,需要安装.
Anaconda Prompt: conda install requests
cmd: python -m pip install requests

Get方法 requests.get(url, headers=headers)

requests.get发起请求并获取对象

import requests

url = 'http://www.baidu.com/'
headers = {'User-Agent':''}

res = requests.get(url, headers=headers)
res.encoding='utf-8'
print(res.url)

返回值属性
res.encoding响应对象内容的编码属性
res.text 响应内容字符串格式
res.content 响应内容bytes格式(字节流)
res.url 返回实际数据的url地址
res.status_code HTTP响应码

非结构化数据保存(图片)

html = res.content
with open('xx.jpg', 'wb') as f:
f.write(html)

import requests

url = ''https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1548306415352&di=e75cc8258e02b07f5310d43215f1d56a&imgtype=0&src=http%3A%2F%2Fimg4.duitang.com%2Fuploads%2Fitem%2F201603%2F21%2F20160321223952_AVYMa.jpeg''
headers = {'User-Agent':'Mozilla/5.0'}

# 发送请求
res = requests.get(url, headers=headers)

# 获取bytes响应内容
html = res.content

# 保存到本地
with open('picture.jpg', 'wb') as f:
    f.write(html)

print('successfully')

get()参数

  • 查询参数(params)
    params:字典
    res = requests.get(url, params=paramas, headers=heasers)

    params的属性存在 不用再编码拼接地址,可以为中文

      import requests
    
      url = 'http://www.baidu.com/s?'
      headers = {'User-Agent':'Mozilla/5.0'}
      params = {'wd':'math', 'pn':'20'}
    
      # 发送请求
      res = requests.get(url, params=params, headers=headers)
    
      # 获取bytes响应内容
      html = res.text
      print(html)
    
  • 代理参数(proxies)

  • 超时限制(timeout)

  • web客户端验证参数(auth)
    auth = (‘用户名’, ‘密码’)

  • SSL证书认证参数(verify)
    verify = True 默认进行SSL证书认证
    verify = False 不检查认证


博主个人能力有限,错误在所难免.
如发现错误请不要吝啬,发邮件给博主更正内容,在此提前鸣谢.
Email: JentChang@163.com (来信请注明文章标题,如果附带链接就更方便了)
你也可以在下方的留言板留下你宝贵的意见.


上一篇
爬虫07:requests请求模块2 爬虫07:requests请求模块2
爬虫•目录 爬虫•类别 Post方法 requests.Post()post()参数 data Form表单数据,字典形式,不需要编码和转码 其它参数同GET() 案例(有道翻译) 抓包,多抓几次观察Form表单中的数据变化(浏览
2019-01-22
下一篇
爬虫05:抓包 爬虫05:抓包
爬虫•目录 爬虫•类别 Fiddler配置Fiddler Tools -> Options HTTPS 1.勾选Decrypt Https Traffic,添加证书信任窗口 2. …from browsers only Conn
2019-01-22
目录