Python使用Requests下载资源获取实时下载进度(转发)

前言

这段时间一直都是比较忙，包括工作上的事情和生活上的事情，已经有一个月没有更新文章了；前段时间收集了很多的Kindle书籍，写爬虫的时候为了方便观察进度，要在控制台打印图书的资源的实时下载进度，今天就来说说如何实现这个小功能。

正文

首先，当我们请求Requests请求一个资源路径的时候，这个请求的响应体会被立即下载返回，这样的话我们就不能获取进度了，但是Requests为我们提供了stream流的方式来获取响应体，这样就有利于我们来获取实时的下载进度，例如下载IDEA：

1 2	= ‘https://download.jetbrains.com/idea/ideaIU-2018.2.1.exe’ res = requests.get(request_url , stream=True)

当上面的语句被执行时，只有响应头被下载并返回给了我们，所以我们可以获取我们需要的数据，比如内容长度content-length：

1	content_length = res.headers[‘content-length’]

然后我们再使用Response.iter_content来控制工作流，来遍历获取资源数据；另外在Python3中在打印内容开头加入\r会使光标回到首行，并不会换行，这样就可以实现进度条的效果，所以最终的代码为：

mport requests
from contextlib import closing
if __name__ == '__main__':
    url = 'https://download.jetbrains.com/idea/ideaIU-2018.2.1.exe'
    with closing(requests.get(url, stream=True)) as response:
        chunk_size = 1024  # 单次请求最大值
        content_size = int(response.headers['content-length'])  # 内容体总大小
        data_count = 0
        with open('idea.exe', "wb") as file:
            for data in response.iter_content(chunk_size=chunk_size):
                file.write(data)
                data_count = data_count + len(data)
                now_jd = (data_count / content_size) * 100
                print("\r 文件下载进度：%d%%(%d/%d) - %s" % (now_jd, data_count, content_size, url), end=" ")

效果为：

文件下载进度：6%(36305920/540246736) - https://download.jetbrains.com/idea/ideaIU-2018.2.1.exe

当然，你也可以根据自己的喜爱调整输入的内容，比如模仿Centos的下载进度=>>>>实现这样的效果

后记

人生就是在不断的学习与折腾中成长，殊为一边修习，一边休息。

近期文章

python记录 · 2018年10月31日

Python使用Requests下载资源获取实时下载进度(转发)

前言

正文

后记

相关

您可能还喜欢...

python记录 · 2018年10月31日

前言

正文

后记

相关

您可能还喜欢...

Python(WordCloud模块 词云)

CDN停用加速域名仍有访问日志产生

在Debian 10中为vim启用鼠标复制粘贴

Python(WordCloud模块词云)