博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scrapy 出现 [twisted.internet.error.TimeoutError:] 的几种解决方案
阅读量:4129 次
发布时间:2019-05-25

本文共 496 字,大约阅读时间需要 1 分钟。

在使用 scapy 进行大批量爬取的时候,少数请求链接会出现请求超时,当出现请求超时时,爬虫会自动重试三次。

扩展,可以 通过 设置 RETRY_ENABLED = False 来关闭重试机制

若超过 180s 且三次后且还是没有得到数据,就会出现 twisted.internet.error.TimeoutError 错误。

提供几种解决办法:

1、降低同时请求的数量

CONCURRENT_REQUESTS = 5

2、 增加超时时间

DOWNLOAD_TIMEOUT = 2000

3、 增加重试次数

RETRY_TIMES = 5

4、下载中间件中,捕获这个报错,并返回request,让它重新请求这个对象:

from twisted.internet.error import TimeoutErrordef process_exception(self, request, exception, spider):    if isinstance(exception, TimeoutError):                return request

希望对你有帮助~~

在这里插入图片描述

转载地址:http://jkzvi.baihongyu.com/

你可能感兴趣的文章
DP 斐波那契数列js NC68
查看>>
模拟实现函数节流(throttling)、防抖(debounce) js
查看>>
嵌套数组指定层次展开 flat扁平化 js
查看>>
使用原生的JavaScript实现ajax请求(ajax实现原理)
查看>>
模拟实现构造函数new的过程 js
查看>>
模拟实现instanceof的功能 js
查看>>
实现jsonp js
查看>>
export与export default的区别
查看>>
Vue 中的 ref 和 $refs 的使用
查看>>
Vue之父子组件间通信实例讲解(props、$ref、$emit)
查看>>
事件冒泡和事件捕获区别及设置
查看>>
javascript中的 for...in, for...of, for 和 forEach 循环的区别
查看>>
模拟实现Promise.all方法
查看>>
模拟实现函数的apply.call.bind函数
查看>>
牛客网ACM模式下JavaScript(V8)常见输入输出练习
查看>>
如何在页面上实现一个圆形的可点击区域?
查看>>
v-if 与 v-show的区别及对生命周期的影响
查看>>
js实现trim方法
查看>>
数据过多/DOM操作导致页面卡顿和请求突增导致页面崩溃
查看>>
Python安装 Requests 和 BeautifulSoup 开发库
查看>>