Scrapy - Autres paramètres
Le tableau suivant montre d'autres paramètres de Scrapy -
| Sr. Non | Réglage et description |
|---|---|
| 1 | AJAXCRAWL_ENABLED Il est utilisé pour activer les grandes analyses. Valeur par défaut: False |
| 2 | AUTOTHROTTLE_DEBUG Il est activé pour voir comment les paramètres de limitation sont ajustés en temps réel, ce qui affiche des statistiques sur chaque réponse reçue. Valeur par défaut: False |
| 3 | AUTOTHROTTLE_ENABLED Il est utilisé pour activer l'extension AutoThrottle. Valeur par défaut: False |
| 4 | AUTOTHROTTLE_MAX_DELAY Il est utilisé pour définir le délai maximum de téléchargement en cas de latences élevées. Valeur par défaut: 60,0 |
| 5 | AUTOTHROTTLE_START_DELAY Il est utilisé pour définir le délai initial de téléchargement. Valeur par défaut: 5,0 |
| 6 | AUTOTHROTTLE_TARGET_CONCURRENCY Il définit le nombre moyen de demandes pour un Scrapy à envoyer parallèlement à des sites distants. Valeur par défaut: 1.0 |
| sept | CLOSESPIDER_ERRORCOUNT Il définit le nombre total d'erreurs qui doivent être reçues avant la fermeture de l'araignée. Valeur par défaut: 0 |
| 8 | CLOSESPIDER_ITEMCOUNT Il définit un nombre total d'éléments avant de fermer l'araignée. Valeur par défaut: 0 |
| 9 | CLOSESPIDER_PAGECOUNT Il définit le nombre maximum de réponses à analyser avant la fermeture de l'araignée. Valeur par défaut: 0 |
| dix | CLOSESPIDER_TIMEOUT Il définit la durée (en secondes) d'une araignée pour se fermer. Valeur par défaut: 0 |
| 11 | COMMANDS_MODULE Il est utilisé lorsque vous souhaitez ajouter des commandes personnalisées dans votre projet. Valeur par défaut: '' |
| 12 | COMPRESSION_ENABLED Il indique que le middleware de compression est activé. Valeur par défaut: True |
| 13 | COOKIES_DEBUG S'il est défini sur true, tous les cookies envoyés dans les demandes et reçus dans les réponses sont enregistrés. Valeur par défaut: False |
| 14 | COOKIES_ENABLED Il indique que le middleware des cookies est activé et envoyé aux serveurs Web. Valeur par défaut: True |
| 15 | FILES_EXPIRES Il définit le délai d'expiration du fichier. Valeur par défaut: 90 jours |
| 16 | FILES_RESULT_FIELD Il est défini lorsque vous souhaitez utiliser d'autres noms de champ pour vos fichiers traités. |
| 17 | FILES_STORE Il est utilisé pour stocker les fichiers téléchargés en le définissant sur une valeur valide. |
| 18 | FILES_STORE_S3_ACL Il est utilisé pour modifier la stratégie ACL pour les fichiers stockés dans le compartiment Amazon S3. Valeur par défaut: privé |
| 19 | FILES_URLS_FIELD Il est défini lorsque vous souhaitez utiliser un autre nom de champ pour les URL de vos fichiers. |
| 20 | HTTPCACHE_ALWAYS_STORE Spider mettra complètement les pages en cache si ce paramètre est activé. Valeur par défaut: False |
| 21 | HTTPCACHE_DBM_MODULE Il s'agit d'un module de base de données utilisé dans le backend de stockage DBM. Valeur par défaut: 'anydbm' |
| 22 | HTTPCACHE_DIR C'est un répertoire utilisé pour activer et stocker le cache HTTP. Valeur par défaut: 'httpcache' |
| 23 | HTTPCACHE_ENABLED Cela indique que le cache HTTP est activé. Valeur par défaut: False |
| 24 | HTTPCACHE_EXPIRATION_SECS Il est utilisé pour définir le délai d'expiration du cache HTTP. Valeur par défaut: 0 |
| 25 | HTTPCACHE_GZIP Ce paramètre s'il est défini sur true, toutes les données mises en cache seront compressées avec gzip. Valeur par défaut: False |
| 26 | HTTPCACHE_IGNORE_HTTP_CODES Il indique que les réponses HTTP ne doivent pas être mises en cache avec des codes HTTP. Valeur par défaut: [] |
| 27 | HTTPCACHE_IGNORE_MISSING Ce paramètre s'il est activé, les demandes seront ignorées si elles ne sont pas trouvées dans le cache. Valeur par défaut: False |
| 28 | HTTPCACHE_IGNORE_RESPONSE_CACHE_CONTROLS C'est une liste contenant des contrôles de cache à ignorer. Valeur par défaut: [] |
| 29 | HTTPCACHE_IGNORE_SCHEME Il indique que les réponses HTTP ne doivent pas être mises en cache avec des schémas d'URI. Valeur par défaut: ['file'] |
| 30 | HTTPCACHE_POLICY Il définit une classe mettant en œuvre la politique de cache. Valeur par défaut: 'scrapy.extensions.httpcache.DummyPolicy' |
| 31 | HTTPCACHE_STORAGE C'est une classe implémentant le stockage du cache. Valeur par défaut: 'scrapy.extensions.httpcache.FilesystemCacheStorage' |
| 32 | HTTPERROR_ALLOWED_CODES C'est une liste dans laquelle toutes les réponses sont passées avec des codes de statut non 200. Valeur par défaut: [] |
| 33 | HTTPERROR_ALLOW_ALL Ce paramètre lorsqu'il est activé, toutes les réponses sont passées malgré ses codes d'état. Valeur par défaut: False |
| 34 | HTTPPROXY_AUTH_ENCODING Il est utilisé pour authentifier le proxy sur HttpProxyMiddleware . Valeur par défaut: "latin-1" |
| 35 | IMAGES_EXPIRES Il définit le délai d'expiration des images. Valeur par défaut: 90 jours |
| 36 | IMAGES_MIN_HEIGHT Il est utilisé pour déposer des images trop petites en utilisant une taille minimale. |
| 37 | IMAGES_MIN_WIDTH Il est utilisé pour déposer des images trop petites en utilisant une taille minimale. |
| 38 | IMAGES_RESULT_FIELD Il est défini lorsque vous souhaitez utiliser un autre nom de champ pour vos images traitées. |
| 39 | IMAGES_STORE Il est utilisé pour stocker les images téléchargées en le définissant sur une valeur valide. |
| 40 | IMAGES_STORE_S3_ACL Il est utilisé pour modifier la stratégie ACL pour les images stockées dans le compartiment Amazon S3. Valeur par défaut: privé |
| 41 | IMAGES_THUMBS Il est configuré pour créer les vignettes des images téléchargées. |
| 42 | IMAGES_URLS_FIELD Il est défini lorsque vous souhaitez utiliser un autre nom de champ pour les URL de vos images. |
| 43 | MAIL_FROM L'expéditeur utilise ce paramètre pour envoyer les e-mails. Valeur par défaut: 'scrapy @ localhost' |
| 44 | MAIL_HOST C'est un hôte SMTP utilisé pour envoyer des e-mails. Valeur par défaut: 'localhost' |
| 45 | MAIL_PASS C'est un mot de passe utilisé pour authentifier SMTP. Valeur par défaut: aucune |
| 46 | MAIL_PORT C'est un port SMTP utilisé pour envoyer des e-mails. Valeur par défaut: 25 |
| 47 | MAIL_SSL Il est utilisé pour implémenter une connexion à l'aide d'une connexion cryptée SSL. Valeur par défaut: False |
| 48 | MAIL_TLS Lorsqu'il est activé, il force la connexion à l'aide de STARTTLS. Valeur par défaut: False |
| 49 | MAIL_USER Il définit un utilisateur pour authentifier SMTP. Valeur par défaut: aucune |
| 50 | METAREFRESH_ENABLED Il indique que le middleware de rafraîchissement meta est activé. Valeur par défaut: True |
| 51 | METAREFRESH_MAXDELAY Il s'agit d'un délai maximum pour une méta-actualisation pour rediriger. Valeur par défaut: 100 |
| 52 | REDIRECT_ENABLED Il indique que le middleware de redirection est activé. Valeur par défaut: True |
| 53 | REDIRECT_MAX_TIMES Il définit le nombre maximum de fois qu'une requête est redirigée. Valeur par défaut: 20 |
| 54 | REFERER_ENABLED Cela indique que le middleware référent est activé. Valeur par défaut: True |
| 55 | RETRY_ENABLED Il indique que le middleware de nouvelle tentative est activé. Valeur par défaut: True |
| 56 | RETRY_HTTP_CODES Il définit les codes HTTP à réessayer. Valeur par défaut: [500, 502, 503, 504, 408] |
| 57 | RETRY_TIMES Il définit le nombre maximal de tentatives de relance. Valeur par défaut: 2 |
| 58 | TELNETCONSOLE_HOST Il définit une interface sur laquelle la console telnet doit écouter. Valeur par défaut: '127.0.0.1' |
| 59 | TELNETCONSOLE_PORT Il définit un port à utiliser pour la console telnet. Valeur par défaut: [6023, 6073] |
