Python - Création d'URL

Le module de requêtes peut nous aider à créer les URL et à manipuler la valeur de l'URL de manière dynamique. Tout sous-répertoire de l'URL peut être récupéré par programme, puis une partie de celui-ci peut être remplacée par de nouvelles valeurs pour créer de nouvelles URL.

Build_URL

L'exemple ci-dessous utilise urljoinpour récupérer les différents sous-dossiers dans le chemin de l'URL. La méthode urljoin est utilisée pour ajouter de nouvelles valeurs à l'URL de base.

from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec

Lorsque nous exécutons le programme ci-dessus, nous obtenons la sortie suivante -

https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4

Diviser les URL

Les URL peuvent également être divisées en plusieurs parties au-delà de l'adresse principale. Les paramètres supplémentaires qui sont utilisés pour une requête spécifique ou des balises attachées à l'URL sont séparés à l'aide de la méthode urlparse comme indiqué ci-dessous.

from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)

Lorsque nous exécutons le programme ci-dessus, nous obtenons la sortie suivante -

ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')