Description du document
Web scraping avec Python
- Éditeur
- Paris : First interactive, DL 2024
Liste des exemplaires
| Disponibilité | Prêt | Nombre |
|---|---|---|
| Emprunté | Pret Normal | 1 |
- Sujet(s)
- Exploration de données Acquisition automatique des données Python (langage de programmation)
- Description
- 1 vol. (xvii-349 p.) : ill., couv. ill. en coul. ; 23 cm
- Note
-
Mention de l'éditeur de la publication originale en anglais sur la page de titre, la 1ère et 4e de couverture et sur le dos de l'ouvrage : "O'Reilly®"
La couv. porte en plus : "Méthodes d'extraction de données du Web"
Notes bibliogr. en bas de pages. Index
- Langue
- français
- ISBN
-
978-2-412-09607-9
- Traduit de
-
Web scraping with Python
Si la programmation s'apparente à de la magie, le web scraping est assurément de la sorcellerie. En écrivant un simple programme automatisé, vous pouvez interroger des serveurs Web, effectuer des requêtes et les analyser pour en extraire les informations dont vous avez besoin. Cet ouvrage constitue un guide complet du web scraping, vous expliquant comment moissonner presque tous les types de données du Web actuel. La première partie du livre se concentre sur les mécanismes du web scraping : utilisation de Python pour demander des informations à un serveur Web, traitement de base de la réponse du serveur et interaction avec les sites de manière automatisée. La deuxième partie du livre explore une grande variété d'outils et d'applications plus spécifiques pour répondre à tous les scénarios de web scraping que vous êtes susceptible de rencontrer. Au programme de ce livre : - Analyser des pages HTML complexes. - Développer des moissonneurs avec le framework Scrapy. - Méthodes pour stocker les données récupérées. - Lire et extraire des données à partir de documents. - Nettoyer et normaliser des données mal formatées. - Lire et écrire en langage naturel. - Moissonner des formulaires et des écrans de connexion. - Récupérer des données à l'aide de JavaScript et d'API. - Utiliser et écrire des logiciels d'OCR. - Éviter les pièges du web scraping et contourner les bloqueurs de robots. - Utiliser des moissonneurs pour tester votre site Web.
Partie 1. Création d'outils de web scraping
1. Fonctionnement d'Internet
2. Aspects légaux et éthiques du web scraping
3. Applications de web scraping
4. Ecrire votre premier outil de web scraping
5. Analyse avancée du code HTML
6. Création de crawlers Web
7. Modèles d'exploration du Web
8. Scrapy
9. Stockage des données
Partie 2. Web scraping avancé
10. Lecture de documents
11. Travailler avec des données mal formatées
12. Traitement du langage naturel
13. Moissonner en gérant les formulaires et les écrans de connexion
14. Web scraping avec JavaScript
15. Moissonner grâce aux API
16. Traitement d'images et reconnaissance de textes
17. Eviter les pièges du web scraping
18. Test de votre site Web avec des moissonneurs
19. Traitement parallèle du web scraping
20. Utiliser des proxys pour le web scraping
Index