Suite à mon topic du scan des IPv4 https://www.jeuxvideo.com/forums/42-51-70172551-1-0-1-0-j-ai-scanne-tout-internet-voici-un-fichier-libre-et-des-screens.htm
Je vous annonce maintenant que la suite du projet consistera à sauvegarder toutes les pages web accessibles sur ip:80
Ce qui sera sauvegardé / publié :
Titre de la page
Le contenu HTML renvoyé
Headers renvoyés
En faisant des échantillons sur 50 000 sites, j'ai pu calculer que le projet devrait faire de 150 à 1 000 GO (marge faible / haute), et que ce niveau serait de toute façon divisé par deux après compression
Le bot est actuellement en cours, j'estime que cela pourrait prendre jusqu'à quelques jours (ou quelques heures si j'augmente le nombre de serveurs)
L'user-agent sera "Antoine"
Si vous avez un serveur qui avait le port 80 ouvert au moment du scan des ports ouverts (le 7 juillet), et qu'il l'est toujours actuellement, vous le verrez passer dans les logs Apache et Nginx
Des questions ?