Topic de AntoineForum144 :

J'ai scanné tout Internet, voici un fichier libre et des screens

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

Tu utilises quoi comme os Antoine ? Le windows ?

Le 13 juillet 2022 à 22:36:13 :

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

Bah ouais c'est ce que je dis, tu peux potentiellement tomber sur des trucs très intéressants. Combien de gugus ne configurent pas correctement leur reverse dns et le laisse pointer sur un apache sans vhost qui match ou qui match en *.

Le 13 juillet 2022 à 22:36:13 :

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

En vrai j'y connais absolument rien en informatique et je devrais trouver ça impressionnant mais... C'est de la MERDE :ouch:

Le 13 juillet 2022 à 22:37:11 :
Tu utilises quoi comme os Antoine ? Le windows ?

J'utilise ce qui me semble le mieux, mon OS du quotidien est Windows
Quand je me connecte à mes serveurs, j'utilise parfois Linux, ou Windows selon ce que je dois faire ou mes envies

Windows est un très bon OS, c'est juste dommage qu'il soit propriétaire

Le 13 juillet 2022 à 22:38:33 :

Le 13 juillet 2022 à 22:37:11 :
Tu utilises quoi comme os Antoine ? Le windows ?

J'utilise ce qui me semble le mieux, mon OS du quotidien est Windows
Quand je me connecte à mes serveurs, j'utilise parfois Linux, ou Windows selon ce que je dois faire ou mes envies

Windows est un très bon OS, c'est juste dommage qu'il soit propriétaire

Tout ça pour dire que tu sais pas utiliser Linux

C'est jamais trop tard pour s'y mettre :

https://manjaro.org/download/

Le 13 juillet 2022 à 22:38:03 :

Le 13 juillet 2022 à 22:36:13 :

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

Bah ouais c'est ce que je dis, tu peux potentiellement tomber sur des trucs très intéressants. Combien de gugus ne configurent pas correctement leur reverse dns et le laisse pointer sur un apache sans vhost qui match ou qui match en *.

Je ne te parle même pas des cas comme certains sites en onion ou des sites normalement derrière des CDN dont le contenu renvoyé (headers, HTML etc.) trahit, sans parler de tout le reste

en vrai tout le monde se fout de la gueule d'Antoineforum mais ce qu'il dit a du sens, en tout cas sur ce topic

Le 13 juillet 2022 à 22:39:37 :

Le 13 juillet 2022 à 22:38:33 :

Le 13 juillet 2022 à 22:37:11 :
Tu utilises quoi comme os Antoine ? Le windows ?

J'utilise ce qui me semble le mieux, mon OS du quotidien est Windows
Quand je me connecte à mes serveurs, j'utilise parfois Linux, ou Windows selon ce que je dois faire ou mes envies

Windows est un très bon OS, c'est juste dommage qu'il soit propriétaire

Tout ça pour dire que tu sais pas utiliser Linux

C'est jamais trop tard pour s'y mettre :

https://manjaro.org/download/

J'utilise Ubuntu
Tu racontes du bullshit, j'utilise souvent Linux sur mes serveurs et ce n'est pas compliqué

J'ai lu que le titre bordel https://image.noelshack.com/fichiers/2021/04/4/1611841177-ahiahiahi.png

Le 13 juillet 2022 à 22:40:14 :

Le 13 juillet 2022 à 22:38:03 :

Le 13 juillet 2022 à 22:36:13 :

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

Bah ouais c'est ce que je dis, tu peux potentiellement tomber sur des trucs très intéressants. Combien de gugus ne configurent pas correctement leur reverse dns et le laisse pointer sur un apache sans vhost qui match ou qui match en *.

Je ne te parle même pas des cas comme certains sites en onion ou des sites normalement derrière des CDN dont le contenu renvoyé (headers, HTML etc.) trahit, sans parler de tout le reste

Ouais, les sites planqués derrière CDN, de toute façon tu dig mail.domain.tld ou dev.domain.tld et t'as l'IP haha
Franchement, si t'as la patience d'analyser et d'aller jusqu'au bout je pense vraiment que tu peux recup des trucs vachement intéressants. GG pour le projet !

Le 13 juillet 2022 à 22:41:14 :
quel hébergeur?

J'ai fait les requêtes avec des VPNs, sinon il y a des hébergeurs qui acceptent ce type de requêtes directement

comment tu comptes t'y prendre pour analyser ce que tu as scrap ? petit algo de classification ?

Le 13 juillet 2022 à 22:42:15 :

Le 13 juillet 2022 à 22:40:14 :

Le 13 juillet 2022 à 22:38:03 :

Le 13 juillet 2022 à 22:36:13 :

Le 13 juillet 2022 à 22:34:15 :

Le 13 juillet 2022 à 22:31:28 :

Le 08 juillet 2022 à 14:17:40 :
Pour vous donner une idée, c'est comme si il s'était amuser à distribuer une enveloppe vide dans toutes les boîtes aux lettres du monde :)

:rire:

Hmm c'est plutôt comme si toi tu étais limité aux adresses postales que tu trouves dans un annuaire et que toutes les autres tu n'y avais pas accès.
Lui, il dit "je m'en fous si l'adresse est pas dans l'annuaire, on va toquer à la porte et y'aura ptet quelque chose d'intéressant derrière."
"Ah tiens, je savais pas que Google avaient des bureaux dans cette rue, ils sont indiqués nul part"

L'enveloppe n'est plus tellement vide maintenait, j'ai fait des HTTP GET partout et sauvegardé la réponse HTML / headers
Vérifie ton serveur tu le verras (user-agent : Antoine)

Bah ouais c'est ce que je dis, tu peux potentiellement tomber sur des trucs très intéressants. Combien de gugus ne configurent pas correctement leur reverse dns et le laisse pointer sur un apache sans vhost qui match ou qui match en *.

Je ne te parle même pas des cas comme certains sites en onion ou des sites normalement derrière des CDN dont le contenu renvoyé (headers, HTML etc.) trahit, sans parler de tout le reste

Ouais, les sites planqués derrière CDN, de toute façon tu dig mail.domain.tld ou dev.domain.tld et t'as l'IP haha
Franchement, si t'as la patience d'analyser et d'aller jusqu'au bout je pense vraiment que tu peux recup des trucs vachement intéressants. GG pour le projet !

Le robots.txt combiné au header peux aussi trahir facilement
Car beaucoup de gens derrière des CDN se contentent de bloquer la requête uniquement dans leur code lorsque le serveur est accédé sur la page d'index

Le 13 juillet 2022 à 22:23:19 :

Le 13 juillet 2022 à 22:22:46 :
Mais y’a personne pour expliquer en termes simple l’utilité de faire ça ?

Je l'ai expliqué page 6

No y’a pas plus d’explications en page 6 que dans tout le topic, Antoine et ses secondaires parasite cet imbroglio

Le 13 juillet 2022 à 22:44:57 :
comment tu comptes t'y prendre pour analyser ce que tu as scrap ? petit algo de classification ?

Python
Sinon pour le big data j'utile simplement EmEditor sur Windows (version pro), c'est un logiciel très pratique car au lieu d'utiliser la RAM il utilise les fichiers temporaire, et il y a aussi plein d'outils d'outils de recherche / fonctionnalités intégrées

Je comprend rien Antoine tu peux m’expliquer grossièrement ce que t’as fais et pourquoi :(

Le 13 juillet 2022 à 22:46:37 :

Le 13 juillet 2022 à 22:23:19 :

Le 13 juillet 2022 à 22:22:46 :
Mais y’a personne pour expliquer en termes simple l’utilité de faire ça ?

Je l'ai expliqué page 6

No y’a pas plus d’explications en page 6 que dans tout le topic, Antoine et ses secondaires parasite cet imbroglio

Aucun secondaire

Données du topic

Auteur
AntoineForum144
Date de création
8 juillet 2022 à 07:01:09
Nb. messages archivés
257
Nb. messages JVC
253
En ligne sur JvArchive 335