Topic de GranDiablo :

[CULS 10/10][IA Python] MODÈLE de CLASSIFICATION ??

Bonsoir,
Il est dit de produire un modèle de classification performant : modèle plus simple que les autres à performance équivalente et ayant la meilleure valeur sur une métrique d’évaluation calculée grâce à un jeu de test.

Je dispose d'un fichier comportant les données avec des caractéristiques et un autre fichier correspondant aux labels des données : https://image.noelshack.com/fichiers/2022/11/5/1647637475-capture-d-ecran-du-2022-03-18-22-04-20.png
Donc 1218 pour les 2 fichiers dont le premier (données) = 512 caractéristiques (colonnes) et le deuxième (labels) = 1 colonne.

On me dit qu'il faut projeter les données que j'ai a disposition dans un espace 2D : j'ai utilisé T-SNE avec des points correspondant aux données et des labels : https://image.noelshack.com/fichiers/2022/11/5/1647637401-telechargement.png

Et là je sais pas si j'ai fait le modèle de classification avec mon graphique ?? Ensuite, que faut-il faire svp ? Que dois-je déduire de ce que j'ai représenté ? J'ai beaucoup de questions...

Merci de up si vous ne pigez rien à ce que j'ai raconté (au moins pour les culs) et merci de m'aider :)

Les Culs / 10/10 :
https://image.noelshack.com/fichiers/2022/11/5/1647638185-1603585766-bikini.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638207-1603585772-cul1.jpeg https://image.noelshack.com/fichiers/2022/11/5/1647638229-1603585778-cul2.jpeg https://image.noelshack.com/fichiers/2022/11/5/1647638247-1602108343-1.jpeg https://image.noelshack.com/fichiers/2022/11/5/1647638264-1602108362-3.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638279-1602108375-fetichistes.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638424-1582854845-lily-rose-depp-in-a-bikini-in-capri-09-07-2019-5.jpeg https://image.noelshack.com/fichiers/2022/11/5/1647638440-1582854885-18258798-7444281-image-m-46-1568043510490.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638597-1582854855-lilyrise-depp-caprivac-27.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638548-1582855002-7d7223deb135b20579d338264ae564f1.jpg https://image.noelshack.com/fichiers/2022/11/5/1647638533-1582854993-6a00d83451575069e201b7c8af36d1970b.jpg

Les ghost uppez bordel :)
pas assez bon pour t'aider mais je te up https://image.noelshack.com/fichiers/2022/11/4/1647551910-chauveahuri.png

Le 18 mars 2022 à 22:33:17 :
pas assez bon pour t'aider mais je te up https://image.noelshack.com/fichiers/2022/11/4/1647551910-chauveahuri.png

Merci le geste est important pour que quelqu'un puisse m'aider :ok:

Le 18 mars 2022 à 22:34:08 :
Up

:cimer:

Tu le fais pour qui ? Pour quoi ? Je comprends pas l'intérêt
Putain mais ils sont dégueulasses les culs ils sont tous plats et y a des images où c'est même pas des culs
Bonne soirée
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …

Le 18 mars 2022 à 22:35:32 :
Tu le fais pour qui ? Pour quoi ? Je comprends pas l'intérêt

Projet scolaire donc pour s'entraîner

Le 18 mars 2022 à 22:37:15 :
Putain mais ils sont dégueulasses les culs ils sont tous plats et y a des images où c'est même pas des culs
Bonne soirée

Merci du up nonobstant

Tes données sont étiquetées ?

Le 18 mars 2022 à 22:39:01 :
Tes données sont étiquetées ?

Si il y a un label oui .. :hap:

Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …

Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aide :ok:

Le 18 mars 2022 à 22:39:01 :
Tes données sont étiquetées ?

Oui elles le sont. Les labels sont mon labels_df :ok:

Le 18 mars 2022 à 22:39:44 :

Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …

Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aide :ok:

Si T-SNE te permet de visualiser tes clusters, la tu vois que tout les labels ne sont pas parfaitement espacés (après c’est un rendu 2D de 512 dimensions donc …) mais c’est quand même plutôt propre donc c’est cool

Et oui tu as des labels donc c’est de la classification supervisée, KNN est clairement le modèle le plus connu dans ce genre de cas

Le 18 mars 2022 à 22:41:19 :

Le 18 mars 2022 à 22:39:44 :

Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …

Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aide :ok:

Si T-SNE te permet de visualiser tes clusters, la tu vois que tout les labels ne sont pas parfaitement espacés (après c’est un rendu 2D de 512 dimensions donc …) mais c’est quand même plutôt propre donc c’est cool

Et oui tu as des labels donc c’est de la classification supervisée, KNN est clairement le modèle le plus connu dans ce genre de cas

Nickel ça part sur du KNN alors, merci khey ! :oui:

T'as plusieurs méthodes que tu peux tester pour du supervisé : knn, reglog, naïve Bayes. T'as combien de classes ? Essaye plusieurs méthodes et regarde ce que ça donne aux niveaux de tes métriques

Données du topic

Auteur
GranDiablo
Date de création
18 mars 2022 à 22:27:21
Nb. messages archivés
27
Nb. messages JVC
27
En ligne sur JvArchive 317