[CULS 10/10][IA Python] MODÈLE de CLASSIFICATION ??
Bonsoir,
Il est dit de produire un modèle de classification performant : modèle plus simple que les autres à performance équivalente et ayant la meilleure valeur sur une métrique d’évaluation calculée grâce à un jeu de test.
Je dispose d'un fichier comportant les données avec des caractéristiques et un autre fichier correspondant aux labels des données :
Donc 1218 pour les 2 fichiers dont le premier (données) = 512 caractéristiques (colonnes) et le deuxième (labels) = 1 colonne.
On me dit qu'il faut projeter les données que j'ai a disposition dans un espace 2D : j'ai utilisé T-SNE avec des points correspondant aux données et des labels :
Et là je sais pas si j'ai fait le modèle de classification avec mon graphique ?? Ensuite, que faut-il faire svp ? Que dois-je déduire de ce que j'ai représenté ? J'ai beaucoup de questions...
Merci de up si vous ne pigez rien à ce que j'ai raconté (au moins pour les culs) et merci de m'aider
Le 18 mars 2022 à 22:34:08 :
Up
Bonne soirée
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …
Le 18 mars 2022 à 22:35:32 :
Tu le fais pour qui ? Pour quoi ? Je comprends pas l'intérêt
Projet scolaire donc pour s'entraîner
Le 18 mars 2022 à 22:37:15 :
Putain mais ils sont dégueulasses les culs ils sont tous plats et y a des images où c'est même pas des culs
Bonne soirée
Merci du up nonobstant
Le 18 mars 2022 à 22:39:01 :
Tes données sont étiquetées ?
Si il y a un label oui ..
Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …
Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aide
Le 18 mars 2022 à 22:39:01 :
Tes données sont étiquetées ?
Oui elles le sont. Les labels sont mon labels_df
Le 18 mars 2022 à 22:39:44 :
Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aide
Si T-SNE te permet de visualiser tes clusters, la tu vois que tout les labels ne sont pas parfaitement espacés (après c’est un rendu 2D de 512 dimensions donc …) mais c’est quand même plutôt propre donc c’est cool
Et oui tu as des labels donc c’est de la classification supervisée, KNN est clairement le modèle le plus connu dans ce genre de cas
Le 18 mars 2022 à 22:41:19 :
Le 18 mars 2022 à 22:39:44 :
Le 18 mars 2022 à 22:37:43 :
T-sne c’est juste pour visualiser tes clusters
Après en général tu as des modèles comme knn qui va classifié les observations de ton test_set à partir des distances de ton train_set …Ok donc un KNN te paraît être un bon modèle ?
Du coup ça sert à rien de reprendre le T-SNE pour le KNN j'imagine.
Je vais voir comment ça marche si personne ne me propose autre chose, merci pour l'aideSi T-SNE te permet de visualiser tes clusters, la tu vois que tout les labels ne sont pas parfaitement espacés (après c’est un rendu 2D de 512 dimensions donc …) mais c’est quand même plutôt propre donc c’est cool
Et oui tu as des labels donc c’est de la classification supervisée, KNN est clairement le modèle le plus connu dans ce genre de cas
Nickel ça part sur du KNN alors, merci khey !
Données du topic
- Auteur
- GranDiablo
- Date de création
- 18 mars 2022 à 22:27:21
- Nb. messages archivés
- 27
- Nb. messages JVC
- 27