Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

Le 27 octobre 2020 à 21:04:25 Lkheyny a écrit :

Le 27 octobre 2020 à 21:03:00 INFP_mignon a écrit :

[21:00:07] <Free_benalla>

Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

[20:52:41] <Free_benalla>

> Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :

>tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

J'adore cette question.
Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de d​oggo, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un d​oggo, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un d​oggo ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

tu veux faire de la classification d'image ou de la detetction d'objet?

je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classers par couleur ou par forme

Regarde du côté Mask R CNN
https://github.com/matterport/Mask_RCNN

Mais faudra que tu labélises à la main

Ou tu peux faire en plusieurs étapes:

Un modèle qui extrait les panneaux grossièrement

Puis pour chaque panneau extrait, 2ème modèle qui reconnait formes

Et 3ème modèle qui reconnait couleurs

On sinon ils utilisent les outils d'openCV pas besoin de machine learning

https://www.youtube.com/watch?v=Fchzk1lDt7Q

tu détectes la forme et tu fais une moyenne a l'intérieur de l'aire de ton contour pour connaitre la couleur.

Si on est école d'ingénieur pas très orienté info, on peut quand même faire du machine learning ? Il faut un master ou un stage suffit ?

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

[21:09:00] <NPC-153SJW4>

Le 27 octobre 2020 à 21:04:25 Lkheyny a écrit :

Le 27 octobre 2020 à 21:03:00 INFP_mignon a écrit :

[21:00:07] <Free_benalla>

Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

>[20:52:41] <Free_benalla>

>> Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :

>>tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

>

>J'adore cette question.

>Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

>

>pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de d​oggo, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un d​oggo, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

>

>On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

>

>Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un d​oggo ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

>

>c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

tu veux faire de la classification d'image ou de la detetction d'objet?

je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classers par couleur ou par forme

Regarde du côté Mask R CNN
https://github.com/matterport/Mask_RCNN

Mais faudra que tu labélises à la main

Ou tu peux faire en plusieurs étapes:

Un modèle qui extrait les panneaux grossièrement

Puis pour chaque panneau extrait, 2ème modèle qui reconnait formes

Et 3ème modèle qui reconnait couleurs

On sinon ils utilisent les outils d'openCV pas besoin de machine learning

https://www.youtube.com/watch?v=Fchzk1lDt7Q

tu détectes la forme et tu fais une moyenne a l'intérieur de l'aire de ton contour pour connaitre la couleur.

yep yep, apres mon exemple est bidon, pas la peine de se casser la tete mais en gros ce que je voulais comprendre c'est comment mettre en place le deep learninge et si ça pouvais vraiment m'apporter quelquechose

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

Euh je sais pas mec :(

Mon école d'ingé, une top grande école française, elle propose un master spé, mais pas dingue

En vrai c'est surtout apprendre par soi même !

Oulah je ne peux pas te dire quels domaines recherches sont prometteurs, mais des thésards se baladent ici ils vont te répondre (mais instinctivement, plutôt du deep que du ML).

Non désolé :( J'avais un prof à Google Brain à Paris, mais je doute que ça soit facile d'accès :(

C'est quoi la différence entre pca et svd ? je comprend pas

Le 27 octobre 2020 à 21:08:51 INFP_mignon a écrit :

[21:07:10] <Lkheyny>

Le 27 octobre 2020 à 21:06:00 INFP_mignon a écrit :

[21:04:25] <Lkheyny>

Le 27 octobre 2020 à 21:03:00 INFP_mignon a écrit :

>[21:00:07] <Free_benalla>

>> Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

>>>[20:52:41] <Free_benalla>

>> >> Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :

>> >>tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

>> >

>> >J'adore cette question.

>> >Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

>> >

>> >pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

>> >

>> >On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

>> >

>> >Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

>> >

>> >c'est clair? :hap:

>>

>> en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

>

>

>tu veux faire de la classification d'image ou de la detetction d'objet?

je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classers par couleur ou par forme

Regarde du côté Mask R CNN
https://github.com/matterport/Mask_RCNN

Mais faudra que tu labélises à la main

Ou tu peux faire en plusieurs étapes:

Un modèle qui extrait les panneaux grossièrement

Puis pour chaque panneau extrait, 2ème modèle qui reconnait formes

Et 3ème modèle qui reconnait couleurs

ok, par labeliser moi meme tu entends que je dois dire a chaque fois ce panneau correspond a ça?

Oui voilà

Pour le Mask R CNN, tu dois fournir :

Une image avec panneaux
Les coordonnées précises des panneaux sur l'image (tu dois tracer le contour à la souris et sauvegarder ça quelque part)

Et tu fais ça pour 300 images xD

aie... 300 c'est le minimum? ou on peut faire avec moins?

Je sais pas, essaie ! J'ai eu de mauvais résultats sur le Mask quand je voulais faire de la détection de toits, donc je ne veux pas te vendre du rêve!

les algos de classification type svm ou random forest, c'est du machin learning ou du deep learning?

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Data engineer c'est beaucoup moins bouché que la data science c'est sûr mais en même temps je sais pas si ça me plairait vraiment. J'espère aussi ne pas "pisser du code" toute ma vie non plus, j'ai du mal à me représenter le quotidien d'un data engineer aussi :(

Apprenez surtout a coder les khey si vous voulez percer dans le data science game, beaucoup ont le syndrome jupyter notebook sans pouvoir mettre en "prod" ça vous permettra de vous demarquez de la plebe, connaitre git kube docker etc

Le 27 octobre 2020 à 21:12:50 toncartarpe a écrit :
Est ce que tu penses que les autres devs qui font des choses moins complexes seront bientot dans la merde?
je suis bon dev full stack JS(entre autres)
mais je m'intéresse au deep learning, je suis en train d'essayer GPT-3 en ce moment, et j'ai l'impression que l'IA va vraiment nous remplacer. GPT-3 genere plutot bien du code par exemple, avec assez peu d'instructions :hap:
et j'ai l'impression que si je me mets pas à fond sur les maths et le deep learning je serais dans la merde bientot

est ce que je me trompe? :hap:

Non t'inquiète c'est du bullshit au mieux cela sera un assistant pour coder (TabNine a déjà commencé à faire ça)

Le 27 octobre 2020 à 21:12:50 toncartarpe a écrit :
Est ce que tu penses que les autres devs qui font des choses moins complexes seront bientot dans la merde?
je suis bon dev full stack JS(entre autres)
mais je m'intéresse au deep learning, je suis en train d'essayer GPT-3 en ce moment, et j'ai l'impression que l'IA va vraiment nous remplacer. GPT-3 genere plutot bien du code par exemple, avec assez peu d'instructions :hap:
et j'ai l'impression que si je me mets pas à fond sur les maths et le deep learning je serais dans la merde bientot

est ce que je me trompe? :hap:

Oui tu te trompes, aucun risque.

Non, ce qui pourrait te faire peur, en terme de "dev" c'est que l'entreprise out source en Inde.

La valeur ajouté d'avoir un dev français payé cher contre un indien rien payé qui font le même taff, à des traductions près, est pas évidente toujours ! m
Mais ne crains pas GPT3 haha

Aprés tu peux utiliser ImageDataGenerator sur Keras pour augmenter ton nombre de data pour ton réseau à entrainer. https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png Il va déformer légerement tes images ( tu choisis les paramétres: zoom-in, zoom-out, crop, flip, brightness...) Du coup tu peux augmenter de maniére significatifs tes inputs. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

Le 27 octobre 2020 à 21:13:30 JulianSark a écrit :
Apprenez surtout a coder les khey si vous voulez percer dans le data science game, beaucoup ont le syndrome jupyter notebook sans pouvoir mettre en "prod" ça vous permettra de vous demarquez de la plebe, connaitre git kube docker etc

Exact, git, kubernetes, les docker, le CI CD ect

Le 27 octobre 2020 à 21:12:50 toncartarpe a écrit :
Est ce que tu penses que les autres devs qui font des choses moins complexes seront bientot dans la merde?
je suis bon en dev full stack JS(entre autres)
mais je m'intéresse au deep learning, je suis en train d'essayer GPT-3 en ce moment, et j'ai l'impression que l'IA va vraiment nous remplacer. GPT-3 genere plutot bien du code par exemple, avec assez peu d'instructions :hap:
et j'ai l'impression que si je me mets pas à fond sur les maths et le deep learning je serais dans la merde bientot

est ce que je me trompe? :hap:

oui tu te trompe yaura toujours du boulot pour les dev surtout back

Le 27 octobre 2020 à 21:14:31 NPC-153SJW4 a écrit :
Aprés tu peux utiliser ImageDataGenerator sur Keras pour augmenter ton nombre de data pour ton réseau à entrainer. https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png Il va déformer légerement tes images ( tu choisis les paramétres: zoom-in, zoom-out, crop, flip, brightness...) Du coup tu peux augmenter de maniére significatifs tes inputs. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

Keras ayaaa team torch ou Jax les khey.

Tu peux également faire des méthodes de mixage pour éviter d'avoir des classifier trop confiant

Tu comptes fonder ta boite en data science un jour ? Ou complètement autre chose ? Tu comptes pas rester data scientist toute ta vie apparemment.

Le 27 octobre 2020 à 21:10:17 carrycature a écrit :

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

Merci. C'est ouf je fais un stage de recherche en ML (que de l'apprentissage supervisé mais bon), à part le RL vite fait le reste j'ai jamais lu de papiers dessus. :( Là je cherche des stages je partais plus sur des trucs style similarity learning, model compactization (les boîtes ont l'air de pas mal en faire), transfer learning, mais je garde en tête !

Merci l'auteur aussi !

Le 27 octobre 2020 à 21:15:49 toncartarpe a écrit :

Le 27 octobre 2020 à 21:14:05 carrycature a écrit :

Le 27 octobre 2020 à 21:12:50 toncartarpe a écrit :
Est ce que tu penses que les autres devs qui font des choses moins complexes seront bientot dans la merde?
je suis bon dev full stack JS(entre autres)
mais je m'intéresse au deep learning, je suis en train d'essayer GPT-3 en ce moment, et j'ai l'impression que l'IA va vraiment nous remplacer. GPT-3 genere plutot bien du code par exemple, avec assez peu d'instructions :hap:
et j'ai l'impression que si je me mets pas à fond sur les maths et le deep learning je serais dans la merde bientot

est ce que je me trompe? :hap:

Non t'inquiète c'est du bullshit au mieux cela sera un assistant pour coder (TabNine a déjà commencé à faire ça)

ouais mais tabnine utilise surement pas GPT-3

t'as accès à l'API d'OpenAI?

GPT-3 me terrifie vraiment, c'est un putain de truc de malade mental

J'ai eu un accès oui, mais c'est over hype ! Non tab nine utilisait gpt ou gpt2

[21:11:38] <Lkheyny>

Le 27 octobre 2020 à 21:08:51 INFP_mignon a écrit :

[21:07:10] <Lkheyny>

Le 27 octobre 2020 à 21:06:00 INFP_mignon a écrit :

[21:04:25] <Lkheyny>

> Le 27 octobre 2020 à 21:03:00 INFP_mignon a écrit :

>>[21:00:07] <Free_benalla>

> >> Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

> >>>[20:52:41] <Free_benalla>

> >> >> Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :

> >> >>tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

> >> >

> >> >J'adore cette question.

> >> >Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

> >> >

> >> >pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

> >> >

> >> >On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

> >> >

> >> >Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

> >> >

> >> >c'est clair? :hap:

> >>

> >> en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

> >

> >

> >tu veux faire de la classification d'image ou de la detetction d'objet?

>

> je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classers par couleur ou par forme

Regarde du côté Mask R CNN
https://github.com/matterport/Mask_RCNN

Mais faudra que tu labélises à la main

Ou tu peux faire en plusieurs étapes:

Un modèle qui extrait les panneaux grossièrement

Puis pour chaque panneau extrait, 2ème modèle qui reconnait formes

Et 3ème modèle qui reconnait couleurs

ok, par labeliser moi meme tu entends que je dois dire a chaque fois ce panneau correspond a ça?

Oui voilà

Pour le Mask R CNN, tu dois fournir :

Une image avec panneaux
Les coordonnées précises des panneaux sur l'image (tu dois tracer le contour à la souris et sauvegarder ça quelque part)

Et tu fais ça pour 300 images xD

aie... 300 c'est le minimum? ou on peut faire avec moins?

Je sais pas, essaie ! J'ai eu de mauvais résultats sur le Mask quand je voulais faire de la détection de toits, donc je ne veux pas te vendre du rêve!

okey! mais ce que je me dis c'est que a l'oeil je vais avoir tendance a selectionner uniquement les panneaux facilement identifiables. l'algo va réussir a s'adapter pour identifier des truc compliqués que limite a l'oeil on est pas sûr?

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 358