Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

Le 27 octobre 2020 à 20:54:53 127_0_0_1 a écrit :
Pourquoi tu gagnes pas plus alors que tu sors d'une grande école d'ingé? Pourquoi ne pas go finance ? Et surtout, pourquoi ne pas faire data scientist dans un autre pays ou tu seras bien mieux payé :question:

Euh bah ça va non ? je crois que c'est 45/46 avec primes en brut, mais l'Etat prend beaucoup mec

Finance chiant

Je veux data scientist car surtout je veux du temps pour faire projets persos
mon but n'est pas d'être data scientist toute ma vie loin de là

Oui je compte bouger en Suisse quand j'aurais une bonne opportunité ! :)

46k meme après grande ecole cest enorme en france hein

Le 27 octobre 2020 à 20:56:21 MrPeanutbutter a écrit :

Le 27 octobre 2020 à 20:25:45 Lkheyny a écrit :

Le 27 octobre 2020 à 20:20:35 CimerPhilippotl a écrit :
Concrètement c'est quoi la différence entre le machine learning et le deep learning ? https://image.noelshack.com/fichiers/2019/52/6/1577546227-cimerphilippot-calculs.png

Ok en réalité Deep Learning c'est du Machine Learning, c'est à dire c'est de l'apprentissage statistique.

Le but est d'avoir des données, et de trouver une fonction f() tel que f(x) = y, avec x = input, y = output.

Ca s'appelle apprentissage statistique.

Maintenant, deep learning c'est une sous branche très en vogue du machine learning, qui a explosé grâce à Yann Le Cunn et qui est utilisé par tous les plus grandes boites pour faire de l'IA sérieuse (reconnaissance image, génération de fake vidéos, ect..).

En gros, le deep learning permet surtout de modéliser des relations qui ne sont pas forcément linéaires, alors que dans le machine learning classique on a surtout de la linéarité (via les modèles dits de regression) - la seule "non linéarité" dans le ML classique est surtout permise par la méthode dite des "noyaux". Le deep va beaucoup beaucoup plus loin.

"dans le machine learning classique on a surtout de la linéarité"

putain il est beau l'expert ML :rire:

tu sais que même avec une régression linéaire tu peux faire des modèles non linéaires ?

On va pas commencer le débat :)

Régression linéaire c'est linéarité dans les poids

Même un GLM ça reste linéaire en terme de poids :)

Va faire de la reconnaissance d'image avec une régression :)

Le 27 octobre 2020 à 20:55:39 bilal1960 a écrit :
Du coup khey après mon bac+3 analyste-programmeur obliger de pousser le +5 en fac de science pour ce genre de boulot Data-scientist?

Je pense c'est mieux, tu seras sérieusement plus chill en tant que Data Scientist planqué qu'en tant que pisseur de code

[20:52:41] <Free_benalla>

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

J'adore cette question.
Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Le 27 octobre 2020 à 20:55:29 chibbimitia a écrit :

Le 27 octobre 2020 à 20:52:32 Lkheyny a écrit :

Le 27 octobre 2020 à 20:46:23 chibbimitia a écrit :
Une vraie prod quoi, où tes modèles sont dans le chemin critique du business, avec toutes les contraintes que cela peut impliquer en terme d'opérationel. Pas un dash board qui servira à faire joli et à pouvoir dire que nous aussi, on fait du mal.
Et en fonction du business, les problématiques de scalabilite, de rafraîchissement et autres, qui font que même appliquer une régression logistique, la plupart des boîtes se cassent les dents dessus

Euh ouais ça a été utilisé, mais on a pas dev une app dessus, la problématique ne s'y prêtait pas :(

On a fait une API qui était requêtée, pour un besoin spécifique.

Ba ouai, pas de ta faute, mais comme la majorité, t'es pas exposé à des vrais besoins en terme de ML, pour moi ca surf clairement sur la bulle. Et le terme "scientist" est clairement galvaudé du coup, c'est vraiment la nouvelle BI quoi...

Je te promets que c'était du vrai deep / Ml qui a été utilisé

Mais en gros on a réussi à établir une sorte de "scoring" et on envoyait le scoring via API

Idem pour problématique d'attrition de clients dans grande banque française

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Je reçois pas mal d'offres en computing vision/machine learning aprés j'ai un an d'xp chez Renault comme spécialiste caméra. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

[20:52:41] <Free_benalla>

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

J'adore cette question.
Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

tu veux faire de la classification d'image ou de la detetction d'objet?

Différence entre deep learning et machine learning ?

Comment apprendre ça en étant autodidacte ? Sachant que je sais programmer depuis longtemps :noel:

Le 27 octobre 2020 à 21:00:06 NPC-153SJW4 a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

>T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Je reçois pas mal d'offres en computing vision/machine learning aprés j'ai un an d'xp chez Renault comme spécialiste caméra. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

Bravo khey :)

Le 27 octobre 2020 à 21:00:06 NPC-153SJW4 a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

>T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Je reçois pas mal d'offres en computing vision/machine learning aprés j'ai un an d'xp chez Renault comme spécialiste caméra. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

GO PARTAGER les offres :hap: les recruteur te contactent directement?

Le 27 octobre 2020 à 20:53:43 Lkheyny a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Tu veux te réorienter dans quoi ?
C'est quoi ton job idéal ? :(

Bah justement j'en sais rien c'est pour ça que je poste ici :hap:

Je suis en master en data science mais plus j'en lis sur ce métier, plus je suis déçu. Je m'attendais à un secteur d'avenir qui recrute à tour de bras, je me disais "whala ça a l'air stylé l'intelligence artificielle" mais je me rends compte que la façon dont ce domaine est vendu ne correspond pas à la réalité du travail. Et puis la fameuse bulle concernant la data science.

Du coup soit je continue en data science, soit je rempilerai pour un autre master mais je sais pas dans quoi, je suis un peu perdu concernant mon avenir professionnel :(

Le 27 octobre 2020 à 21:00:13 TheRamech a écrit :
Différence entre deep learning et machine learning ?

Comment apprendre ça en étant autodidacte ? Sachant que je sais programmer depuis longtemps :noel:

Déjà répondu page 1 haha :)

Go Fast Ai, le cours est sympa, et gratuit !

Tu penses quoi du MVA ?
Apres CentraleSupelec possible de faire de la DS sans Master spécifique ?

Le 27 octobre 2020 à 20:58:03 Lkheyny a écrit :

Le 27 octobre 2020 à 20:56:21 MrPeanutbutter a écrit :

Le 27 octobre 2020 à 20:25:45 Lkheyny a écrit :

Le 27 octobre 2020 à 20:20:35 CimerPhilippotl a écrit :
Concrètement c'est quoi la différence entre le machine learning et le deep learning ? https://image.noelshack.com/fichiers/2019/52/6/1577546227-cimerphilippot-calculs.png

Ok en réalité Deep Learning c'est du Machine Learning, c'est à dire c'est de l'apprentissage statistique.

Le but est d'avoir des données, et de trouver une fonction f() tel que f(x) = y, avec x = input, y = output.

Ca s'appelle apprentissage statistique.

Maintenant, deep learning c'est une sous branche très en vogue du machine learning, qui a explosé grâce à Yann Le Cunn et qui est utilisé par tous les plus grandes boites pour faire de l'IA sérieuse (reconnaissance image, génération de fake vidéos, ect..).

En gros, le deep learning permet surtout de modéliser des relations qui ne sont pas forcément linéaires, alors que dans le machine learning classique on a surtout de la linéarité (via les modèles dits de regression) - la seule "non linéarité" dans le ML classique est surtout permise par la méthode dite des "noyaux". Le deep va beaucoup beaucoup plus loin.

"dans le machine learning classique on a surtout de la linéarité"

putain il est beau l'expert ML :rire:

tu sais que même avec une régression linéaire tu peux faire des modèles non linéaires ?

On va pas commencer le débat :)

Régression linéaire c'est linéarité dans les poids

Même un GLM ça reste linéaire en terme de poids :)

Va faire de la reconnaissance d'image avec une régression :)

mais évidemment que le DL est plus performant dans certaines taches mais c'est pas une vérité générale
et y avait 30 000 autres modèles non linéaires en fonction des paramètres avant l'explosion du DL

c'est avec ce genre de connerie que les gens s'imaginent que le DL c'est surpuissant et qu'il faut en utiliser partout

Le 27 octobre 2020 à 21:00:06 NPC-153SJW4 a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

>T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Je reçois pas mal d'offres en computing vision/machine learning aprés j'ai un an d'xp chez Renault comme spécialiste caméra. https://image.noelshack.com/fichiers/2017/21/1495888283-9.png

Oui ba on est dans la bulle, assez clairement. Je le vois moi même, je recrute régulièrement des mecs, t'imagines pas le nombre de postulants pour un job junior ou stage lambda...Là, je viens de mettre une offre de stage, 3 jours après, j'ai 50 CVs (avec lettre de motiv et tout le bordel), sans mentir.

[21:00:07] <Free_benalla>

Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

[20:52:41] <Free_benalla>

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

J'adore cette question.
Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

tu veux faire de la classification d'image ou de la detetction d'objet?

je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classer par couleur ou par forme

Le 27 octobre 2020 à 21:02:30 RASPTAS a écrit :
Tu penses quoi du MVA ?
Apres CentraleSupelec possible de faire de la DS sans Master spécifique ?

MVA j'ai des amis qui l'ont fait

Exigeant, faisable mais exigeant. Surtout intéressant si tu veux go thèse ensuite.

Bien sûr mec, pas besoin de master spécifique, des centraliens j'en croise tous les jours ;)

Le 27 octobre 2020 à 21:03:00 INFP_mignon a écrit :

[21:00:07] <Free_benalla>

Le 27 octobre 2020 à 20:58:37 INFP_mignon a écrit :

[20:52:41] <Free_benalla>

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

J'adore cette question.
Quand tu veux recnnaitre un truc sur des images, tu dois apprendr a l'ordi a comparer les images. une image c'et une matrice, donc plein de carré les contenant une valeur ( (RGB = couleur). Hors, un modèle ne va JAMAIS réussir a fonctionner sur une matrice

pourquoi un modèle ne peux pas fonctionner sur une matrice? Pour comprendre l'idée, observont deux photo de chien, un noir et un blanc. Tu veux que dans les deux cas le modèle reconnaisse un chien, hors, les deux images sont totalement différentes si on devait les comparer en faisant une soustraction

On va donc chercher a synthéthiser l'information contenus dans les images. Le deep learning (réseau de neuronnes) est une approche novatrice dans le sens ou l'on ne dit JAMAIS au modèle comment synthéhiser l'information contenus dans les images.

Le modèle va apprendre de la manière suivante, il va synthéhiser une image, la multiplier par une matrice de poid, et regarder ce qu'il prédirait (un chien ou un chat). La matrice de poid va ête modifiée selon qu'il se soit trompé ou non. Tu fais ca sur des million d'images, la matrice de poid s'améliorer au fur et a mesure

c'est clair? :hap:

en fait je fais du traitement d'image donc je comprend deja tout ça, ce que je comprend pas c'est comment le deep learning va définir ces poids et comment le mettre en place. quelles entrées on doit donner a l'algo, si je dois identifier 15000 objets dans mes images a la main pour qu'ensuite l'algo puisse fonctionner ça m'avancera pas

tu veux faire de la classification d'image ou de la detetction d'objet?

je dirait plutot de la detection mais je voudrais egalement classifier mes objets. exemple je recherche des panneaux mais je veux les classers par couleur ou par forme

Regarde du côté Mask R CNN
https://github.com/matterport/Mask_RCNN

Mais faudra que tu labélises à la main

Ou tu peux faire en plusieurs étapes:

Un modèle qui extrait les panneaux grossièrement

Puis pour chaque panneau extrait, 2ème modèle qui reconnait formes

Et 3ème modèle qui reconnait couleurs

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 115