Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

Le 27 octobre 2020 à 21:38:31 KheyLunaire a écrit :

Le 27 octobre 2020 à 21:34:09 JulianSark a écrit :

Le 27 octobre 2020 à 21:31:18 KheyLunaire a écrit :
Ça consiste en quoi le métier au quotidien, concrètement ?

ya autant de quotidien que de "data scientist" de nos jours ça veux tout et rien dire, dans certaine boite on voit une séparation en "machine learning engeneer" qui en gros transforme le jupyter notebook et le met en "prod", et la dedans ya le tuning des parametres , nettoyer la data etc etc

Mais c'est intéressant le "tuning des paramètres" et le "nettoyage de data" ?

ça dépend de ce que tu aimes, si tu veux améliorer aux mieux ton modeles tu veux passer beaucoup de temps dessus vasy, mais apres faut trouver la boite qui te permettra ça. Le truc c'est que dans beaucoup des cas bah le sklearn de 3 ligne la regression logistique ça résoud beaucoup de problématique qu'on les boites et les mecs veulent pas payer cher pour que toi t'améliorer ton modele de 1% en bossant 3 mois.

On met en avant beaucoup le coté math, deep learning etc mais honnetement y'a peu de job qui propose des trucs tres poussé en machine learning

Le 27 octobre 2020 à 21:38:31 KheyLunaire a écrit :

Le 27 octobre 2020 à 21:34:09 JulianSark a écrit :

Le 27 octobre 2020 à 21:31:18 KheyLunaire a écrit :
Ça consiste en quoi le métier au quotidien, concrètement ?

ya autant de quotidien que de "data scientist" de nos jours ça veux tout et rien dire, dans certaine boite on voit une séparation en "machine learning engeneer" qui en gros transforme le jupyter notebook et le met en "prod", et la dedans ya le tuning des parametres , nettoyer la data etc etc

Mais c'est intéressant le "tuning des paramètres" et le "nettoyage de data" ?

Non. C'est mon avis en tout cas, mais c'est la raison derrière le fait que je considère le ML comme une vaste blague dans 99% des cas, et un truc où les mecs pensent faire un taff ultra stylé et intellectuel alors que c'est de la merde.

T"as des pfe à me proposer ?

Le 27 octobre 2020 à 21:35:11 nonosim a écrit :

Le 27 octobre 2020 à 21:17:34 chibbimitia a écrit :

Le 27 octobre 2020 à 21:13:05 nonosim a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

> Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

>> Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> >> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

> > >T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

> >

> > Euh, dans un projet ML tu as du data engineering.

> >

> > Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

> >

> > Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

>

> non il parle des personne qui prépre les pipeline

> en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

>

> mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Data engineer c'est beaucoup moins bouché que la data science c'est sûr mais en même temps je sais pas si ça me plairait vraiment. J'espère aussi ne pas "pisser du code" toute ma vie non plus, j'ai du mal à me représenter le quotidien d'un data engineer aussi :(

Ba "pisser du code", c'est péjoratif, mais en vrai, c'est quand même intellectuellement > majorité des jobs. C'est varié, t'apprends tout le temps, t'es tranquille, etc. Et ensuite tu peux évoluer sur du lead ou management, genre mon cas. Je gère une dizaine de personnes, j'ai plus le temps de coder moi même.

Ah ouais t'es data engineer ? Je préfère avoir un métier stimulant c'est sûr mais en même temps je suis pas une personne qui résiste bien au stress (parce que je me dis qu'au moins pour certains BS jobs y a 0 stress mais c'est sûr que tu te fais chier). Mais métier stimulant (où on peut évoluer) mais pas trop stressant ce serait l'idéal pour moi.

Je suis déjà en master de maths apps (y a de la data science, des maths fi etc). Faut repartir à partir de quelle niveau de formation pour devenir data engineer ? C'est dur de trouver des masters dans ce domaine alors que pour la data science y en a plein.

J'ai fais math app, je suis parti sur du dev classique ensuite en taff, et au fur et à mesure, je me suis orienté vers la data et je suis devenu data engineer. Enfin, j'étais.

Faut pas chercher forcément un master intitulé "data engineer". Tu montes tes compétences en dev (pas que du notebook python, du vrai dev, language typé, orienté object, un peu de fonctionnel, etc.). Tu prends des cours du stylé "Système Distribué" ou "Base Distribué", qui vont t'introduire au map reduce, à l'environnement hadoop, aux services cloud, etc.

Puis t'essaies de bosser tes algorithmes et structures de données, le truc archi chiant et pas trop utile...sauf pour aller chercher un taff dans une grosse boite de tech. Et là, t'es golden. Perds pas ton temps dans des cabinets, ssii ou autre, tu vises la grosse boite tech si tu peux, t'y fais quelques années, et ensuite, tu peux littéralement aller où tu veux.

Ah et clairement, la grosse boite tech, à part cas particuliers, c'est très peu stressant hein. T'es entouré de gens brillants, l'esprit c'est de traiter les employés le mieux possible (vu que tout le monde se les arrache), tu fais des horaires corrects, etc. T'es jamais à l'abri du manager tyrannique évidemment, mais t'as tellement de faciliter à change de taff de toute facon que ca dure jamais longtemps.

Le 27 octobre 2020 à 21:38:23 Jauseff5 a écrit :
Quel est l'intérêt réel de ce domaine ?

Je connais Python, donc j'ai cru avoir compris que PyTorch et TensorFlow étaient pas mals.

Combien de temps pour être suffisamment bon dans ce domaine pour effectuer un projet concret ?

Je te cache pas que je bosse déjà sur un projet d'entreprise personnel que je code moi-même (je suis dév web) et je souhaite donc être entrepreneur. Si c'est un domaine concret qui peut m'apporter de la thune je suis prêt à apprendre, surtout avec ce confinement qu'on a

Pas de réponse ?

Le 27 octobre 2020 à 22:07:03 Jauseff5 a écrit :

Le 27 octobre 2020 à 21:38:23 Jauseff5 a écrit :
Quel est l'intérêt réel de ce domaine ?

Je connais Python, donc j'ai cru avoir compris que PyTorch et TensorFlow étaient pas mals.

Combien de temps pour être suffisamment bon dans ce domaine pour effectuer un projet concret ?

Je te cache pas que je bosse déjà sur un projet d'entreprise personnel que je code moi-même (je suis dév web) et je souhaite donc être entrepreneur. Si c'est un domaine concret qui peut m'apporter de la thune je suis prêt à apprendre, surtout avec ce confinement qu'on a

Pas de réponse ?

Ça dépend du projet, de la donnée (pour la durée) etc...
Perso sur les deux j'ai une préférence pour Pytorch

Le 27 octobre 2020 à 22:09:12 carrycature a écrit :

Le 27 octobre 2020 à 22:07:03 Jauseff5 a écrit :

Le 27 octobre 2020 à 21:38:23 Jauseff5 a écrit :
Quel est l'intérêt réel de ce domaine ?

Je connais Python, donc j'ai cru avoir compris que PyTorch et TensorFlow étaient pas mals.

Combien de temps pour être suffisamment bon dans ce domaine pour effectuer un projet concret ?

Je te cache pas que je bosse déjà sur un projet d'entreprise personnel que je code moi-même (je suis dév web) et je souhaite donc être entrepreneur. Si c'est un domaine concret qui peut m'apporter de la thune je suis prêt à apprendre, surtout avec ce confinement qu'on a

Pas de réponse ?

Ça dépend du projet, de la donnée (pour la durée) etc...
Perso sur les deux j'ai une préférence pour Pytorch

D'accord mais combien de temps d'apprentissage pour pouvoir faire un truc concret ?
Je suis déjà dév web, j'ai déjà fait du C et python

Le 27 octobre 2020 à 22:40:54 Jauseff5 a écrit :

Le 27 octobre 2020 à 22:09:12 carrycature a écrit :

Le 27 octobre 2020 à 22:07:03 Jauseff5 a écrit :

Le 27 octobre 2020 à 21:38:23 Jauseff5 a écrit :
Quel est l'intérêt réel de ce domaine ?

Je connais Python, donc j'ai cru avoir compris que PyTorch et TensorFlow étaient pas mals.

Combien de temps pour être suffisamment bon dans ce domaine pour effectuer un projet concret ?

Je te cache pas que je bosse déjà sur un projet d'entreprise personnel que je code moi-même (je suis dév web) et je souhaite donc être entrepreneur. Si c'est un domaine concret qui peut m'apporter de la thune je suis prêt à apprendre, surtout avec ce confinement qu'on a

Pas de réponse ?

Ça dépend du projet, de la donnée (pour la durée) etc...
Perso sur les deux j'ai une préférence pour Pytorch

D'accord mais combien de temps d'apprentissage pour pouvoir faire un truc concret ?
Je suis déjà dév web, j'ai déjà fait du C et python

C'est ce que je te dis ça dépend ce que tu veux faire certaine choses demande un bagage technique et théorique lourd et d'autre pas du tout

Tu travailles un peu sur des problèmes inversés comme de la séparation de source aveugle ?
Et concrètement t as quoi comme bagage théorique ?? Tu t y connais en optimisation (pontryagin,lqr....)?
2800 € net pour exécuter des scripts python sur des fichiers Excel quel foutage de gueule :rire:
Faire une thèse c'est rentable pour ensuite avoir un meilleur poste de data scientist même si je suis pas passionné par la recherche ?

Le 27 octobre 2020 à 20:51:41 Sprycotcot a écrit :
Si je veux faire un réseau de neurone pour une ia qui joue au snake, c'est quoi les grosses étapes pour y parvenir ?

T'aurais des livres / formations qui traitent de cet aspect là à conseiller ? :(

T'as pas répondu l'op :(

Bonjour,

Je souhaite créer des clusters basés sur la proximité géographique (codes postaux, longitude, latitude) et que chaque cluster ait une taille équivalente en termes de population (par exemple, un nombre d'habitants similaire). Mon objectif est d'obtenir, par exemple, 9 clusters avec des codes postaux proches les uns des autres et une répartition équitable de la population dans chaque cluster. Pourriez-vous m'aider svp

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 344