Topic de alkin32 :

Data Scientist ça vaut toujours le coup ?

Après rien ne vous empêche de faire le bullshit job bien payé et chez vous faire de la recherche en ML ou IA ...

Un notebook colab et c'est partie 🚀

Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

Le 15 février 2021 à 10:25:32 Cosmochienne a écrit :
Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

Pire idée. Sauf si tu vises le top et finir researcher chez un GAFA.

Le 15 février 2021 à 10:13:40 CauchySchwartz a écrit :
D'où sort ce mythe comme quoi ce serait différent ailleurs qu'en France ? De ce que je vois sur Reddit, le côté "nettoyage de DB et utiliser des lib python" du job est en train de se généraliser partout et que même avoir un doctorat ne t'évitera pas automatiquement cette facette du job :(

Ca dépend de la boîte je dirais. Je suis tout à fait d'accord avec toi, mais ce type de job est le plus souvent rattaché à l'étranger à la dénomination de data engineer ou ML engineer, qui nécessitent le plus souvent plus de fortes compétences en info qu'en maths et recrutent sur du bachelor (+quelques années d'exp le plus souvent). A l'étranger, ils ont l'intelligence de séparer ça du "AI scientist", ou "ML/AI researcher", qui nécessite aussi des compétences en info, mais dont la principale tâche est vraiment le développement de nouvelles solutions (très rare que tu te retrouves à clean des bases de données par ex).

Mais souvent comme c'est basé sur le modèle anglo-saxon, ba ce type de job recrute sur doctorat et non pas master car ça n'existe pas vraiment master dans le cadre d'études plutôt orientée technique/recherche.

Le 15 février 2021 à 09:53:08 Geoxor a écrit :
El famoso de plus en plus bouché alors que c'est TOP 1 des métiers en expansion

Métier full sous-data pourrie. Des métiers qui s'appelle Data.Scientist et tu te contentes de faire des stats pourries sur R et Python quoi.

Le 15 février 2021 à 10:01:25 IbnTachefine2 a écrit :
Il n y a pas de vrai data science en France, la plupart utilisent les modèles développés par les Gafam, c'est pour cela que tout le monde s'y mets donc c'est remplis de charlatans et bien sûr les salaires chutent. Si tu veux faire de la data science avec des bases solides en mathématiques pour se différencier des chimistes et agronomes qui deviennent subitement des DS, il faut partir de France.

Ceci bordel.
On utilise des librairies sans comprendre ce qu'il y a derrière, et là on se sent data scientist professionel :)

Le 15 février 2021 à 10:25:32 Cosmochienne a écrit :
Vous m'avez convaincu j'irai pas dans l'industrie mais en post Doc 🚀

Post Doc pour moi c'est vraiment si t'arrives à chopper un truc dans une grosse équipe et que tu as besoin de grosses publications pour compléter ce que tu n'as pas réussi à avoir lors de ton doctorat (que ce soit pour après go industrie, ou académique). Sans forcement aller vers les GAFAM, il y a pleins de startup à l'étranger (y compris quelques rares en France), qui proposent vraiment de la recherche intéressante, même si selon la culture de l'entreprise, tu échapperas plus ou moins aux tâches ingrates de nettoyage et autres.

Le 15 février 2021 à 10:21:58 chibbimitia a écrit :
Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

C'est surtout ça que les gens ne comprennent pas.
J'ai limite envie de changer complètement de domaine à cause de ça (je me chauffe sur les DSL et les compilateurs là, j'avais une offre intéressante dans le domaine en fin de master)

Après calmez vous les "true" data scientist. Developper un algo ultra complexe et impossible à mettre en prod pour gagner 0.01 point d'accuracy, c'est pas du tout ce qui est recherché en entreprise :hap:
Oui, tu trouveras du travail bien payé si tu es bon :ok:

J'ai une question.
Je veux faire un Master 1 Maths appliquées et statistiques dans le secteur de la santé, en gros, ça s'apparente à être épidémiologue (je ferai sûrement une remise à niveau en biologie / ue transversale). J'espère pouvoir après travailler dans la nutrition/santé et avoir un poste à l'ANSES (Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail) ou à l'INRA.
Est ce que selon vous, mon projet professionnel tient la route ?
Quel Master 2 devrais-je choisir ?

Merci les kheys.

Edit: je suis en 3ème année de Licence Mathématiques et Applications où j'ai eu 4 UE d'informatique ( Algorithmique 1 et 2 en C++, Base de données (MySQL, PHP, CSS, JavaScript, statistiques et analyse de données ( Python, R, Java avec complexité).

Le 15 février 2021 à 09:55:02 KoukouLaTeley a écrit :
Tu trouveras facilement mais ça maie moins bien qu'au tout début (Mais toujours relativement bien, attends toi à 50k en milieu de carrière)

50k en milieu de carrière :rire:
50k au bout de 3-4 ans plutôt.

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

Le 15 février 2021 à 10:46:15 CauchySchwartz a écrit :

Le 15 février 2021 à 10:21:58 chibbimitia a écrit :
Ah, et l'autre redpill, c'est que quand bien même vous tomberiez dans une boite qui a de vrai use case de ML, qui tournent en prod sur un volume décent de données (cad qui tourne pas en local sur votre machine), le job consistera essentiellement à faire du feature engineering et de l'hyper tuning.

C'est surtout ça que les gens ne comprennent pas.
J'ai limite envie de changer complètement de domaine à cause de ça (je me chauffe sur les DSL et les compilateurs là, j'avais une offre intéressante dans le domaine en fin de master)

C'est pour ca que je dis que le domaine le plus intéressant, ca reste du data engineering, ou du data system engineering (le terme commence à apparaitre). Etre calé sur les systèmes distribués, déployer du presto ou autre tech stylée dans une boite et s'assurer que tout ca tourne bien et de manière optimisée, etc.

Le 15 février 2021 à 09:56:14 [Ascension] a écrit :

Le 15 février 2021 à 09:55:20 Cosmochienne a écrit :

Le 15 février 2021 à 09:54:00 [Ascension] a écrit :
Passer par les filières aseptisés des Maths pour etre data scientist :rire:

J'ai toujours été une des plus grosse merde en math depuis le collège , et lors de mon récent stage dans le domaine j'ai tout réussi meme l'évaluation de fin de stage :rire:

Ouvre un bouquin de data science c'est full math ...

C'est full logique , c'est pas purement mathématique

ne me dis pas d'ouvrir un bouquin j'ai carrément fait un stage dans le domaine :pf:

Eh non pas toujours Jean-Médiocre, cf ma copine agrégé de maths et datascientiste, qui m'explique que les données donnent souvent des résultats qui sont totalement contre-intuitifs...
Et aussi qu'énormément de travaux dans les datasciences sont complètements biaisé par des ahuris comme toi qui ne comprennent pas ce qu'ils manipulent.

Le 15 février 2021 à 10:59:02 QUElouisFERDIN a écrit :

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

Bordel Dataiku, ce truc du démon qui fait perdre du temps plus qu'autre chose :malade:

Le 15 février 2021 à 11:28:46 :

Le 15 février 2021 à 10:59:02 QUElouisFERDIN a écrit :

Le 15 février 2021 à 10:22:19 dabhu00 a écrit :
N'importe qui peut faire appliquer un modèle de scikit-learn ou faire du transfert learning avec pytorch/tensorflow.

Pour moi ce qui va faire vraiment la différence, c'est la créativité, comprendre en profondeur les données qu'on manipule, faire du feature engineering intelligent qui permet de pas cramer toutes les ressources de la boite sur un processing etc...

Ensuite il y a toute la partie communication/présentation: comprendre les besoin des clients, proposer une solution adapté, présenter et vulgariser sa solution pour aider à ce qu'elle soit adopter...

This, je suis en alternance en DS en ce moment et c'est ça. Rien a voir avec ce qu'on nous apprend à la fac. Les Data Scientist qui bossent avec moi savent meme pas comment fonctionnent les algos qu'ils entrainent avec Data Iku (ils en on pas besoin en même temps)

Bordel Dataiku, ce truc du démon qui fait perdre du temps plus qu'autre chose :malade:

Dataiku :bave:
Faire toutes les manips chiantes de pandas super facilement :bave:
Les graphs ultra faciles à générer :bave:
Avoir toute la puissance de Spark sous le capot :bave:
Le no code :bave:

Données du topic

Auteur
alkin32
Date de création
15 février 2021 à 09:51:55
Nb. messages archivés
60
Nb. messages JVC
60
En ligne sur JvArchive 298