"GNEUGNEU je suis DATA SCIENTIST je DOIS trouver le minimum GLOBAL""
J'ai effectué une régression linéaire bayesienne et j'ai donc effectué un MCMC (Métropolis Hastings) suite à quoi j'ai pu faire un intervalle de crédibilité sur 3 paramètres
La prof nous demande comparer ces intervalles de confiance aux intervalles de l'EMV de ces 3 mêmes paramètres sauf que j'obtiens rigoureusement les mêmes à peu de chose près
C'est normal ? Je peux conclure sur ça ? Peu importe la taille du jeu de données ?
Bordel 5 jours qui passent et encore 25 pages
Pour les derniers keys qui hésitaient à se lancer dans la DS, si déjà vous avez peur de passer vos journée devant un PC à branler des courbes, alors n'allez pas dedans, vous allez vous faire chier.
Si par contre vous êtes curieux et que vous voulez être stimulés intellectuellement alors allez-y mais investissez-vous à fond, car le domaine est déjà bouché. J'ai été diplômé ingé en 2020 et la plupart des autres diplômés cherchent encore du taf. Domaine d'avenir qu'on vous dit, y'a du boulot qu'on vous dit.
Un bon compromis je pense est de trouver un boulot dans lequel vous allez concevoir un outil / produit dont le fonctionnement se base sur du ML/DL, ou qui intègre des fonctionnalités basées dessus.
Déjà vous mettez un point d'application concrète aux modèles/techniques que vous développerez, ça y donnera du sens, car croyez moi plein de chercheurs et ingénieurs bachotent leur modèles et passent des journées et semaines à améliorer leurs performance sans qu'il n'y trouvent aucun sens. Et ça vous permet de sortir la tête du domaine, de vos datas et de vos algos quand vous en avez envie.
Sinon vous semblez aduler l'OP, mais croyez pas que tout ce qu'il vous sort est nécessaire pour être un bon DS ou chercheur en IA. Le ML/DL est très large et vous pouvez y appliquer toutes les connaissances mathématiques et informatiques existantes.
L'OP lui est un matheux qui semble bosser sur les fondamentaux, mais la réalité c'est que vous n'avez pas besoin de tout savoir et tout comprendre pour appliquer les bons outils aux bonnes situations.
D'ailleurs l'OP on se verra peut être IRL un jour, je suis pas au lpsm mais au labo d'à côté
Pour ceux qui sortent de formations douteuses ou les jean-data scientists reconvertis après 2-3 formations en lignes, 2-3 openclassrooms oui c'est bouché
Les vrais formations en data science ou en mathématiques que ce soit en top école d'ingé ou en fac offrent des opportunités bien plus concrètes et plus intéressantes que de la simple gestion de données, des régressions par ci par là, de la viz
C'est sûr qu'on a vendu beaucoup de rêve autour de ce métier, du coup plein de gens se lancent là dedans en pensant avoir trouvé le meilleur métier possible, la réalité est autre surtout en ces temps de covid, la concurrence est plus rude
Le 15 avril 2021 à 20:22:19 :
Salut les kheys
J'ai effectué une régression linéaire bayesienne et j'ai donc effectué un MCMC (Métropolis Hastings) suite à quoi j'ai pu faire un intervalle de crédibilité sur 3 paramètres
La prof nous demande comparer ces intervalles de confiance aux intervalles de l'EMV de ces 3 mêmes paramètres sauf que j'obtiens rigoureusement les mêmes à peu de chose près
C'est normal ? Je peux conclure sur ça ? Peu importe la taille du jeu de données ?
c'est quoi EMV ? C'est du fréquentiste ? Dans certains cas tes intervalles de crédibilités (MCMC -> bayésiens) et tes intervalles de confiance (EMV ? -> fréquentiste ?) sont rigoureusement les même si les distributions de tes 3 paramètres sont gaussiens
Données du topic
- Auteur
- LnDeTroie
- Date de création
- 10 avril 2021 à 19:51:35
- Nb. messages archivés
- 927
- Nb. messages JVC
- 916