Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Demande aux thésards ici, je sais pas :(

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rentre en 8 pages :hap:

Le 27 octobre 2020 à 21:29:56 Lkheyny a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Demande aux thésards ici, je sais pas :(

Ok y'a qui qui fait de la recherche en ML ici ?

Ça consiste en quoi le métier au quotidien, concrètement ?
Expert = 10 000 passés dans un domaine. Source : mon professeur à l'université, sa source ? des études qui ont suivis des jeunes qui faisaient du violon dès le bas âge, et ils ont , après 10 000 heures des connexions plus fluides dans le cerveau. Tu as donc passé 5 ans dans le domaine ( master ) + au moins 5 à 6 ans en entreprise ?

Le 27 octobre 2020 à 21:30:40 carrycature a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rendre en 8 pages :hap:

Durant un stage de recherche de 6 mois en M1 c'est faisable de publier dans une bonne conf tu penses ?

Même si la "course aux publications" est un peu ridicule c'est cool pour le dossier je pense

Le 27 octobre 2020 à 21:32:27 yNd a écrit :

Le 27 octobre 2020 à 21:30:40 carrycature a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rendre en 8 pages :hap:

Durant un stage de recherche de 6 mois en M1 c'est faisable de publier dans une bonne conf tu penses ?

Même si la "course aux publications" est un peu ridicule c'est cool pour le dossier je pense

Je pense que c'est short à part si tu es très très très bon et que tu as un très bon encadrant !

La data science c'est sur côté, ensuite pas tant d'offres que ça sauf si tu as des années d'expérience derrière toi

Le 27 octobre 2020 à 21:31:29 modosueur9 a écrit :
Expert = 10 000 passés dans un domaine. Source : mon professeur à l'université, sa source ? des études qui ont suivis des jeunes qui faisaient du violon dès le bas âge, et ils ont , après 10 000 heures des connexions plus fluides dans le cerveau. Tu as donc passé 5 ans dans le domaine ( master ) + au moins 5 à 6 ans en entreprise ?

J'ai pas fait 10 000h de pratique certes.

Mais si on exclut les thésards, je pense être meilleur que 95% des "data scientist" qui écrivent 3 lignes sur Sklearn et s'arrêtent là, et oublient connaissances sur modèles.

Et c'est le cas de ceux qui se proclament "senior" souvent :(

Le 27 octobre 2020 à 21:31:18 KheyLunaire a écrit :
Ça consiste en quoi le métier au quotidien, concrètement ?

ya autant de quotidien que de "data scientist" de nos jours ça veux tout et rien dire, dans certaine boite on voit une séparation en "machine learning engeneer" qui en gros transforme le jupyter notebook et le met en "prod", et la dedans ya le tuning des parametres , nettoyer la data etc etc

Le 27 octobre 2020 à 21:32:27 yNd a écrit :

Le 27 octobre 2020 à 21:30:40 carrycature a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rendre en 8 pages :hap:

Durant un stage de recherche de 6 mois en M1 c'est faisable de publier dans une bonne conf tu penses ?

Même si la "course aux publications" est un peu ridicule c'est cool pour le dossier je pense

Pour être dans ce cas oui c'est faisable (enfin ça dépend ce que tu appelles bonnes conf, ICASSP ça l'est ? Pas du ML pur mais bon :( Après dans mon cas ça s'est pas fait mais pour d'autres raisons)

Le 27 octobre 2020 à 21:33:55 ComteMonte a écrit :
La data science c'est sur côté, ensuite pas tant d'offres que ça sauf si tu as des années d'expérience derrière toi

Oui l'effet de la ruée vers l'or

Le 27 octobre 2020 à 21:17:34 chibbimitia a écrit :

Le 27 octobre 2020 à 21:13:05 nonosim a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

> Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

>> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

> >T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

>

> Euh, dans un projet ML tu as du data engineering.

>

> Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

>

> Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Data engineer c'est beaucoup moins bouché que la data science c'est sûr mais en même temps je sais pas si ça me plairait vraiment. J'espère aussi ne pas "pisser du code" toute ma vie non plus, j'ai du mal à me représenter le quotidien d'un data engineer aussi :(

Ba "pisser du code", c'est péjoratif, mais en vrai, c'est quand même intellectuellement > majorité des jobs. C'est varié, t'apprends tout le temps, t'es tranquille, etc. Et ensuite tu peux évoluer sur du lead ou management, genre mon cas. Je gère une dizaine de personnes, j'ai plus le temps de coder moi même.

Ah ouais t'es data engineer ? Je préfère avoir un métier stimulant c'est sûr mais en même temps je suis pas une personne qui résiste bien au stress (parce que je me dis qu'au moins pour certains BS jobs y a 0 stress mais c'est sûr que tu te fais chier). Mais métier stimulant (où on peut évoluer) mais pas trop stressant ce serait l'idéal pour moi.

Je suis déjà en master de maths apps (y a de la data science, des maths fi etc). Faut repartir à partir de quelle niveau de formation pour devenir data engineer ? C'est dur de trouver des masters dans ce domaine alors que pour la data science y en a plein.

Tu bosses en cabinet de conseil ? Cabinet de conseil spécialisé ou branche data d'un gros cabinet?

T'as trouvé facilement ton job? Et t'as pas envisagé de faire une thèse, pour partir plus facilement à l'étranger ?

Le 27 octobre 2020 à 21:33:55 carrycature a écrit :

Le 27 octobre 2020 à 21:32:27 yNd a écrit :

Le 27 octobre 2020 à 21:30:40 carrycature a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

> Le 27 octobre 2020 à 21:26:34 yNd a écrit :

>L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rendre en 8 pages :hap:

Durant un stage de recherche de 6 mois en M1 c'est faisable de publier dans une bonne conf tu penses ?

Même si la "course aux publications" est un peu ridicule c'est cool pour le dossier je pense

Je pense que c'est short à part si tu es très très très bon et que tu as un très bon encadrant !

Ok bon je donnerais juste mon maximum et on verra

Le 27 octobre 2020 à 21:34:16 Sylves a écrit :

Le 27 octobre 2020 à 21:32:27 yNd a écrit :

Le 27 octobre 2020 à 21:30:40 carrycature a écrit :

Le 27 octobre 2020 à 21:27:51 yNd a écrit :

Le 27 octobre 2020 à 21:27:11 Lkheyny a écrit :

> Le 27 octobre 2020 à 21:26:34 yNd a écrit :

>L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Je sais ça a pas l'air si difficile de publier dans ce domaine non plus

Si tu as un bon encadrant de thèse ça passe ! ICLR ou NEURips c'est pas donné à tout le monde en plus la limite de page est ignoble et tu te fais tacler par le reviewer car t'as pas mis assez d'xp ou tu as pas assez développé ta preuve ou tu n'as pas assez détaillé les related works.
Évidement il faut que ça rendre en 8 pages :hap:

Durant un stage de recherche de 6 mois en M1 c'est faisable de publier dans une bonne conf tu penses ?

Même si la "course aux publications" est un peu ridicule c'est cool pour le dossier je pense

Pour être dans ce cas oui c'est faisable (enfin ça dépend ce que tu appelles bonnes conf, ICASSP ça l'est ? Pas du ML pur mais bon :( Après dans mon cas ça s'est pas fait mais pour d'autres raisons)

Honnêtement je connais pas trop les conférences j'ai juste entendu parlé de neurips et iclr mais j'imagine que c'est pas les seules, mais gg en tout cas

Le 27 octobre 2020 à 21:35:11 nonosim a écrit :

Le 27 octobre 2020 à 21:17:34 chibbimitia a écrit :

Le 27 octobre 2020 à 21:13:05 nonosim a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

> Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

>> Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> >> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

> > >T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

> >

> > Euh, dans un projet ML tu as du data engineering.

> >

> > Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

> >

> > Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

>

> non il parle des personne qui prépre les pipeline

> en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

>

> mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Data engineer c'est beaucoup moins bouché que la data science c'est sûr mais en même temps je sais pas si ça me plairait vraiment. J'espère aussi ne pas "pisser du code" toute ma vie non plus, j'ai du mal à me représenter le quotidien d'un data engineer aussi :(

Ba "pisser du code", c'est péjoratif, mais en vrai, c'est quand même intellectuellement > majorité des jobs. C'est varié, t'apprends tout le temps, t'es tranquille, etc. Et ensuite tu peux évoluer sur du lead ou management, genre mon cas. Je gère une dizaine de personnes, j'ai plus le temps de coder moi même.

Ah ouais t'es data engineer ? Je préfère avoir un métier stimulant c'est sûr mais en même temps je suis pas une personne qui résiste bien au stress (parce que je me dis qu'au moins pour certains BS jobs y a 0 stress mais c'est sûr que tu te fais chier). Mais métier stimulant (où on peut évoluer) mais pas trop stressant ce serait l'idéal pour moi.

Je suis déjà en master de maths apps (y a de la data science, des maths fi etc). Faut repartir à partir de quelle niveau de formation pour devenir data engineer ? C'est dur de trouver des masters dans ce domaine alors que pour la data science y en a plein.

data engineer voit ça comme du dev, tu dois plus connaitre les infrastructure, genre le cloud, bien connaitre les bases de données, spark, les outils d'ETL comme airflow. Les problématiques c'est vraiment t'as par exemple des fichiers en json qui arrive sur plusieurs go comment tu automatises pour qu'a la fin ces données soit accesible sur une bdd aux analyst.

Quel est l'intérêt réel de ce domaine ?

Je connais Python, donc j'ai cru avoir compris que PyTorch et TensorFlow étaient pas mals.

Combien de temps pour être suffisamment bon dans ce domaine pour effectuer un projet concret ?

Je te cache pas que je bosse déjà sur un projet d'entreprise personnel que je code moi-même (je suis dév web) et je souhaite donc être entrepreneur. Si c'est un domaine concret qui peut m'apporter de la thune je suis prêt à apprendre, surtout avec ce confinement qu'on a

Le 27 octobre 2020 à 21:34:09 JulianSark a écrit :

Le 27 octobre 2020 à 21:31:18 KheyLunaire a écrit :
Ça consiste en quoi le métier au quotidien, concrètement ?

ya autant de quotidien que de "data scientist" de nos jours ça veux tout et rien dire, dans certaine boite on voit une séparation en "machine learning engeneer" qui en gros transforme le jupyter notebook et le met en "prod", et la dedans ya le tuning des parametres , nettoyer la data etc etc

Mais c'est intéressant le "tuning des paramètres" et le "nettoyage de data" ?

Le 27 octobre 2020 à 21:38:31 KheyLunaire a écrit :

Le 27 octobre 2020 à 21:34:09 JulianSark a écrit :

Le 27 octobre 2020 à 21:31:18 KheyLunaire a écrit :
Ça consiste en quoi le métier au quotidien, concrètement ?

ya autant de quotidien que de "data scientist" de nos jours ça veux tout et rien dire, dans certaine boite on voit une séparation en "machine learning engeneer" qui en gros transforme le jupyter notebook et le met en "prod", et la dedans ya le tuning des parametres , nettoyer la data etc etc

Mais c'est intéressant le "tuning des paramètres" et le "nettoyage de data" ?

Le tuning c'est chiant, et nettoyer les données ça dépend

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 353