Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

T'as sauté ma question l'auteur :snif:

Le 27 octobre 2020 à 21:13:05 nonosim a écrit :

Le 27 octobre 2020 à 20:58:39 chibbimitia a écrit :

Le 27 octobre 2020 à 20:53:08 nonosim a écrit :

Le 27 octobre 2020 à 20:47:49 Free_benalla a écrit :

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

> Le 27 octobre 2020 à 20:44:30 nonosim a écrit :

>T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Quand tu dis que " l'apprentissage est probablement plus 'simple' que dev des modèles" si j'ai bien compris, le métier de data scientist est beaucoup plus simple que data engineer, celui-ci doit continuer à apprendre toute sa vie ? Les salaires sont à peu près équivalents ?

J'ai peur que la data science soit une bulle qui risque d'exploser d'ici quelques années, en commençant mes études de maths on me l'a présenté comme un "domaine d'avenir" mais je me rends compte que c'est faux donc j'essaie de voir dans quoi je peux me réorienter si la data science est si surcotée que ça, sachant que je peux rallonger mes études de 2 ans si possible.

Conseil:
Go data engineer. ML engineer à la limite, mais 1 boite sur 100 en recrute réellement.
ML engineer = les mecs qui codent les modèles. En gros, à part facebook/google/amazon, t'as quasi aucune boite qui le fait réellement et avec des vraies contraintes.
Data engineer = création des outils, frameworks, pour faire du ML/data dessus. Mettre en place des clusters hadoop, tune des gros jobs spark, installer du presto en prod, gérer un metastore hive, etc.
Tout ca, c'est bien plus compliqué, ca paye bien + tu restes polyvalent, c'est avant tout des compétences de dev, donc tu peux facilement basculer sur du dev classique quand tu le voudras.

Data engineer c'est beaucoup moins bouché que la data science c'est sûr mais en même temps je sais pas si ça me plairait vraiment. J'espère aussi ne pas "pisser du code" toute ma vie non plus, j'ai du mal à me représenter le quotidien d'un data engineer aussi :(

Ba "pisser du code", c'est péjoratif, mais en vrai, c'est quand même intellectuellement > majorité des jobs. C'est varié, t'apprends tout le temps, t'es tranquille, etc. Et ensuite tu peux évoluer sur du lead ou management, genre mon cas. Je gère une dizaine de personnes, j'ai plus le temps de coder moi même.

Déjà bossé sur du Federated Learning de ton côté ? J'ai fais de la recherche dessus en stage, mais je galère à trouver un stage en ML actuellement pour ma dernière année

Le 27 octobre 2020 à 21:16:13 nonosim a écrit :
Tu comptes fonder ta boite en data science un jour ? Ou complètement autre chose ? Tu comptes pas rester data scientist toute ta vie apparemment.

Projets perso oui ;)
Mais pas sûr que ça ait un lien avec la data :) Peut être du ecommerce, ou un service personnes âgées ;)

Mais au moins je peux réfléchir à utilisation de modèles dans mon "business plan", et tenter je sais pas, de cibler exactement mes consommateurs pour gagner encore plus de $$$

Que penses tu des œuvres d'Isaac Asimov ? :(

Il faut connaitre quoi en info pour faire du machine learning? Sachant que je fait du c++/c et python, et que j'ai déjà codé un moteur et un serveur web avec une base de donnée, et que je suis en l2 math.

Je voudrais prendre de l'avance sur un possible master en ml ou dl, il y a google mais si tu peux resumer en 2/3 termes stp :hap:

Le 27 octobre 2020 à 21:09:20 G2X a écrit :
Si on est école d'ingénieur pas très orienté info, on peut quand même faire du machine learning ? Il faut un master ou un stage suffit ?

Ca suffit, pour faire de la data science de baase, il faut surtout connaitre pytthon = très facile, en autodidacte !

Essaie de faire du kaggle / git par contre oui !

Clé ton topic pouvait pas mieux tomber :bave:

je suis dans un tournant de ma life, j'ai justement décidé de me mettre à la data,
j'ai besoin de savoir par où commencer.
je pourrais effectivement scruter le web pendant des heures etc

mais rien ne vaut les raccourcis d'un expert :ok:
(à savoir; j'ai bac+8 en génie logiciel, je suis spécialiste en méthodes formelles, spéc, simulation, tests, etc.)

donc aucune difficulté pour m'y mettre (je maitrise tous les paradigmes, y compris les systèmes d'inférence)

aussi : je connais la théorie derrière le bordel, il me manque des pistes solides pour la pratique, comment tu modélises un truc ? comment tu fais pour entrainer un modèle ?

j'ai besoin de savoir ceci :

  • quel framework ?
  • quel language ?
  • y'a t il des tutos ?
  • comment utiliser nosql CONCRETEMENT ?
  • y'a t il des case study cool pour s'y mettre ?

:merci: :ange:

Le 27 octobre 2020 à 21:18:03 A4-SFX a écrit :
Que penses tu des œuvres d'Isaac Asimov ? :(

De nom mais jamais lu

tu conseilles ? :(

Le 27 octobre 2020 à 21:16:24 Sylves a écrit :

Le 27 octobre 2020 à 21:10:17 carrycature a écrit :

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

Merci. C'est ouf je fais un stage de recherche en ML (que de l'apprentissage supervisé mais bon), à part le RL vite fait le reste j'ai jamais lu de papiers dessus. :( Là je cherche des stages je partais plus sur des trucs style similarity learning, model compactization (les boîtes ont l'air de pas mal en faire), transfer learning, mais je garde en tête !

Merci l'auteur aussi !

Model compactization regarde du côté de Nice pour la province . Regarde comme publi l'hypothèse du ticket de loterie, les méthodes de pruning, distillation et quantization!
J'aime bien les reseaux binaire pour ça aussi!

Le 27 octobre 2020 à 21:19:50 Lkheyny a écrit :

Le 27 octobre 2020 à 21:18:03 A4-SFX a écrit :
Que penses tu des œuvres d'Isaac Asimov ? :(

De nom mais jamais lu

tu conseilles ? :(

J'ai pas encore commencé, c'est justement pour ça que je posais la question :hap: J'ai tout qui attends dans ma liseuse.

Le 27 octobre 2020 à 21:18:59 ConstellationDe a écrit :
Il faut connaitre quoi en info pour faire du machine learning? Sachant que je fait du c++/c et python, et que j'ai déjà codé un moteur et un serveur web avec une base de donnée, et que je suis en l2 math.

Je voudrais prendre de l'avance sur un possible master en ml ou dl, il y a google mais si tu peux resumer en 2/3 termes stp :hap:

base de donnée et systeme distribué coté info, en math bosse ton algebre et tes stat/proba, apres t'apprendra la plupart des truc sur le tas ou de ton coté. C++ t'as déja un gros atout comparé aux autres, essaye peut etre un truc en scala, si tu veux boosté tes modeles quand c'est "lent"

Le 27 octobre 2020 à 21:01:01 Lkheyny a écrit :

Le 27 octobre 2020 à 21:00:13 TheRamech a écrit :
Différence entre deep learning et machine learning ?

Comment apprendre ça en étant autodidacte ? Sachant que je sais programmer depuis longtemps :noel:

Déjà répondu page 1 haha :)

Go Fast Ai, le cours est sympa, et gratuit !

Merci :-)

Le 27 octobre 2020 à 21:19:35 el-famoso-rino a écrit :
Clé ton topic pouvait pas mieux tomber :bave:

je suis dans un tournant de ma life, j'ai justement décidé de me mettre à la data,
j'ai besoin de savoir par où commencer.
je pourrais effectivement scruter le web pendant des heures etc

mais rien ne vaut les raccourcis d'un expert :ok:
(à savoir; j'ai bac+8 en génie logiciel, je suis spécialiste en méthodes formelles, spéc, simulation, tests, etc.)

donc aucune difficulté pour m'y mettre (je maitrise tous les paradigmes, y compris les systèmes d'inférence)

aussi : je connais la théorie derrière le bordel, il me manque des pistes solides pour la pratique, comment tu modélises un truc ? comment tu fais pour entrainer un modèle ?

j'ai besoin de savoir ceci :

  • quel framework ?
  • quel language ?
  • y'a t il des tutos ?
  • comment utiliser nosql CONCRETEMENT ?
  • y'a t il des case study cool pour s'y mettre ?

:merci: :ange:

fais les tutos de fast.ai khey si t'es déja dev c'est super accessible, nosql etc ça dépend vraiment de la boite ou t'es et de leur type de données; Voit aussi coté data engineering si ça t'interesse tout ce qui est kafka streaming de la data, ya un supee bouquin, "building data intensive applications"

Le 27 octobre 2020 à 21:20:10 carrycature a écrit :

Le 27 octobre 2020 à 21:16:24 Sylves a écrit :

Le 27 octobre 2020 à 21:10:17 carrycature a écrit :

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

Merci. C'est ouf je fais un stage de recherche en ML (que de l'apprentissage supervisé mais bon), à part le RL vite fait le reste j'ai jamais lu de papiers dessus. :( Là je cherche des stages je partais plus sur des trucs style similarity learning, model compactization (les boîtes ont l'air de pas mal en faire), transfer learning, mais je garde en tête !

Merci l'auteur aussi !

Model compactization regarde du côté de Nice pour la province . Regarde comme publi l'hypothèse du ticket de loterie, les méthodes de pruning, distillation et quantization!
J'aime bien les reseaux binaire pour ça aussi!

L'hypothèse ticket lotterie y'a un rapport avec problème des bandits manchots ou rien à voir ? :(

Le 27 octobre 2020 à 21:20:10 carrycature a écrit :

Le 27 octobre 2020 à 21:16:24 Sylves a écrit :

Le 27 octobre 2020 à 21:10:17 carrycature a écrit :

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

Merci. C'est ouf je fais un stage de recherche en ML (que de l'apprentissage supervisé mais bon), à part le RL vite fait le reste j'ai jamais lu de papiers dessus. :( Là je cherche des stages je partais plus sur des trucs style similarity learning, model compactization (les boîtes ont l'air de pas mal en faire), transfer learning, mais je garde en tête !

Merci l'auteur aussi !

Model compactization regarde du côté de Nice pour la province . Regarde comme publi l'hypothèse du ticket de loterie, les méthodes de pruning, distillation et quantization!
J'aime bien les reseaux binaire pour ça aussi!

Ouais justement y a une publi qu'est passée en lottery ticket hypothesis appliqué à mon domaine dans une conférence à laquelle j'assistais qui normalement était pas du tout faite pour ça, j'ai adoré :hap:

Je vais voir du côté de Nice, mais Sophia c'est mort trop paumé, pire que Saclay :hap:

L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Le 27 octobre 2020 à 21:24:29 JulianSark a écrit :

Le 27 octobre 2020 à 21:19:35 el-famoso-rino a écrit :
Clé ton topic pouvait pas mieux tomber :bave:

je suis dans un tournant de ma life, j'ai justement décidé de me mettre à la data,
j'ai besoin de savoir par où commencer.
je pourrais effectivement scruter le web pendant des heures etc

mais rien ne vaut les raccourcis d'un expert :ok:
(à savoir; j'ai bac+8 en génie logiciel, je suis spécialiste en méthodes formelles, spéc, simulation, tests, etc.)

donc aucune difficulté pour m'y mettre (je maitrise tous les paradigmes, y compris les systèmes d'inférence)

aussi : je connais la théorie derrière le bordel, il me manque des pistes solides pour la pratique, comment tu modélises un truc ? comment tu fais pour entrainer un modèle ?

j'ai besoin de savoir ceci :

  • quel framework ?
  • quel language ?
  • y'a t il des tutos ?
  • comment utiliser nosql CONCRETEMENT ?
  • y'a t il des case study cool pour s'y mettre ?

:merci: :ange:

fais les tutos de fast.ai khey si t'es déja dev c'est super accessible, nosql etc ça dépend vraiment de la boite ou t'es et de leur type de données; Voit aussi coté data engineering si ça t'interesse tout ce qui est kafka streaming de la data, ya un supee bouquin, "building data intensive applications"

Oui, tuto fast ai, et regarde Kaggle !

Cherche Kaggle Titanic, et regarde les meilleurs notebook, ça te donnera une idée de projets ML du début à la fin

Et tu peux lire Aurélien Géron aussi si c'est la pratique qui t'intéresse

Le 27 octobre 2020 à 21:24:48 Lkheyny a écrit :

Le 27 octobre 2020 à 21:20:10 carrycature a écrit :

Le 27 octobre 2020 à 21:16:24 Sylves a écrit :

Le 27 octobre 2020 à 21:10:17 carrycature a écrit :

Le 27 octobre 2020 à 21:08:38 Sylves a écrit :
L'auteur, le meilleur master de maths pour l'apprentissage à part MVA ?

Sinon, quels domaines de recherches te semblent prometteurs en ML ?

Dernière question : des boîtes à conseiller en France pour de la R&D / recherche pure ?

En domaine de recherche tu as le RL, les GNN, la causalité, le Federated learning, le contrastive learning qui sont pas mal

Merci. C'est ouf je fais un stage de recherche en ML (que de l'apprentissage supervisé mais bon), à part le RL vite fait le reste j'ai jamais lu de papiers dessus. :( Là je cherche des stages je partais plus sur des trucs style similarity learning, model compactization (les boîtes ont l'air de pas mal en faire), transfer learning, mais je garde en tête !

Merci l'auteur aussi !

Model compactization regarde du côté de Nice pour la province . Regarde comme publi l'hypothèse du ticket de loterie, les méthodes de pruning, distillation et quantization!
J'aime bien les reseaux binaire pour ça aussi!

L'hypothèse ticket lotterie y'a un rapport avec problème des bandits manchots ou rien à voir ? :(

Non pas du tout, je t'invite à lire le papier : https://arxiv.org/abs/1803.03635

Pas contre si quelqu'un a de bonnes ressources sur les bandit contextuel je suis preneur...

Le 27 octobre 2020 à 21:26:34 yNd a écrit :
L'op tu a déjà publié à NeurIPS / ICLR et autres ?

Issou

Tu m'as pris pour Yann LeKun ?

Non je n'ai pas fait phd, trop risqué à mon gout et pas le niveau en math :(

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 341