EXPERT Machine Learning Je réponds à tout

27 octobre 2020 à 20:44:33

Le 27 octobre 2020 à 20:43:06 XorTir a écrit :
Je fais de la gestion de projet data a l'aide du machine learning et j'aimerai savoir si ton avis est le même que le mien : je trouve que y a vraiment une bulle autour de ces sujets.
Clairement y a plein de boîtes qui cherchent a nous vendre des solution miracle alors que derrière ça fait pas mieux que des algo avec des règles toutes simples. Et par ailleurs, les business sont tellement a l'ouest, ils comprennent archi rien a l'algorithmiqie déjà alors que le machine learning jen parle même pas. Je trouve que les data scientiste en général aussi ils s imaginent que tous 'es problèmes du monde peuvent être résolu avec de la DS ce qui est totalement faux.

Oui 100% d'accord avec toi

99.99% des data scientists utilisent modèles sklearn au mieux.

Et les clients s'en foutent de toute façon d'avoir des modèles optimisés sérieusement ou non.

Oui, il y a une bulle autour de ces sujets, après dans les problèmes décisionnels c'est tjr mieux un peu de ML même baclé qu'une sheet excel non ?

Mais ouais tkt je vois ce que tu veux dire

Jauseff5

27 octobre 2020 à 20:45:10

Possible d'en faire sans rien savoir en maths ?

carrycature

27 octobre 2020 à 20:45:21

Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)
need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)
Je n'ai pas fait thèse btw

Ok pas mal !

Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)

Lkheyny

27 octobre 2020 à 20:45:48

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

chibbimitia

27 octobre 2020 à 20:46:23

Une vraie prod quoi, où tes modèles sont dans le chemin critique du business, avec toutes les contraintes que cela peut impliquer en terme d'opérationel. Pas un dash board qui servira à faire joli et à pouvoir dire que nous aussi, on fait du mal.
Et en fonction du business, les problématiques de scalabilite, de rafraîchissement et autres, qui font que même appliquer une régression logistique, la plupart des boîtes se cassent les dents dessus

INFP_mignon

27 octobre 2020 à 20:46:33

tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

Lkheyny

27 octobre 2020 à 20:46:33

Le 27 octobre 2020 à 20:45:21 carrycature a écrit :
Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)
need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)
Je n'ai pas fait thèse btw
Ok pas mal !
Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)

Euh connais pas arbre de Mondrian Tu peux m'en dire plus ? Jamais vu ce terme

Ca n'a rien à voir avec les CART ?

Nicolasdu91

27 octobre 2020 à 20:47:19

Tu penses qu'il est possible de finir data scientist en sortant d'une business school ?

Quels langages sont indispensables en dehors de python et SQL ?

Il faut aussi maîtriser l'algèbre linéaire ?

carrycature

27 octobre 2020 à 20:47:20

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :
Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.
Euh, dans un projet ML tu as du data engineering.
Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.
Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

Mais Data engineering c'est ceux qui s'occupent de faire l'archi pour gérer les données, les pipeline... Toi tu parles de feature engineering....

JadoreDrisser

27 octobre 2020 à 20:47:28

Oui

yNd

27 octobre 2020 à 20:47:46

Le 27 octobre 2020 à 20:43:08 Lkheyny a écrit :
Le 27 octobre 2020 à 20:41:12 yNd a écrit :
explique moi brievement pourquoi la CROSS ENTROPY LOSS est une fonction de perte qui fait sens
Elle est utilisée dans régression logistique non ?
Euh, comment ça pourquoi elle fait sens ? Pour la logistique tu veux dire ? Bah quand tu fais l'optimisation par Maximum de Vraisemblance d'une densité de logistique tu obtiens exactement ça

non mais quelle est la logique derrière cette fonction

Free_benalla

27 octobre 2020 à 20:47:49

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :
Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.
Euh, dans un projet ML tu as du data engineering.
Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.
Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

carrycature

27 octobre 2020 à 20:48:27

Le 27 octobre 2020 à 20:46:33 Lkheyny a écrit :
Le 27 octobre 2020 à 20:45:21 carrycature a écrit :
Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)
need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)
Je n'ai pas fait thèse btw
Ok pas mal !
Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)
Euh connais pas arbre de Mondrian Tu peux m'en dire plus ? Jamais vu ce terme
Ca n'a rien à voir avec les CART ?

C'est un type d'arbre de décision que tu peux utiliser en apprentissage en ligne
https://arxiv.org/abs/1406.2673

Pseudo supprimé

27 octobre 2020 à 20:48:28

C'est quoi machine learning ? Comment ça marche ? J'entends ça partout mais je ne sais pas ce que c'est

RusczykDeter

27 octobre 2020 à 20:49:06

utilité de lire la bible de murphy quand on peut juste lire géron ?

chibbimitia

27 octobre 2020 à 20:49:44

Et source de ce que je racontes: ma propre expérience, plusieurs années dans une boîte réputée dans ce domaine là, et qui avait déjà du ML en prod il y a quasi 10 ans quand la plupart des grands groupes n'en avaient même pas entendu parler. Et malgré ça, le taff de la plupart des data scientist/ml engineers étaient bidons et overrated à mort.

Le challenge, ça reste côté data engineering, c'est à dire la mise en place des systèmes et frameworks qui permettent de faire tourner tous les outils dont se serviront ensuite tes data scientist.

carrycature

27 octobre 2020 à 20:49:48

Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ?

Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux

Lkheyny

27 octobre 2020 à 20:49:59

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

C'est dur khey

1) Deep Learning c'est le fait de faire des modèles avec des millions de paramètres cachés. Ces modèles très complexes peuvent apprendre des détails qui t'échappent à l'oeil, genre les contours de ton image, les variations couleur des pixels, les bords, la forme des angles, ect... En gros ça capture des millions de petits détails qui t'échappent.

Ce qui est génial c'est que tu peux utiliser un modèle entraîné pour faire une reconnaissance d'image entre 1000 classes possibles (genre chien / chat / table ) qui a été entrainé sur super ordinateur, et utiliser ton petit PC pour lui faire apprendre à distinguer entre une photo de toi et photo de ta copine ! Le réseau va utiliser son savoir précédemment acquis pour atteindre ton objectif: ça s'appelle du transfert learning

2) Si tu veux apprendre à en faire il te faut:
1) Un PC
2) Python
3) Cherche "deep learning fast ai course", dès le premier cours tu sauras faire ce modèle de distinction

Lkheyny

27 octobre 2020 à 20:50:27

Le 27 octobre 2020 à 20:49:48 carrycature a écrit :
Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ?
Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux

A quelles ressources fais tu allusion ?

Lkheyny

27 octobre 2020 à 20:50:44

Le 27 octobre 2020 à 20:44:14 HyperTalk a écrit :
laisse deviner tes langages: python, c++ et R ?

Python et R, j'ai pas vraiment fait de C++ désolé

Données du topic

Auteur: Lkheyny
Date de création: 27 octobre 2020 à 20:13:23
Nb. messages archivés: 215
Nb. messages JVC: 215

En ligne sur JvArchive 237

JvArchive compagnon

Découvrez JvArchive compagnon, le nouvel userscript combattant la censure abusive sur le 18-25 !