EXPERT Machine Learning Je réponds à tout
Le 27 octobre 2020 à 20:43:06 XorTir a écrit :
Je fais de la gestion de projet data a l'aide du machine learning et j'aimerai savoir si ton avis est le même que le mien : je trouve que y a vraiment une bulle autour de ces sujets.Clairement y a plein de boîtes qui cherchent a nous vendre des solution miracle alors que derrière ça fait pas mieux que des algo avec des règles toutes simples. Et par ailleurs, les business sont tellement a l'ouest, ils comprennent archi rien a l'algorithmiqie déjà alors que le machine learning jen parle même pas. Je trouve que les data scientiste en général aussi ils s imaginent que tous 'es problèmes du monde peuvent être résolu avec de la DS ce qui est totalement faux.
Oui 100% d'accord avec toi
99.99% des data scientists utilisent modèles sklearn au mieux.
Et les clients s'en foutent de toute façon d'avoir des modèles optimisés sérieusement ou non.
Oui, il y a une bulle autour de ces sujets, après dans les problèmes décisionnels c'est tjr mieux un peu de ML même baclé qu'une sheet excel non ?
Mais ouais tkt je vois ce que tu veux dire
Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)Je n'ai pas fait thèse btw
Ok pas mal !
Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)
Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.
Euh, dans un projet ML tu as du data engineering.
Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.
Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)
Et en fonction du business, les problématiques de scalabilite, de rafraîchissement et autres, qui font que même appliquer une régression logistique, la plupart des boîtes se cassent les dents dessus
Le 27 octobre 2020 à 20:45:21 carrycature a écrit :
Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)Je n'ai pas fait thèse btw
Ok pas mal !
Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)
Euh connais pas arbre de Mondrian Tu peux m'en dire plus ? Jamais vu ce terme
Ca n'a rien à voir avec les CART ?
Tu penses qu'il est possible de finir data scientist en sortant d'une business school ?
Quels langages sont indispensables en dehors de python et SQL ?
Il faut aussi maîtriser l'algèbre linéaire ?
Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :
Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.Euh, dans un projet ML tu as du data engineering.
Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.
Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)
Mais Data engineering c'est ceux qui s'occupent de faire l'archi pour gérer les données, les pipeline... Toi tu parles de feature engineering....
Le 27 octobre 2020 à 20:43:08 Lkheyny a écrit :
Le 27 octobre 2020 à 20:41:12 yNd a écrit :
explique moi brievement pourquoi la CROSS ENTROPY LOSS est une fonction de perte qui fait sensElle est utilisée dans régression logistique non ?
Euh, comment ça pourquoi elle fait sens ? Pour la logistique tu veux dire ? Bah quand tu fais l'optimisation par Maximum de Vraisemblance d'une densité de logistique tu obtiens exactement ça
Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :
Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.Euh, dans un projet ML tu as du data engineering.
Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.
Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)
non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur
mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille
Le 27 octobre 2020 à 20:46:33 Lkheyny a écrit :
Le 27 octobre 2020 à 20:45:21 carrycature a écrit :
Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :
Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :
Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)need la reponse
https://arxiv.org/abs/1810.00825
Et j'ai dit expert ML pas deep
Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)Je n'ai pas fait thèse btw
Ok pas mal !
Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)
Euh connais pas arbre de Mondrian Tu peux m'en dire plus ? Jamais vu ce terme
Ca n'a rien à voir avec les CART ?
C'est un type d'arbre de décision que tu peux utiliser en apprentissage en ligne
https://arxiv.org/abs/1406.2673
Et source de ce que je racontes: ma propre expérience, plusieurs années dans une boîte réputée dans ce domaine là, et qui avait déjà du ML en prod il y a quasi 10 ans quand la plupart des grands groupes n'en avaient même pas entendu parler. Et malgré ça, le taff de la plupart des data scientist/ml engineers étaient bidons et overrated à mort.
Le challenge, ça reste côté data engineering, c'est à dire la mise en place des systèmes et frameworks qui permettent de faire tourner tous les outils dont se serviront ensuite tes data scientist.
Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ?
Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux
Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier
C'est dur khey
1) Deep Learning c'est le fait de faire des modèles avec des millions de paramètres cachés. Ces modèles très complexes peuvent apprendre des détails qui t'échappent à l'oeil, genre les contours de ton image, les variations couleur des pixels, les bords, la forme des angles, ect... En gros ça capture des millions de petits détails qui t'échappent.
Ce qui est génial c'est que tu peux utiliser un modèle entraîné pour faire une reconnaissance d'image entre 1000 classes possibles (genre chien / chat / table ) qui a été entrainé sur super ordinateur, et utiliser ton petit PC pour lui faire apprendre à distinguer entre une photo de toi et photo de ta copine ! Le réseau va utiliser son savoir précédemment acquis pour atteindre ton objectif: ça s'appelle du transfert learning
2) Si tu veux apprendre à en faire il te faut:
1) Un PC
2) Python
3) Cherche "deep learning fast ai course", dès le premier cours tu sauras faire ce modèle de distinction
Le 27 octobre 2020 à 20:49:48 carrycature a écrit :
Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ?Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux
A quelles ressources fais tu allusion ?
Le 27 octobre 2020 à 20:44:14 HyperTalk a écrit :
laisse deviner tes langages: python, c++ et R ?
Python et R, j'ai pas vraiment fait de C++ désolé
Données du topic
- Auteur
- Lkheyny
- Date de création
- 27 octobre 2020 à 20:13:23
- Nb. messages archivés
- 215
- Nb. messages JVC
- 215