Topic de Lkheyny :

EXPERT Machine Learning Je réponds à tout

Le 27 octobre 2020 à 20:43:06 XorTir a écrit :
Je fais de la gestion de projet data a l'aide du machine learning et j'aimerai savoir si ton avis est le même que le mien : je trouve que y a vraiment une bulle autour de ces sujets.

Clairement y a plein de boîtes qui cherchent a nous vendre des solution miracle alors que derrière ça fait pas mieux que des algo avec des règles toutes simples. Et par ailleurs, les business sont tellement a l'ouest, ils comprennent archi rien a l'algorithmiqie déjà alors que le machine learning jen parle même pas. Je trouve que les data scientiste en général aussi ils s imaginent que tous 'es problèmes du monde peuvent être résolu avec de la DS ce qui est totalement faux.

Oui 100% d'accord avec toi

99.99% des data scientists utilisent modèles sklearn au mieux.

Et les clients s'en foutent de toute façon d'avoir des modèles optimisés sérieusement ou non.

Oui, il y a une bulle autour de ces sujets, après dans les problèmes décisionnels c'est tjr mieux un peu de ML même baclé qu'une sheet excel non ? :(

Mais ouais tkt je vois ce que tu veux dire :(

Possible d'en faire sans rien savoir en maths ?

Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :

Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :

Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)

need la reponse

https://arxiv.org/abs/1810.00825

Et j'ai dit expert ML pas deep :)

Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)

Je n'ai pas fait thèse btw

Ok pas mal !

Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

Une vraie prod quoi, où tes modèles sont dans le chemin critique du business, avec toutes les contraintes que cela peut impliquer en terme d'opérationel. Pas un dash board qui servira à faire joli et à pouvoir dire que nous aussi, on fait du mal.
Et en fonction du business, les problématiques de scalabilite, de rafraîchissement et autres, qui font que même appliquer une régression logistique, la plupart des boîtes se cassent les dents dessus
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

Le 27 octobre 2020 à 20:45:21 carrycature a écrit :

Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :

Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :

Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)

need la reponse

https://arxiv.org/abs/1810.00825

Et j'ai dit expert ML pas deep :)

Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)

Je n'ai pas fait thèse btw

Ok pas mal !

Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)

Euh connais pas arbre de Mondrian :( Tu peux m'en dire plus ? Jamais vu ce terme

Ca n'a rien à voir avec les CART ?

Tu penses qu'il est possible de finir data scientist en sortant d'une business school ?

Quels langages sont indispensables en dehors de python et SQL ?

Il faut aussi maîtriser l'algèbre linéaire ?

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

Mais Data engineering c'est ceux qui s'occupent de faire l'archi pour gérer les données, les pipeline... Toi tu parles de feature engineering....

Le 27 octobre 2020 à 20:43:08 Lkheyny a écrit :

Le 27 octobre 2020 à 20:41:12 yNd a écrit :
explique moi brievement pourquoi la CROSS ENTROPY LOSS est une fonction de perte qui fait sens https://image.noelshack.com/fichiers/2016/41/1476132386-1.png

Elle est utilisée dans régression logistique non ?
Euh, comment ça pourquoi elle fait sens ? Pour la logistique tu veux dire ? Bah quand tu fais l'optimisation par Maximum de Vraisemblance d'une densité de logistique tu obtiens exactement ça :(

non mais quelle est la logique derrière cette fonction https://image.noelshack.com/fichiers/2016/41/1476132386-1.png

Le 27 octobre 2020 à 20:45:48 Lkheyny a écrit :

Le 27 octobre 2020 à 20:44:30 nonosim a écrit :
T'en penses quoi du data engineering ? C'est ceux qui préparent les infrastructures de données, les pipelines... Apparemment c'est beaucoup plus recherché que les data scientists, beaucoup moins de diplômés aussi.

Euh, dans un projet ML tu as du data engineering.

Ce à quoi tu réfères je dirais que c'est davantage data mining, extraction donnée ect. Et c'est vital, c'est surtout ça qui fait la qualité d'un modèle ensuite... Garbage in, Garbage Out.

Data Engineering c'est quand tu peaufines tes features, que tu en crées de nouvelles, des intéractions entre elles, des ratios, c'est intéressant à faire en soi ;) (attention à l'overfitting)

non il parle des personne qui prépre les pipeline
en gros ceux qui vont recuperer les données machine, les aggregée en base de données propre et les envoyé au différents utilisateur

mon point de vue perso c'estque je pense que l'apprentissage est probablement plus 'simple' que dev des modèles, car y a un savoir limité en quantitée, docn après qqes années d'exp ta fait le tour des techno et tu te touchche les couille

Le 27 octobre 2020 à 20:46:33 Lkheyny a écrit :

Le 27 octobre 2020 à 20:45:21 carrycature a écrit :

Le 27 octobre 2020 à 20:40:14 Lkheyny a écrit :

Le 27 octobre 2020 à 20:38:28 Free_benalla a écrit :

Le 27 octobre 2020 à 20:37:52 carrycature a écrit :
Connais tu des methodes pour éviter que la self attention soit quadratique selon la taille de l'input (facile celle là)

need la reponse

https://arxiv.org/abs/1810.00825

Et j'ai dit expert ML pas deep :)

Avec tous les modèles possibles en deep, c'est peu crédible d'être expert deep
Enfin, les thésards se concentrent sur des catégories de modèles (là c'est NLP)

Je n'ai pas fait thèse btw

Ok pas mal !

Petite question en ML classique alors ! Quel est la limite computationnelle des arbres de Mondrian (celle là est pas facile)

Euh connais pas arbre de Mondrian :( Tu peux m'en dire plus ? Jamais vu ce terme

Ca n'a rien à voir avec les CART ?

C'est un type d'arbre de décision que tu peux utiliser en apprentissage en ligne
https://arxiv.org/abs/1406.2673

C'est quoi machine learning ? Comment ça marche ? J'entends ça partout mais je ne sais pas ce que c'est https://image.noelshack.com/fichiers/2019/52/2/1577183045-gngngngn.png
utilité de lire la bible de murphy quand on peut juste lire géron ? :)

Et source de ce que je racontes: ma propre expérience, plusieurs années dans une boîte réputée dans ce domaine là, et qui avait déjà du ML en prod il y a quasi 10 ans quand la plupart des grands groupes n'en avaient même pas entendu parler. Et malgré ça, le taff de la plupart des data scientist/ml engineers étaient bidons et overrated à mort.

Le challenge, ça reste côté data engineering, c'est à dire la mise en place des systèmes et frameworks qui permettent de faire tourner tous les outils dont se serviront ensuite tes data scientist.

Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ? :)

Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux

Le 27 octobre 2020 à 20:46:33 INFP_mignon a écrit :
tu peux expliquer le deep learning sans utiliser des mots compliqués et egalement expliquer comment le mettre en place si j'ai par exemple des images et que je voudrais reconnaitre un truc en particulier

C'est dur khey :(

1) Deep Learning c'est le fait de faire des modèles avec des millions de paramètres cachés. Ces modèles très complexes peuvent apprendre des détails qui t'échappent à l'oeil, genre les contours de ton image, les variations couleur des pixels, les bords, la forme des angles, ect... En gros ça capture des millions de petits détails qui t'échappent.

Ce qui est génial c'est que tu peux utiliser un modèle entraîné pour faire une reconnaissance d'image entre 1000 classes possibles (genre chien / chat / table ) qui a été entrainé sur super ordinateur, et utiliser ton petit PC pour lui faire apprendre à distinguer entre une photo de toi et photo de ta copine ! Le réseau va utiliser son savoir précédemment acquis pour atteindre ton objectif: ça s'appelle du transfert learning

2) Si tu veux apprendre à en faire il te faut:
1) Un PC
2) Python
3) Cherche "deep learning fast ai course", dès le premier cours tu sauras faire ce modèle de distinction :)

Le 27 octobre 2020 à 20:49:48 carrycature a écrit :

Le 27 octobre 2020 à 20:49:06 RusczykDeter a écrit :
utilité de lire la bible de murphy quand on peut juste lire géron ? :)

Aucune je le trouve pas top et il y a ses ressources sur le net 100 fois mieux

A quelles ressources fais tu allusion ? :(

Le 27 octobre 2020 à 20:44:14 HyperTalk a écrit :
laisse deviner tes langages: python, c++ et R ?

Python et R, j'ai pas vraiment fait de C++ désolé :(

Données du topic

Auteur
Lkheyny
Date de création
27 octobre 2020 à 20:13:23
Nb. messages archivés
215
Nb. messages JVC
215
En ligne sur JvArchive 237