Découvrez les bases de l’intelligence artificielle à travers un ouvrage clair, pratique et accessible, qui vous guide pas à pas pour manipuler les données, entraîner des modèles et comprendre les algorithmes du Machine Learning.
Commander
Cet ouvrage propose une approche différente pour apprendre le machine learning : comprendre les algorithmes en profondeur, sans se limiter aux bibliothèques préexistantes ni aux mathématiques complexes. J’explique les méthodes de manière simple et mathématique, sans programmation, afin que l’apprenant puisse créer ses propres bibliothèques dans n’importe quel langage et même développer de nouvelles méthodes. Cette approche ouvre également des perspectives pour la recherche et l’innovation en apprentissage automatique.
Ce chapitre présente les principales mesures d’évaluation : matrice de confusion, exactitude, précision, rappel, F1-score, MSE, R², Log-Loss, ainsi que l’analyse de la courbe ROC et de l’AUC.
Ce chapitre aborde le nettoyage et la préparation des données : gestion des valeurs manquantes, création et encodage des variables (One-Hot, Label), transformations logarithmiques, ainsi que la normalisation et la standardisation (Min-Max, Z-score, Robust).
Ce chapitre aborde l’analyse des relations entre variables : corrélations de Pearson et de Spearman, matrice de corrélation, test du Chi-deux d’indépendance et analyse de la variance (ANOVA).
Ce chapitre traite du déséquilibre des classes : identification du problème, application du sous-échantillonnage, du sur-échantillonnage, de la méthode Tomek Links et de la technique SMOTE pour équilibrer les données.
Ce chapitre présente l’ajustement de modèles linéaires simples, multiples ou polynomiaux, ainsi que l’application de la régression Ridge et de la régression logistique pour l’interprétation des probabilités.
Ce chapitre aborde les bases de la classification : calcul des probabilités avec le théorème de Bayes, méthode des k plus proches voisins, construction et interprétation d’arbres de décision, ainsi que l’entraînement d’un perceptron et l’analyse de ses poids.
Ce chapitre présente le regroupement de données avec K-Means, l’évaluation des clusters à l’aide du coefficient de Silhouette et l’analyse de leur qualité et cohérence.