- Technique de prétraitement des données utilisée pour transformer les données non linéaires en données linéaires : - Transformation logarithmique - Prétraitement de données PAS utilisée pour améliorer la qualité des données : - Augmentation de la variance - Quelle est la principale différence entre l'apprentissage supervisé et l'apprentissage non supervisé : - L'apprentissage supervisé nécessite des données étiquetées, tandis que l'apprentissage non supervisé ne le fait pas. - Quelle affirmation est VRAIE concernant la validation croisée : - Elle est utilisée pour évaluer la performance d'un modèle d'apprentissage automatique - Quelle affirmation est VRAIE concernant l'apprentissage non supervisé : - Il est utilisé pour découvrir des modèles cachés dans les données - Quelle est la technique d'apprentissage automatique utilisée pour regrouper des données en fonction de leur similarité et de leur densité ? - Clustering - Qu'est-ce que le sur-apprentissage dans l'apprentissage automatique ? - Lorsque le modèle est trop complexe et qu'il commence à mémoriser les données d'entraînement plutôt que de généraliser à de nouvelles données. - Quelle affirmation est FAUSSE concernant l'apprentissage supervisé ? - Il est basé sur l'apprentissage par renforcement - Qu'est-ce que la descente de gradient dans l'apprentissage automatique ? - Une technique utilisée pour optimiser les coefficients d'un modèle en minimisant la fonction de coût. - Quelle affirmation est VRAIE concernant l'apprentissage profond ? - Il nécessite un grand nombre de données d'entraînement - Qu'est-ce que le biais dans l'apprentissage automatique ? - La différence entre les prédictions d'un modèle et les valeurs réelles. - Quelle est la métrique couramment utilisée pour évaluer la performance d'un modèle de régression ? - Erreur quadratique moyenne - Qu'est-ce que la validation croisée dans l'apprentissage automatique ? - Une technique utilisée pour sélectionner les hyperparamètres d'un modèle en divisant les données en un ensemble d'entraînement et un ensemble de validation. - Qu'est-ce que la régularisation dans l'apprentissage automatique ? - Une technique utilisée pour réduire la suradaptation en ajoutant une pénalité aux coefficients du modèle. - Quelle est la technique d'apprentissage automatique utilisée pour identifier les caractéristiques les plus importantes dans un ensemble de données ? - Arbre de décision - Quelle est la technique de clustering utilisée pour regrouper des données non étiquetées en fonction de leur similarité ? - K-means - Quelle est la technique d'apprentissage automatique utilisée pour prédire une variable continue ? - Régression linéaire - Quelle est la fonction d'activation couramment utilisée dans les réseaux de neurones pour les problèmes de régression ? - Linéaire - Qu'est-ce que le clustering K-means ? - Une technique de clustering non hiérarchique qui regroupe les données en un seul niveau de clusters. - Quelle est la technique d'apprentissage automatique utilisée pour identifier les anomalies dans les données ? - Réseau de neurones auto-encodeur - Qu'est-ce que la variance dans l'apprentissage automatique ? - La différence entre les prédictions d'un modèle et les valeurs prédites par un modèle plus complexe. - Qu'est-ce que le clustering dans l'apprentissage automatique ? - Une technique utilisée pour regrouper des données non étiquetées en fonction de leur similarité. - Quel algorithme de réseau de neurones n'est PAS utilisé pour la classification d'images ? - Machine à vecteurs de support (SVM) - Quelle est la technique de réduction de la dimensionalité utilisée pour projeter des données à haute dimensionalité dans un espace de dimensionalité inférieure tout en préservant la variance des données ? - Analyse en composantes principales (ACP) - Qu'est-ce que la fonction de coût dans l'apprentissage automatique ? - Une fonction utilisée pour optimiser les paramètres d'un modèle. - Quel est l'algorithme d'apprentissage automatique le plus couramment utilisé pour la classification des images ? - Réseau de neurones convolutif - Quelle est la fonction d'activation couramment utilisée dans les réseaux de neurones multi-couches pour les problèmes de classification binaire ? - Sigmoïde - Quelle est la principale différence entre un réseau de neurones profond et un réseau de neurones peu profond ? - Le nombre de couches cachées - Qu'est-ce que la matrice de confusion dans l'apprentissage automatique ? - Un tableau utilisé pour évaluer la performance d'un modèle de classification.