From abc85932e7cc04f7cd845d2218efb851c57e2b64 Mon Sep 17 00:00:00 2001 From: marcellus Date: Wed, 25 Jun 2025 13:57:16 +0200 Subject: notes: 2025-06-25 13:57:16 from w11 --- PBS1/Rapport.md | 88 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 88 insertions(+) create mode 100644 PBS1/Rapport.md (limited to 'PBS1') diff --git a/PBS1/Rapport.md b/PBS1/Rapport.md new file mode 100644 index 0000000..8561052 --- /dev/null +++ b/PBS1/Rapport.md @@ -0,0 +1,88 @@ +Pour réaliser un rapport complet sur l'analyse du jeu de données "bebes", voici une structure détaillée que vous pouvez suivre. Cette structure inclut une introduction, une méthodologie, une analyse des données, et une conclusion. Vous pouvez utiliser des outils comme R ou Python pour effectuer les analyses et générer les visualisations nécessaires. + +# Introduction + +Le jeu de données "bebes.csv" contient des informations sur 1173 nouveau-nés, caractérisés par huit variables différentes. + +Ces variables sont : +- **bwt** : la masse du bébé à la naissance (kg) +- **weight** : la masse de la mère au début de la grossesse (kg) +- **height** : la taille de la mère (cm) +- **age** : l'âge de la mère (années) +- **gestation** : la durée de la grossesse (jours) +- **parity** : indicateur si c'est le premier accouchement donnant un enfant vivant +- **smoke** : indicateur si la mère fume +- **tension** : la tension artérielle moyenne de la mère pendant la grossesse +Cette étude vise à comparer la distribution de la masse des bébés avec une loi normale, et à étudier les relations entre différentes variables quantitatives et qualitatives. +# Méthodologie +## Distribution de la masse des bébés +Pour étudier la distribution de la masse des bébés, nous allons : +1. Tracer un histogramme de la variable **bwt**. +2. Comparer cette distribution avec la densité de la loi normale ($\mathcal{N}(\mu, \sigma)$), où $\mu$ est la moyenne et $\sigma$ l'écart-type de **bwt**. +3. Tracer la fonction de répartition empirique de **bwt** et la comparer avec la fonction de répartition de la loi normale. +4. Utiliser la droite de Henry et le test de Shapiro-Wilk pour évaluer la normalité de la distribution. +## Relations de dépendance +Pour étudier les relations de dépendance entre les variables, nous allons : +1. Analyser la relation entre deux variables quantitatives (**gestation** et **bwt**) en utilisant le test de corrélation. +2. Analyser la relation entre une variable quantitative (**bwt**) et une variable qualitative (**smoke**) en utilisant le test t de Student. +3. Analyser la relation entre deux variables qualitatives (**parity** et **smoke**) en utilisant le test du Chi-Carré. + +Notre analyse s'effectue en 3 étapes. +### Adaptation des variables +Certaines variables sont au format texte ou date, nous les convertissons en facteur R ou uniquement en année. +### Evaluation de l'indépendance des variables +La comparaison de deux variables dépend du type de celles-ci. Nous emploierons des méthodes différentes pour chaque type de variable afin de déterminer la relation qui les lie. +Si les variables sont : +- Numériques (quantitatives), nous utiliserons la fonction `corr.test()` +- Catégorielle (qualitatives), nous utiliserons la fonction `chisq.test()` +- Catégorielle (à 2 groupes) et numérique, nous utiliserons la fonction `t.test()` +- Catégorielle (à 2 groupes ou plus) et numérique, nous utiliserons la fonction `aov()` +### Traitement des résultats +Chaque test effectué précédemment renvoie des données, dont la *p-value* `p`. Cette valeur détermine l'acceptation de l'hypothèse $H_{0}$ selon les critères suivants pour un niveau $\alpha$: +- Si $p < \alpha$, $H_{0}$ est rejetée au niveau $\alpha$ +- Si $p > \alpha$, $H_{0}$ est acceptée au niveau $\alpha$ +Cette *p_value* mesure donc l'importance de la statistique observée au regard de $H_{0}$ +# Analyse des données + +## Distribution de la masse des bébés + +### Histogramme et densité normale + +![Histogramme de bwt](path_to_histogram_plot) + +L'histogramme montre la distribution de la masse des bébés à la naissance. La courbe de densité normale superposée permet de comparer visuellement la distribution des données avec une distribution normale théorique. + +### Fonction de répartition + +![Fonction de répartition de bwt](path_to_cdf_plot) + +La fonction de répartition empirique de `bwt` est comparée avec la fonction de répartition de la loi normale. Cette comparaison permet de visualiser les écarts entre la distribution des données et une distribution normale. + +### Droite de Henry et test de Shapiro-Wilk + +![Droite de Henry](path_to_qq_plot) + +La droite de Henry permet de visualiser si les données suivent une distribution normale. Le test de Shapiro-Wilk donne une p-value de [valeur], ce qui indique que [interprétation de la p-value]. + +## Relations de dépendance + +### Relation entre gestation et bwt + +![Nuage de points et régression linéaire](path_to_scatter_plot) + +Le test de corrélation donne un coefficient de corrélation de [valeur] avec une p-value de [valeur], ce qui indique que [interprétation de la corrélation]. + +### Relation entre smoke et bwt + +![Histogramme et boîte à moustaches](path_to_boxplot) + +Le test t de Student donne une p-value de [valeur], ce qui indique que [interprétation du test t]. + +### Relation entre parity et smoke + +![Diagramme en bâtons et mosaicplot](path_to_mosaic_plot) + +Le test du chi-carré donne une p-value de [valeur], ce qui indique que [interprétation du test du chi-carré]. +# Conclusion +Cette étude a permis d'analyser la distribution de la masse des bébés à la naissance et d'explorer les relations de dépendance entre différentes variables. Les résultats montrent que [résumé des résultats principaux]. +Les visualisations et comparaisons statistiques utilisées ont permis de tirer des conclusions sur les relations entre les variables étudiées, et d'extrapoler des corrélations avec la masse des nouveaux-nés. Ces analyses sont utiles pour comprendre les facteurs influençant la masse des bébés à la naissance et pour guider des études futures. \ No newline at end of file -- cgit v1.2.3