Les partenaires publicitaires:

Comment faire pour supprimer les valeurs aberrantes dans SPSS

Les valeurs aberrantes dans les analyses statistiques sont les valeurs extrêmes qui ne semblent pas correspondre à la majorité d'un ensemble de données. Si ne sont pas retirés, ces valeurs extrêmes peuvent avoir un grand effet sur les conclusions qui pourraient être tirées des données en question, car ils peuvent fausser les coefficients de corrélation et droites de meilleur ajustement dans la mauvaise direction. SPSS est l'un d'un certain nombre de programmes statistiques de logiciels d'analyse qui peuvent être utilisés pour interpréter un ensemble de données et d'identifier et de supprimer les valeurs aberrantes.

Anaylsis exploratoire de données

  1. Cliquez sur "Analyser". Sélectionnez "Statistiques descriptives" puis "Explorer".

  2. Glissez et déposez les colonnes contenant les données variables dépendantes dans la case "Liste charge." Cliquez sur "OK".

  3. Retirez toutes les valeurs aberrantes identifiées par SPSS dans les parcelles à tiges et à feuilles ou les diagrammes en boîte en supprimant les points de données individuels. Alternativement, vous pouvez mettre en place un filtre pour exclure ces points de données.




  4. Sélectionnez "Données" puis "Select Cases" et cliquez sur une condition qui a aberrantes que vous souhaitez exclure. Déterminer une valeur pour cette condition qui exclut que les valeurs aberrantes et aucun des points de données non-périphériques.

  5. Choisissez "Si condition est satisfaite" dans la boîte "Sélectionner" et puis cliquez sur le bouton "Si" juste en dessous. Entrez la règle d'exclure les valeurs aberrantes que vous avez déterminé à l'étape précédente dans la boîte en haut à droite. Par exemple, si vous étiez excluez mesures ci-dessus 74,5 pouces de la condition "hauteur", vous devez entrer "hauteur lt; = 74,5. "Cliquez sur" Continuer "et" OK "pour activer le filtre.

Analyse de régression

  1. Dans le menu "Analyser", sélectionnez "régression" et puis "linéaire". Sélectionnez les variables dépendantes et indépendantes que vous souhaitez analyser.



  2. Cliquez sur "Enregistrer", puis sélectionnez "la distance de Cook." Les valeurs calculées pour la distance de Cook seront sauvegardés dans votre fichier de données comme variables étiquetés "COO-1."

  3. Exécuter une boîte à moustaches en sélectionnant "Graphiques" suivi par "Boxplot." Cliquez sur "Simple" et sélectionnez "résumés des variables distinctes." Entrez "COO-1" dans la case "boîtes représentent," puis saisissez un ID ou le nom permettant d'identifier les cas dans les "cas de label par" boîte.

  4. Agrandir la boîte à moustaches dans le fichier de sortie en double-cliquant dessus. Prenez note des cas qui se situent au-delà des lignes noires --- ce sont vos valeurs aberrantes. Vous pouvez choisir de supprimer toutes les valeurs aberrantes ou seulement les valeurs extrêmes, qui sont marqués par un astérisque (*).

  5. Retournez dans le fichier de données et de localiser les cas qui doivent être effacées. Travailler de bas en haut, mettez en surbrillance le numéro à l'extrême gauche, dans la colonne grise, de sorte que la totalité de la ligne est sélectionnée. Cliquez sur "Modifier" et sélectionnez "Effacer." Répétez cette étape pour chaque valeur aberrante que vous avez identifié à partir de la boîte à moustaches.

  6. Conseils Avertissements

    • Lors de l'effacement des cas à la section 2, l'étape 5, toujours travailler à partir de la fin du fichier de données en mouvement parce que les numéros d'identification changent lorsque vous effacez un cas. Si vous travaillez à partir du haut vers le bas, vous allez vous retrouver effacer les mauvais cas.
» » » » Comment faire pour supprimer les valeurs aberrantes dans SPSS