Usar la moda como promedio cuando tenemos datos atipicos

Respuestas

Respuesta dada por: karenkookie
1



Cómo calcular datos atípicos

En estadística, un valor atípico es un dato que es considerablemente diferente a los otros datos de la muestra. Con frecuencia, los valores atípicos en un conjunto de datos pueden alertar a los estadísticos sobre las anormalidades experimentales o los errores en las mediciones tomadas, y debido a esto puede que los descarten del conjunto de datos. Si los valores atípicos del conjunto se ignoran, puede haber cambios importantes en las conclusiones obtenidas del estudio. Por eso, saber cómo calcular y evaluar los valores atípicos es importante para asegurar la comprensión apropiada de los datos estadísticos.

Pasos

1

Aprende cómo reconocer los posibles valores atípicos. Antes de decidir si deberías o no ignorar los valores atípicos de cierto conjunto de datos, primero, obviamente, debemos identificar los posibles valores atípicos del conjunto de datos. A grandes rasgos, los valores atípicos son datos que son muy diferentes a la tendencia expresada por los otros valores del conjunto de datos. En otras palabras, se ubican distantes a los otros valores. Generalmente es fácil detectar esto en las tablas de datos o (especialmente) en los gráficos. Si el conjunto de datos se expresa visualmente en un gráfico, los valores atípicos se ubican “distantes” a los otros valores. Si, por ejemplo, la mayoría de los datos en un conjunto de datos formaran una línea recta, no se podría interpretar razonablemente que los valores atípicos fueran parte de esa línea.Vamos a tomar un conjunto de datos que representa las temperaturas de 12 objetos diferentes en un cuarto. Si 11 de los objetos tienen temperaturas cercanas a 70 grados Fahrenheit (21 grados Celsius), pero el duodécimo objeto, un horno, tiene una temperatura de 300 grados Fahrenheit (150 grados Celsius), una observación rápida te indicará que probablemente el horno sea un valor atípico.


2

Ordena los datos de menor a mayor. El primer paso para calcular los valores atípicos en un conjunto de datos es encontrar el valor de la mediana (del medio) del conjunto de datos. Esta tarea se simplifica mucho si los valores del conjunto de datos están en orden de menor a mayor. Por eso, antes de continuar, ordena los valores del conjunto de datos de esta forma.Continuemos con el ejemplo de arriba. El siguiente es el conjunto de datos que representa las temperaturas de varios objetos en un cuarto: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Si ordenamos los valores del conjunto de datos de menor a mayor, nuestro conjunto de valores es: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.

3

Calcula la mediana del conjunto de datos. La mediana del conjunto de datos es el dato por sobre el cual se encuentra la mitad de los datos y por debajo del cual se encuentra la otra mitad de los datos; básicamente, es el valor “en el medio” del conjunto de datos. Si el conjunto de datos contiene un número impar de datos, es fácil encontrarla (la mediana va a ser el dato que tenga el mismo número de valores sobre y por debajo de sí). Sin embargo, si hay un número par de datos, entonces, no hay un único punto medio, los dos puntos medios se deben promediar para encontrar la mediana. Observa que al calcular los valores atípicos, generalmente se le asigna la variable Q2 a la mediana, debido a que se encuentra entre Q1 y Q3, el primer y el tercer cuartil, los cuales definiremos más adelante.No te confundas si el conjunto de datos tiene un número par de valores. El promedio de los dos valores frecuentemente es un número que no aparece en el conjunto de datos en sí; esto es normal. Sin embargo, si los dos valores del medio son el mismo número, el promedio, obviamente, será ese mismo número, y esto también es normal.En nuestro ejemplo tenemos 12 valores o datos. Los 2 valores del medio corresponden a los datos 6 y 7, 70 y 71 respectivamente. Por lo tanto, la mediana de nuestro conjunto de datos es el promedio de estos dos valores: ((70 + 71) / 2), = 70,5.

Preguntas similares