Respuestas
Respuesta:Antes de lanzarse a la aplicación de técnicas de análisis de datos más complejas, merece la pena invertir el tiempo necesario en conocer a sus precursoras. Entre ellas, podemos destacar cinco:
Media aritmética. Es la suma de una lista de números dividida por el número de elementos en esa lista y se usa para determinar la tendencia general de un conjunto de datos. Hallar el promedio también sirve para obtener una instantánea rápida de la información, puesto que es fácil de calcular. Sin embargo, hay que tener en cuenta que puede ser una herramienta peligrosa. En algunos conjuntos de datos, la media aritmética está estrechamente relacionada con el modo y la mediana y, en muestras con un alto número de valores atípicos o una distribución sesgada, el promedio simplemente no proporcionaría nunca la precisión que se necesita para tomar una decisión consistente.
Desviación estándar. Este cálculo es útil para determinar rápidamente la dispersión de puntos de datos. Una desviación estándar alta significa que los datos se distribuyen más ampliamente desde la media, mientras que una baja indica que hay más datos que se alinean con la media. El problema de usar esta clase de técnicas de análisis de datos está en que al igual que sucedía con la media, la desviación estándar puede inducir a error. Por ejemplo, si los datos tienen un patrón muy extraño, como una curva no normal o una gran cantidad de valores atípicos, la desviación estándar no ilustrará la realidad, al no poder aportar toda la información que necesita.
Determinación del tamaño de la muestra. A veces no es necesario recopilar información de cada miembro de una población y basta con una muestra. Cuando se mide un gran conjunto de datos o población suele ocurrir esto. Sin embargo, la clave está en determinar el tamaño correcto para que la muestra tomada sea precisa. Usando métodos de proporción y desviación estándar, es posible concretar esta medida para que la recopilación de datos sea estadísticamente significativa. El inconveniente de esta técnica tiene que ver con el hecho de que, cuando se estudia una variable nueva, las ecuaciones de proporción podrían necesitar basarse en suposiciones que pueden ser inexactas. De ser así, este error terminaría transfiriéndose a la determinación del tamaño de la muestra, para acabar afectando al resultado del análisis.
Regresión. Sirve para determinar tendencias a lo largo del tiempo, ya que modela las relaciones entre variables dependientes y explicativas, que generalmente se grafican en un diagrama de dispersión, indicando si los vínculos que existen son fuertes o débiles. Al igual que sucedía con las técnicas de análisis de datos precedentes, la regresión está asociada a riesgos. Y es que, a veces, los valores atípicos en un diagrama de dispersión son importantes, pero nunca serán descubiertos por el analista ya que este método tiende a ignorarlos.
Prueba de hipótesis. Esta técnica permite evaluar si una premisa es realmente cierta para su conjunto de datos o población. Elimina la posibilidad de que algo sea casual. No obstante, para ser riguroso en su aplicación, las pruebas de hipótesis deben tener cuidado con los errores comunes, como el efecto Hawthorne o el efecto placebo.
Explicación: