probabilidad y distribuciones
muestrales con varibles cualitativas
01
, Introduccion
aunque los números puedan parecer abstractos y difíciles de
entender, los gráficos permiten hacerlos más comprensibles e
interpretables. De manera similar a cómo usamos fotos para compartir nuestras
experiencias de viaje, en el análisis de datos empleamos gráficos como
"imágenes" que nos brindan una representación visual de la información,
revelando patrones y conexiones entre las variables.
En un conjunto de datos, cada número representa una característica única de los
miembros de una población. Aunque cada individuo tenga un valor diferente en
una variable, es común que estos valores se agrupan alrededor de ciertos puntos.
Un ejemplo claro de esto es la presión arterial sistólica en una población: aunque
haya algunas variaciones, la mayoría de los valores se concentran en un rango
específico debido a las características biológicas comunes entre los individuos.
Para facilitar la comprensión de los datos, gráficos como histogramas y
diagramas de dispersión nos permiten ver cómo se distribuyen estos valores,
ayudándonos a identificar tendencias y entender mejor las relaciones entre las
diferentes observaciones. Estos gráficos no solo muestran la distribución de los
datos, sino que también nos ayudan a comprender la variabilidad entre ellos, lo
cual es esencial para interpretar cualquier conjunto de datos.
Al estudiar la probabilidad de que ciertos valores de una variable aleatoria se
presenten, podemos recurrir a distribuciones de probabilidad, que son modelos
matemáticos que describen fenómenos naturales o sociales. Un ejemplo común
de esto es la distribución normal o de Gauss, ampliamente utilizada en métodos
estadísticos.
Aunque muchas técnicas estadísticas son relativamente flexibles ante pequeñas
desviaciones de la normalidad cuando se dispone de suficientes datos, siempre
es clave verificar si podemos suponer que los datos siguen una distribución
normal antes de aplicar ciertos métodos. Por lo tanto, los gráficos no solo sirven
para visualizar los datos, sino que también son herramientas fundamentales para
interpretar su comportamiento y comprender mejor la distribución y las relaciones
entre las variables que estamos analizando.