Reporte técnico 2
Semana: 8
Nombre del estudiante:
Número de cuenta:
Sede de estudio:
CEUTEC TGU
Docente:
Lic. Keneht Rodriguez
Sección:
843
Fecha de entrega:
18 de diciembre de 2021
,Análisis de conglomerados jerárquicos
Nivel de Similitud
Pasos de amalgamación
Nivel Número de obs.
Número de Nivel de de Conglomera Nuevo en
Pas conglomera semejan distanc dos conglomera el congl.
o dos zal ia incorporados do nuevo
1 3 59.9838 0.80032 3 4 3 2
2 2 54.0902 0.91820 1 2 1 2
3 1 46.4407 1.07119 1 3 1 4
Podemos apreciar de la
gráfica que las variables con
mayor similitud entre sí son
Clases y Trabaja con un
59.99% de similitud, seguidos
del segundo conglomerado
que incluye las variables Sexo
y Carrera Universitaria con un
54.09% de similitud, por
último, el primer
conglomerado con un 46.44%
de similitud. El 3er
conglomerado que incluye las
variables con mayor similitud
sería el seleccionado para un
estudio más específico.
Conglomerados por observaciones
Observamos el nivel de
similaridad ordenado de
mayor a menor, el cual se
mantiene en un 100% de
similaridad hasta el paso
144. En este caso, hay
271 estudiantes por lo
que el análisis del caso se
vuelve más extendido
debido a la magnitud de
la muestra. Los pasos que
aparecen al principio de la
tabla son los que mayor
distancia tienen entre sí, y
los últimos que aparecen
son los que menor
distancia tienen
significando que los que tienen menor distancia tendrían una mayor similitud. Hay
mayor cantidad de estudiantes dentro del conglomerado 2. (Ver tabla 1 de pasos de
amalgamación en anexos)
, Análisis de componentes principales
Análisis de los valores y vectores propios de la matriz de
correlación
Valor 2.73 1.44 1.27 1.22 1.09 1.04 0.91 0.87 0.79 0.75
propio 29 34 47 05 51 78 35 25 77 35
Proporci 0.18 0.09 0.08 0.08 0.07 0.07 0.06 0.05 0.05 0.05
ón 2 6 5 1 3 0 1 8 3 0
Acumul 0.18 0.27 0.36 0.44 0.51 0.58 0.64 0.70 0.76 0.81
ada 2 8 3 5 8 8 9 7 0 0
Valor 0.71 0.60 0.58 0.49 0.44
propio 48 47 69 80 41
Proporci 0.04 0.04 0.03 0.03 0.03
ón 8 0 9 3 0
Acumul 0.85 0.89 0.93 0.97 1.00
ada 8 8 7 0 0
Observamos que en el valor propio tenemos 6 datos antes de llegar a
cero por lo que tomamos seis valores acumulados, mostrando un
porcentaje de variabilidad del 58%. Considerando los primeros seis
valores acumulados, su porcentaje de variabilidad, indica que el riesgo
de error es un poco alto debido a que el porcentaje de variabilidad está
cerca al 50%. Habiendo dicho esto, el modelo de análisis requeriría de 6
componentes.
Para el componente 1, podemos apreciar que las variables Edad, Estado civil
y Título de Educación Media son las que tienen mayor incidencia sobre este
grupo.
Para el componente 2, podemos apreciar que las variables Carrera
universitaria, Nivel de endeudamiento, y Sexo son las que tienen mayor
incidencia sobre este grupo.
Para el componente 3, podemos apreciar que las variables Aprobó, Carrera
universitaria, y Nivel de satisfacción son las que tienen mayor incidencia
sobre este grupo.
Para el componente 4, podemos apreciar que las variables Nivel de
satisfacción y si tiene vehículo son las que tienen mayor incidencia sobre
este grupo.
Para el componente 5, podemos apreciar que las variables Tr Arcad,
Vehículo, y Comp son las que tienen mayor incidencia sobre este grupo.
Para el componente 6, podemos apreciar que las variables Nivel de
satisfacción, Estado civil y Trabaja son las que tienen mayor incidencia sobre
este grupo.
(Ver tabla 2 de vectores propios en anexos)
Semana: 8
Nombre del estudiante:
Número de cuenta:
Sede de estudio:
CEUTEC TGU
Docente:
Lic. Keneht Rodriguez
Sección:
843
Fecha de entrega:
18 de diciembre de 2021
,Análisis de conglomerados jerárquicos
Nivel de Similitud
Pasos de amalgamación
Nivel Número de obs.
Número de Nivel de de Conglomera Nuevo en
Pas conglomera semejan distanc dos conglomera el congl.
o dos zal ia incorporados do nuevo
1 3 59.9838 0.80032 3 4 3 2
2 2 54.0902 0.91820 1 2 1 2
3 1 46.4407 1.07119 1 3 1 4
Podemos apreciar de la
gráfica que las variables con
mayor similitud entre sí son
Clases y Trabaja con un
59.99% de similitud, seguidos
del segundo conglomerado
que incluye las variables Sexo
y Carrera Universitaria con un
54.09% de similitud, por
último, el primer
conglomerado con un 46.44%
de similitud. El 3er
conglomerado que incluye las
variables con mayor similitud
sería el seleccionado para un
estudio más específico.
Conglomerados por observaciones
Observamos el nivel de
similaridad ordenado de
mayor a menor, el cual se
mantiene en un 100% de
similaridad hasta el paso
144. En este caso, hay
271 estudiantes por lo
que el análisis del caso se
vuelve más extendido
debido a la magnitud de
la muestra. Los pasos que
aparecen al principio de la
tabla son los que mayor
distancia tienen entre sí, y
los últimos que aparecen
son los que menor
distancia tienen
significando que los que tienen menor distancia tendrían una mayor similitud. Hay
mayor cantidad de estudiantes dentro del conglomerado 2. (Ver tabla 1 de pasos de
amalgamación en anexos)
, Análisis de componentes principales
Análisis de los valores y vectores propios de la matriz de
correlación
Valor 2.73 1.44 1.27 1.22 1.09 1.04 0.91 0.87 0.79 0.75
propio 29 34 47 05 51 78 35 25 77 35
Proporci 0.18 0.09 0.08 0.08 0.07 0.07 0.06 0.05 0.05 0.05
ón 2 6 5 1 3 0 1 8 3 0
Acumul 0.18 0.27 0.36 0.44 0.51 0.58 0.64 0.70 0.76 0.81
ada 2 8 3 5 8 8 9 7 0 0
Valor 0.71 0.60 0.58 0.49 0.44
propio 48 47 69 80 41
Proporci 0.04 0.04 0.03 0.03 0.03
ón 8 0 9 3 0
Acumul 0.85 0.89 0.93 0.97 1.00
ada 8 8 7 0 0
Observamos que en el valor propio tenemos 6 datos antes de llegar a
cero por lo que tomamos seis valores acumulados, mostrando un
porcentaje de variabilidad del 58%. Considerando los primeros seis
valores acumulados, su porcentaje de variabilidad, indica que el riesgo
de error es un poco alto debido a que el porcentaje de variabilidad está
cerca al 50%. Habiendo dicho esto, el modelo de análisis requeriría de 6
componentes.
Para el componente 1, podemos apreciar que las variables Edad, Estado civil
y Título de Educación Media son las que tienen mayor incidencia sobre este
grupo.
Para el componente 2, podemos apreciar que las variables Carrera
universitaria, Nivel de endeudamiento, y Sexo son las que tienen mayor
incidencia sobre este grupo.
Para el componente 3, podemos apreciar que las variables Aprobó, Carrera
universitaria, y Nivel de satisfacción son las que tienen mayor incidencia
sobre este grupo.
Para el componente 4, podemos apreciar que las variables Nivel de
satisfacción y si tiene vehículo son las que tienen mayor incidencia sobre
este grupo.
Para el componente 5, podemos apreciar que las variables Tr Arcad,
Vehículo, y Comp son las que tienen mayor incidencia sobre este grupo.
Para el componente 6, podemos apreciar que las variables Nivel de
satisfacción, Estado civil y Trabaja son las que tienen mayor incidencia sobre
este grupo.
(Ver tabla 2 de vectores propios en anexos)