Página 156
grupos homogéneos de manera iterativa y
minimizando la variación dentro de cada clúster
(Alvarado, D., Ordaz, K., Lara, G., María, V.,
& Castelán, M., 2023). La elección de este
método se justifica, ya que permite visualizar
patrones y tendencias específicas en grupos de
provincias, facilitando así la identificación de
áreas con necesidades particulares en términos
de salud pública. (Machado, O., Bastidas, T., &
Vázquez, M., 2020).
El objetivo de este análisis es doble: primero,
identificar agrupaciones de provincias que
compartan características similares en términos
de mortalidad y, segundo, proponer
recomendaciones de políticas públicas
específicas para cada grupo identificado. Este
tipo de análisis puede guiar la formulación de
estrategias de intervención y prevención,
contribuyendo al fortalecimiento del sistema de
salud en Ecuador y mejorando la calidad de vida
de sus habitantes (Alvarez, M., De Guilhem, C.,
Peñafiel, P., Maldonado, P., Vernaza, E., Mejía,
B., & Álvarez, M., 2024).
Metodología
Fuentes de datos
Los datos para este estudio provienen del
Registro Estadístico de Defunciones Generales
del año 2023, el cual proporciona estadísticas
detalladas sobre las causas de muerte en el
Ecuador. Este registro es una fuente oficial que
permite realizar un análisis representativo y
actual de los patrones de mortalidad en el país.
(Moran, M., Tandazo, W., & García, S., 2022)
Análisis de Clúster y selección de Clústeres
Se empleó el análisis de clúster K-means para
segmentar las provincias en grupos
homogéneos según las causas de mortalidad
predominantes. Para determinar el número
óptimo de clústeres, se utilizó el método del
codo, evaluando el porcentaje de varianza
explicada en función del número de clústeres y
determinando que tres clústeres eran los más
adecuados para este análisis (Alvarado, D.,
Ordaz, K., Lara, G., María, V., & Castelán, M.,
2023).
Este enfoque permitió una agrupación que
maximiza la homogeneidad dentro de cada
grupo y la heterogeneidad entre grupos,
proporcionando una estructura clara en la
segmentación de las provincias (Alessandri, F.,
Villarroel, T., & Vergara, M., 2022).
K-means permite integrar diversas variables (en
este caso, tasas de mortalidad por diferentes
causas), adaptándose a la naturaleza
multidimensional de los datos. Esta flexibilidad
facilita la exploración de patrones complejos en
mortalidad y salud. (Muñoz, E., Alcívar, D.,
Francinet, G., Palacios, M., & Briones, O.,
2024).
Para el análisis y la segmentación de las
provincias en función de sus tasas de
mortalidad, se utilizó el software estadístico
RStudio, que facilitó tanto el procesamiento de
datos como la implementación del algoritmo K-
means. Con RStudio, se realizó el cálculo del
método del codo para determinar el número
óptimo de clústeres, estableciendo que tres era
la cantidad adecuada para este estudio. Además,
RStudio permitió calcular los valores de cada
variable de mortalidad por clúster y visualizar
los patrones en gráficos, lo cual fue esencial
para interpretar los resultados de manera clara y
precisa. A continuación, se presentan los pasos
seguidos en el proceso de análisis: (Roque,
2022).
En este estudio, la gráfica del método del codo
muestra que el punto de inflexión ocurre al
elegir 3 clústeres, por lo que se selecciona este
valor como el óptimo para la segmentación de
las provincias