Ciencia de Datos en la educación
Por: Daniel Gutiérrez Pacha – Docente de la Universidad Católica San Pablo
EN TOMA DE DECISIONES
En los últimos años, el uso de técnicas de Ciencia de Datos para extraer información, ha sido aplicado a diferentes áreas de la sociedad. La educación ha sido un espacio en donde el uso de tecnología para combinar la realización de actividades en entornos de aprendizaje, está permitiendo colectar, analizar y predecir acciones o eventos, a partir de grandes volúmenes de información recabada de las interacciones de estudiantes y profesores.
La implementación de estas tecnologías en la educación, para encontrar mecanismos que permitan tomar decisiones basadas en conocimiento y métodos eficientes, es de vital importancia. En un entorno tan precario como la educación en el Perú, con una inversión tan insuficiente, cercana al 5 % del PBI, resulta vital implementar herramientas que permitan llevar a cabo estrategias con una base sólida de conocimiento.
A nivel mundial, las instituciones educativas se enfrentan al desafío de bajas tasas de retención estudiantil y alto número de abandonos. El uso de tecnologías emergentes para abordar dichos problemas, es una tendencia que viene dando muy buenos resultados.
Entonces, desarrollar sistemas computacionales de inteligencia artificial, basados en datos de universidades y colegios, que lleven a identificar estudiantes en riesgo lo antes posible, a fin de proporcionarles orientación y apoyo oportuno, es uno de los principales beneficios que se está plasmando en la actualidad.
Recientemente, investigadores se encuentran generando técnicas diversas de “Machine Learning” y “Deep Learning”, que son empleadas de manera conjunta con técnicas estadísticas avanzadas. Por ejemplo, para abordar el bajo rendimiento académico se utilizan modelos de regresión, logrando una identificación precisa de las causas.
Por otro lado, para identificar estudiantes en riesgo de deserción, podemos abordar modelos de clasificación, que sirven para la identificación de problemas complejos con múltiples causas posibles, como factores académicos, socioeconómicos, familiares e inclusive externos, como los generados por la pandemia.
Inicialmente, las investigaciones relacionadas a la deserción indicaban que las principales causas eran académicas, pero a partir del uso de las técnicas, se ha podido conocer que el 30 % de casos de deserción se produce durante el primer año. Esto revela que los modelos predictivos generados con Ciencia de Datos deben ser abordados con un enfoque temporal.
Esta combinación de algoritmos de “Machine Learning” con herramientas estadísticas avanzadas, han permitido desenvolver nuevas técnicas, como son los métodos del Análisis de Supervivencia, con los que es posible estimar quiénes son los estudiantes en riesgo a desertar y además estimar una línea temporal que permite saber cuándo lo harán.
La Ciencia de Datos está en constante evolución y con ello la aparición de nuevas técnicas predictivas. Sin embargo, la implementación de estas técnicas no debe ser usada sin la experiencia de los gestores educativos. Entonces, la combinación de los modelos predictivos con el conocimiento previo, es vital para la toma de decisiones efectivas en beneficio de la comunidad educativa.