Angelo Laverde B.1

1 Director de evaluación y tecnologías educativas en salud de Asociación Colombiana de Facultades de Medicina (ASCOFAME), Bogotá, Colombia; alaverde@ascofame.org.co.

El término “Big Data” ha llegado para revolucionar la forma en que recopilamos, gestionamos y analizamos datos en la era digital. Se refiere al procesamiento de conjuntos de datos enormes y complejos que desafían las capacidades de las herramientas de procesamiento de datos tradicionales 2. Estos conjuntos de datos son tan vastos que superan la capacidad de las bases de datos convencionales y el software de procesamiento de datos. Pero, ¿cómo ha evolucionado este concepto y qué relevancia tiene en la educación médica?

Para entender la magnitud de Big Data en la actualidad, es interesante mirar hacia atrás en la historia. En 1663, John Graunt se enfrentó a lo que podríamos considerar como “cantidades abrumadoras de información” mientras estudiaba la peste bubónica que asolaba Europa3. Graunt utilizó estadísticas y se le atribuye como la primera persona en utilizar el análisis de datos estadísticos a “gran escala”. Si bien los volúmenes de datos de la época eran incomparables con los exabytes con los que lidiamos hoy en día, para aquellos pioneros, los datos ciertamente parecían abrumadores en ese momento.

La evolución de Big Data incluye una serie de pasos preliminares para su fundación, el punto es que “Big Data” es un término relativo dependiendo de quién lo esté discutiendo. Big Data para Amazon o Google es muy diferente de Big Data para una organización de tamaño mediano, pero no menos “grande” en el imaginario de quienes lo enfrentan.

El concepto de Big Data se destaca por sus seis “Vs” fundamentales4. Estas seis dimensiones incluyen:

  • Volumen: Este aspecto se refiere a la inmensa cantidad de datos que se generan y recopilan de manera continua. En el contexto de una facultad de medicina, esto podría representar la abundancia de registros que abarcan desde información de contacto y calificaciones hasta registros académicos y datos de investigación.
  • Variedad: La variedad implica la diversidad de tipos de datos, que pueden ser estructurados, no estructurados o semiestructurados. En una facultad de medicina, esta diversidad se manifiesta en datos estructurados como notas de exámenes y datos no estructurados como informes de proyectos de investigación, notas de conferencias y documentos de investigación en diversos formatos.
  • Velocidad: La velocidad se relaciona con la rapidez con la que se generan y deben procesarse los datos, especialmente en situaciones que requieren respuestas en tiempo real. En una facultad de medicina, esto se traduce en la necesidad de procesar rápidamente datos relacionados con la inscripción de estudiantes, la planificación de cursos y la gestión de proyectos de investigación para garantizar una administración eficaz.
  • Veracidad: La veracidad se vincula con la calidad y la confiabilidad de los datos, lo que plantea desafíos cruciales para asegurar la precisión en el análisis. En el contexto académico y de investigación médica, la veracidad es esencial para garantizar la exactitud de los datos utilizados en investigaciones y publicaciones científicas, lo que a su vez respalda la integridad académica.
  • Valor: El valor representa el potencial beneficio que se puede extraer de los datos, respaldando la toma de decisiones informadas y la investigación de alta calidad. En una facultad de medicina, esto se traduce en la capacidad de utilizar datos para evaluar el rendimiento de los programas académicos, identificar tendencias en la investigación médica y mejorar la calidad de la educación y la investigación.
  • Volatilidad: La volatilidad se refiere a la duración de la relevancia de los datos, ya que algunos pueden volverse obsoletos rápidamente. En este contexto, consideramos que los planes de estudios antiguos pueden perder relevancia a medida que avanza la medicina, lo que subraya la necesidad de actualizaciones regulares y la adaptación constante.

Como ya lo mencionamos, Big Data se refiere al manejo y análisis de conjuntos de datos extremadamente grandes y complejos que superan la capacidad de las herramientas tradicionales de procesamiento de datos. Sin embargo, es importante aclarar qué es y qué no es Big Data:

Características de Big Data Lo que es Big Data: Lo que no es Big Data:
Grandes volúmenes de datos Conjuntos de datos extremadamente grandes (terabytes, petabytes, exabytes). Conjuntos de datos pequeños que pueden manejarse con herramientas convencionales.
Diversidad de fuentes y tipos de datos Incluye datos estructurados, no estructurados y semiestructurados. Puede provenir de múltiples fuentes (redes sociales, sensores, texto, imágenes, etc.). Datos estructurados simples que se ajustan a formatos tabulares y pueden procesarse con bases de datos tradicionales.
Velocidad de generación Datos generados a alta velocidad y de forma continua, incluso en tiempo real. Datos que no se generan rápidamente ni en tiempo real.
Complejidad y variedad de datos Implica datos complejos y heterogéneos que requieren herramientas y técnicas especiales para su procesamiento y análisis. Datos que no son complejos ni heterogéneos y pueden ser manejados con métodos estándar.
Fuente: Elaboración propia

 

El concepto de Big Data en la Educación Médica (BDEM) encuentra sus raíces en diversas industrias y disciplinas, desde la microbiología hasta la genómica5. En la educación médica, los datos provienen de múltiples fuentes, como registros en un aula virtual, consultas en bases de datos bibliográficas, bitácoras y eportafolios, resultados de evaluaciones, información de evaluación del plan de estudios y más. El poder de BDEM radica en la recopilación, integración y análisis de estos datos para tomar decisiones informadas y actuar en consecuencia.

El potencial de BDEM en la educación médica es vasto y se extiende a aplicaciones prácticas y de investigación. Desde la evaluación del rendimiento estudiantil hasta la predicción del éxito académico, BDEM ofrece oportunidades para personalizar la enseñanza y mejorar la calidad y seguridad de la atención al paciente6.

La aplicación de Big Data (BD) en la Educación Médica (EM)

El potencial de BDEM incluye tanto aplicaciones prácticas (por ejemplo, evaluación y evaluación de programas y planes de estudio) como aplicaciones de investigación. Dependiendo del propósito y/o la pregunta de investigación, la minería de datos puede realizarse a gran escala a nivel de sistemas o a pequeña escala de manera personalizada.

 

La aplicación de BDEM organiza y cristaliza los datos para permitir una mejor comprensión de lo que sucedió y de lo que está ocurriendo actualmente. Esto puede ocurrir a través de diferentes formas de análisis, incluido el análisis prospectivo longitudinal, el descubrimiento de tendencias, el reconocimiento de patrones y la analítica predictiva. Por lo tanto, se pueden hacer predicciones o extrapolaciones sobre lo que podría ocurrir en el plan de estudios, los programas y las prácticas educativas7,8,9

Por ejemplo, BDEM puede facilitar la toma de decisiones en la educación médica de pregrado, como la selección de estudiantes de medicina o la preparación de un estudiante de medicina para graduarse.

En la educación médica de posgrado, BDEM puede proporcionar información sobre la experiencia y exposición de los estudiantes, la retroalimentación, así como datos de evaluación dentro y entre programas9. Esto permite la retroalimentación personalizada y planes de aprendizaje individualizados, y facilita la implementación de actividades profesionales confiables (EPA). También se pueden identificar brechas en el aprendizaje y fallos en la enseñanza para respaldar la mejora o cambios en ciertas prácticas o contenidos.

La aplicación de BDEM en estos datos educativos y otros (como datos demográficos, criterios de admisión o prácticas educativas) de manera longitudinal y transversal permite la comparación y la rendición de cuentas entre diferentes cohortes, programas e instituciones. Esto es vital para la garantía de calidad continua y la mejora de las prácticas en la educación médica o para la evaluación de políticas previas10

Otra posible aplicación de BDEM es investigar el vínculo entre la educación médica y la atención al paciente. Utilizando datos combinados de repositorios de información educativa y clínica (por ejemplo, correlacionando los resultados de los pacientes de sistemas de información de salud hospitalaria y clínica con diferentes modelos de educación dentro y entre instituciones), se podría evaluar si, y en qué medida, las prácticas educativas se traducen en mejores resultados de atención médica para el paciente y la sociedad.

Un ejemplo es el Estudio Longitudinal de Educación Médica de Jefferson11en el cual se mostró que el rendimiento en el Medical College Admissions Test MCAT es un predictor válido del rendimiento en las facultades de medicina y en la residencia, basado en datos de 8000 estudiantes seguidos durante 40 años. Esto y otros estudios confirmaron la viabilidad y utilidad de aplicar BD para informar sobre las prácticas educativas médicas actuales y para cerrar la brecha entre la teoría pedagógica y la práctica. Además, al permitir una vista longitudinal de la progresión y el desarrollo de los médicos a través de su educación, y las elecciones de carrera realizadas, BDEM puede proporcionar información y evidencia para facilitar recomendaciones sobre políticas estratégicas importantes y decisiones, como la planificación de recursos humanos o el desarrollo de especialidades.

Estos son temas de interés para los responsables de la formulación de políticas educativas, las autoridades reguladoras, los educadores médicos e investigadores y ofrece una amplia gama de posibilidades para mejorar la calidad de la enseñanza y la toma de decisiones. Estos son algunos ejemplos de usos de BD en educación médica:

  • Evaluación del rendimiento de los estudiantes: Utilizar BD para rastrear y analizar el rendimiento académico de los estudiantes, incluidas las calificaciones, las evaluaciones clínicas y las evaluaciones de habilidades, para identificar áreas de mejora y adaptar la instrucción de manera más efectiva.
  • Personalización del aprendizaje: Utilizar BD para crear planes de estudios y recursos de aprendizaje personalizados para estudiantes individuales en función de sus necesidades, preferencias y niveles de competencia.
  • Predicción del éxito académico: Utilizar BD para predecir el éxito académico de los estudiantes y proporcionar intervenciones tempranas a aquellos que puedan necesitar apoyo adicional.
  • Evaluación de programas y currículos: Utilizar BD para evaluar la efectividad de los programas educativos y los planes de estudio, identificar áreas de mejora y tomar decisiones informadas sobre cambios curriculares.
  • Currículo oculto: El uso de Big Data para estudiar el “currículo oculto” en una facultad implica recopilar y analizar datos de asistencia, participación, retroalimentación estudiantil y redes sociales, análisis de contenidos de influencer estudiantiles, para identificar patrones y temas no planificados en la experiencia estudiantil. Por ejemplo, al analizar las conversaciones en redes sociales, se pueden descubrir preocupaciones o dinámicas no expresadas en el aula, lo que permite a la facultad tomar medidas para abordar áreas de mejora y enriquecer la educación.
  • Análisis de retroalimentación y evaluación de profesores: Utilizar BD para recopilar y analizar retroalimentación de los estudiantes sobre sus experiencias de aprendizaje y la calidad de la enseñanza, lo que permite a las instituciones educativas identificar a los mejores profesores y áreas de mejora.
  • Identificación de brechas de conocimiento: Utilizar BD para identificar brechas de conocimiento en los estudiantes y adaptar la enseñanza para abordar esas áreas de debilidad.
  • Evaluación del rendimiento clínico: Utilizar BD para evaluar el desempeño clínico de los estudiantes en entornos de atención médica, lo que incluye la toma de decisiones clínicas y la interacción con pacientes.
  • Investigación en educación médica: Utilizar BD para llevar a cabo investigaciones sobre la efectividad de diferentes métodos de enseñanza, estrategias de evaluación y enfoques de aprendizaje.
  • Seguimiento de trayectorias de carrera: Utilizar BD para rastrear las trayectorias de carrera de los graduados de medicina, incluidas las especialidades elegidas y el éxito en la práctica clínica.
  • Evaluación de impacto en la atención al paciente: Utilizar BD para evaluar cómo la educación médica influye en la calidad de la atención al paciente y los resultados de salud.

Estos son solo algunos ejemplos de cómo se puede utilizar el Big Data en la educación médica para mejorar la enseñanza, la evaluación y la calidad de la atención médica. La recopilación y el análisis de datos a gran escala pueden proporcionar información valiosa para la toma de decisiones informadas y la mejora continua en la educación médica.

Los obstáculos

Sin embargo, existen obstáculos significativos en la aplicación de BDEM en la educación médica.

  • Fragmentación de datos y falta de interoperabilidad entre sistemas de registros médicos electrónicos.
  • Datos no estandarizados y vocabulario heterogéneo en sistemas de información educativo y de salud.
  • Políticas organizativas que limitan el intercambio de datos.
  • Consideraciones éticas y legales en la recopilación y uso de datos de pacientes y estudiantes.
  • Sesgo inherente en los datos recopilados, lo que plantea desafíos en la veracidad de los resultados.
  • Uso inadecuado o fuera de contexto de Big Data en la toma de decisiones en educación médica
  • Se necesitan inversiones en infraestructura, tecnologías y experiencia para gestionar y proteger datos de diferentes fuentes.
  • La infraestructura y la experiencia tecnológica (para la recopilación, el almacenamiento, el procesamiento y el análisis) podrían centralizarse en un “almacén de datos” donde diferentes instituciones se convierten en proveedores de datos para este colectivo central de BD (Cook et al., 2010; Ellaway et al., 2014).
  • Además, existen consideraciones éticas y médico-legales. Por ejemplo, la mayoría de los datos de pacientes capturados en EMR no fueron originalmente destinados a fines educativos y no incluyen consentimiento informado en este sentido. Incluso si los datos se pueden anonimizar eliminando identificadores, surgen preguntas sobre qué datos se recopilan, cómo se almacenan y protegen, cómo se utilizan y comparten, por quién y con quién. Estos problemas se extienden también a los datos de la educación médica; problemas de confidencialidad y restricciones de acceso a los datos recopilados sobre estudiantes, programas e instituciones pueden limitar la calidad, el análisis y el valor de BDEM.

La aplicación de BDEM también tiene limitaciones inherentes y posibilidades de error.11

Las interpretaciones y conclusiones (y las decisiones y acciones subsiguientes) basadas en BDEM deben realizarse con extrema precaución. Se deben aplicar y cumplir los estándares y rigurosidades de la investigación académica y científica, tanto en los métodos de recopilación como en la precisión y representatividad de los datos.

Existe un sesgo intrínseco en BD debido a que la información que no se puede capturar (o simplemente no se captura) puede ser subestimada o ignorada. La predicción de tendencias y la evaluación del potencial y éxito actuales y futuros de individuos o programas deben realizarse de manera similar con cautela11,7

Las decisiones importantes (especialmente las sumativas) deben basarse en principios empíricamente probados y de larga data: múltiples puntos de datos, de múltiples fuentes (triangulación), en diferentes momentos (iterativos) y después de considerar la naturaleza dinámica del aprendizaje y la educación en la realidad.

Existen riesgos reales para las personas y los sistemas si BDEM se utiliza fuera de contexto o para fines no previstos. Por ejemplo, ¿debería BDEM utilizarse para cambiar la trayectoria o elección profesional de un estudiante (o grupo de estudiantes)? ¿Deberíamos juzgar a los estudiantes en función de patrones ‘normales’ de comportamiento de aprendices derivados de BDEM? Además, desde la perspectiva de la facultad, es tentador utilizar solo aquellas intervenciones educativas que han sido “demostradas como efectivas” por BDEM, en detrimento de todas las demás.

 

2Ellaway RH, Topps D, Pusic M. Data, Big and Small: Emerging Challenges to Medical Education Scholarship. Acad Med. 2019 Jan;94(1):31-36. doi: 10.1097/ACM.0000000000002465. PMID: 30256249.

3Goi, Chai-Lee. “The Use of Big Data in Marketing Analytics.” Handbook of Research on Innovation and Development of E-Commerce and E-Business in ASEAN. IGI Global, 2021. 62-78.

4Yuen, Heng-Wai, and Abhilash Balakrishnan. “Big data in medical education–Are we ready?.” The Asia Pacific Scholar 5.2 (2020): 51.

5Tolsgaard, Martin G., et al. “The role of data science and machine learning in Health Professions Education: practical applications, theoretical contributions, and epistemic beliefs.” Advances in Health Sciences Education 25 (2020): 1057-1086.

6Chahine, S., Kulasegaram, K., Wright, S., Monteiro, S., Grierson, L. E., Barber, C., … Touchie, C. (2018). A call to investigate the relationship between education and health outcomes using big data. Academic Med icin e, 93(6), 829-832. https://doi.org/10.1097/ACM.0000000000002217

7Cook, D. A., Andriole, D. A., Durning, S. J., Roberts, N. K., & Triola, M. M. (2010). Longitudinal research databases in medical education: Facilitating the study of educational outcomes over time and across institutions. Academic Med icine, 85(8), 1340-1346. https://doi.org/10.1097/ACM.0b013e3181e5c050

8Ellaway, H., Pusic, M. V., Galbraith, R. M., & Cameron, T. (2014). Developing the role of big data and analytics in health professional education. Medical Teacher, 36(3), 216-222.   https://doi.org/10.3109/0142159X.2014.874553

9Schneeweiss, S. (2014). Learning from big health care data. The New England Journal of Medicine, 370(23), 2161-2163. https://doi.org/10.1056/NEJMp1401111  *Heng-Wai Yuen  Chan gi General Hospit al,  2 Simei Street 3, Singapore 539889 Tel: +65 69366259 Email: heng.wai@singhealth.com.sg

10Callahan, Clara A., et al. “The predictive validity of three versions of the MCAT in relation to performance in medical school, residency, and licensing examinations: a longitudinal study of 36 classes of Jefferson Medical College.” Academic Medicine6 (2010): 980-987.

11Chahine, S., Kulasegaram, K., Wright, S., Monteiro, S., Grierson, L. E., Barber, C., … Touchie, C. (2018). A call to investigate the relationship between education and health outcomes using big data. Academic Medicine, 93(6), 829-832. https://doi.org/10.1097/ACM.0000000000002217

12Ellaway, R. H., Pusic, M. V., Galbraith, R. M., & Cameron, T. (2014). Developing the role of big data and analytics in health professional education. Medical Teacher, 36(3), 216-222. https://doi.org/10.3109/0142159X.2014.874553