Mostrando entradas con la etiqueta e-Learning. Mostrar todas las entradas
Mostrando entradas con la etiqueta e-Learning. Mostrar todas las entradas

martes, 7 de enero de 2014

Big Data: Minería de datos (en Educación)


Acabo de completar un curso llamado Big Data in Education, acerca de cómo aplicar al ámbito de la Educación algo que cada vez está más de moda. No de un modo trivial ni simplemente "estético". Se trata del concepto de Big Data o Data Mining, es decir, la obtención, gestión, proceso y (éste es el meollo) análisis de grandes conjuntos de datos. 

Algunos de los grandes "gurús" de la sociedad de la información, declaran públicamente la gran influencia y el potencial a muy corto plazo de los estudios y aplicaciones enfocados en este campo. Propongo la lectura de estos cinco artículos (alguno breve, y alguno bastante extenso), para hacerse una idea aproximada del alcance real de lo que estoy comentando:





Un ejemplo sencillo (y cercano) de Big Data:

Para que sepas hasta qué punto tu día a día forma parte del Big Data que las empresas buscan como medio de saber hacia dónde enfocar sus esfuerzos: ¿Te suena una cadena de restaurantes que se llama Burguer King? Cada vez que vas a pagar fíjate en el recibo que te entregan, y en los carteles colocados junto a las cajas: A cambio de conservar tu recibo, te prometen un Whopper gratis en tu próxima visita. Al fijarte en el recibo, descubres en su reverso que la condición para obtenerlo es rellenar una encuesta online. (Encuesta perfectamente asociada, a través del número de recibo, con los datos concretos de tus platos elegidos, fecha, hora y restaurante elegido, etc).

Si Burguer King está regalando MUCHOS Whopper, es porque tiene fe en la utilidad de los datos que consigue a través de estos miles de encuestas.




¿Inconvenientes del Big Data?

Naturalmente, existen graves e inmediatos riesgos, como por ejemplo todo lo que tenga que ver con la posible inadecuada gestión y respeto de la privacidad de los datos de carácter personal contenidos en el conjunto de Big Data procesados. Recientemente Alemania impuso una fuerte sanción a GOOGLE por registrar y almacenar datos privados de redes Wifi privadas (valga la redundancia) con su vehículo de toma de datos para el StreetView.

Otro peligro es el riesgo de creernos que sus resultados serán siempre ciertos, o que detectarán algo que no estemos buscando (se achaca al Big Data que no fue capaz de prever la llegada de la actual crisis, ni el 11-S): Hay que tener claro que los datos se recogen y clasifican para poder ser aplicados a modelos, los cuales luego generan unas predicciones que deberán ser interpretadas. Como en todo proceso estadístico, la calidad de los resultados depende por tanto de la ausencia de fallos importantes en cada uno de los eslabones (y del diseño del proceso para hacerlo poco vulnerable a dichos errores). Así,  dos puntos "muy delicados" serán:

  • La elección de un origen de datos no afectado por ningún sesgo que altere la empleabilidad de los datos. Lo que cuando estudiaba Estadística en Caminos nos explicaban diciendo que hay que elegir bien cuáles parámetros queremos registrar. (¿Traducido al lenguaje de las encuestas? Pues que pensemos bien qué datos vamos a preguntar a los encuestados. Si realmente serán útiles para nuestro estudio, y si se van a sentir libres de contestar lo que realmente piensan). Es mejor tener menos datos, pero de calidad, que muchos, pero poco fiables.
  • Lo realmente difícil es diseñar un modelo que no te engañe: No pienses que aplicando datos muy fiables, a un modelo imperfecto, vas a obtener resultados útiles: 
(Ojo, que digo "encuestas" como ejemplo o aclaración. Big Data implica realmente enormes cantidades de datos. En el caso de la encuesta de BK y los Whopper lo lógico es pensar que es para contrastar o complementar el análisis de datos (BIIIIG Data) de TODAS las facturas emitidas por los restaurantes de la cadena)



Big Data aplicado a la Educación:

Es de lo que trata el curso que he terminado. EDM o Educational Data Mining.



Campos como la enseñanza a distancia o el e-learning son especialmente adecuados para la aplicación de técnicas de Big Data, dado el alto grado de automatización de toma de datos que implican o directamente posibilitan. Así, por ejemplo, el empleo de una LMS (Learning Management System) como MOODLE permite tener detallados informes de:
  • A qué horas se ha conectado un alumno. 
  • Con qué duración en cada ocasión. 
  • Qué elementos de la plataforma ha empleado en cada momento, cuáles son sus preferidos y cuáles no ha visitado nunca.
  • Su actividad en los foros de la plataforma:
    • Número de hilos en que ha participado
    • Tipo de temas tratados
    • ¿Lanza consultas, o responde a dudas de compañeros?
    • Número de compañeros con los que ha interactuado. A su vez, características de estos compañeros de su red.
    • Tiempo conectado a cada foro y extensión de sus aportaciones.
    • ¿Hay relación directa entre estas participaciones y los temas que mejor/peor se le han dado en el curso?
  • ...
¿Poco práctico? En absoluto. Un par de aplicaciones muy buenas que se me ocurren sobre la marcha:

1): (Para dar una atención más adaptada y personalizada a cada "e-alumno"): Por medio de los modelos adecuados, se puede detectar y programar la LMS para que identifique momentos en que el estudiante está comenzando a desanimarse (por ejemplo a través del análisis de la evolución de sus tiempos de conexión, y algunas otras variables), y reaccionar enviándole actividades de apoyo orientadas a motivar su participación. Es decir, que detectamos quiénes son los que van camino de tirar la toalla, y los tutores, avisados por el sistema, pueden dedicarle una atención especial, o de un modo programado la LMS le recuerda sus tareas para que no se despiste, y le envía "caramelos".

2): (Para la evaluación del propio curso y sus diferentes metodologías aplicadas), al detectar qué tipo de actividades o contenidos son los que de un modo más directo están relacionados con aprendizaje eficaz del alumnado (y de cada uno de los subtipos de alumnado que se quiera especificar), y con una mayor actividad posterior de éstos en el curso (es decir, qué cosas han conseguido "enganchar" y ayudar al alumno/a).

Como vemos, el campo de aplicación, ya sólo en el e-learning, es amplísimo.

¿No conocías el concepto de LMS? ¿MOODLE? ¿Foros para el aprendizaje colaborativo? ¿Estamos hablando de algo sólo aplicable a freaks de la educación? No, no se trata sólo de aquellos que hacen MOOCs en internet. La Universidad de Málaga (y casi todas las demás) y muchos colegios e institutos, tanto públicos como concertados y privados ya tienen implementadas sus "campus virtuales" a través de MOODLE u otras plataformas equivalentes.

Para la educación presencial, por tanto, también resulta fundamental hoy en día el poder contar con este tipo de análisis.

Campus virtual de la UMA




Mis impresiones (y una recomendación):

Así como con el curso de Gamificación (y todo lo que después sobre esa materia he estudiado por mi cuenta) me veo capaz de "gamificar" bastantes cosas que se prestan muy bien a ello, debo reconocer que el campo del Big Data me parece apasionante, pero que requiere de una especialización mucho mayor. Realmente aplicar Big Data no es muy difícil, y menos aun con las herramientas específicas que he aprendido a usar (Rapidminer y Gephi, sobre todo), pero como acabo de decir, lo difícil es hacerlo BIEN. Y no se me caen los anillos por reconocer que todavía no soy un experto en la materia, por mucho que "triunfara" en este curso.

La Consejería de Educación de la Junta de Andalucía publica una serie de datos estadísticos (Resultados académicos en el sistema educativo de Andalucía. Y más genéricamente: Estadísticas de la Consejería de Educación). Con esos datos se podrían elaborar muchos estudios, aunque es probable que lo realmente interesante sería disponer de los datos originales o de partida, a partir de los cuales se elaboraron estas estadísticas. Lo mismo algún día me siento a preparar algo con todos esos datos...

A quien, por leer esto, quiera profundizar un poco en el tema, le recomiendo el libro Data mining for the masses, disponible gratuitamente en ese enlace para su descarga bajo licencia Creative Commons. A la vez explica los conceptos, y enseña a aplicarlos (de un modo un poco básico) empleando Rapidminer.

domingo, 14 de abril de 2013

e-Learning and Digital cultures

Completé este Marzo en Coursera un curso de la Universidad de Edinburgo, llamado e-Learning and Digital cultures, para el cual preparé este "artefacto digital", como lo llamaban. Lanzo con él varias ideas, aunque más bien busco encender preguntas o inquietudes entre quienes se vean en la situación de preparar una actividad docente online. No sé qué es lo que más me gustó: que los cuatro compañeros que me evaluaron coincidieran en darme la nota máxima, o que ¡Por fin conseguí un programa que me funcionara  para editar video! (Nunca antes había logrado editar algo y que luego se pudiera ver. Siempre había sido un desastre)

Aquí lo podéis ver:







Como se puede apreciar, para las presentaciones sigo fiel a Bubbl.us , que tan útil me parece. Su simplicidad me fuerza a su vez a simplificar conceptualmente mis presentaciones, lo cual creo que es algo bastante siempre muy positivo (que sí, que el tachado lo he mantenido intencionadamente).

Desde el punto de vista práctico, ahora me doy cuenta de que para leer alguna de las pantallas sería bueno haber dejado la imagen un par de segundos más. Está claro que las cosas ya hechas, cuantas más veces se repasen, más pueden ser mejoradas.

Hay muchas cosas que, explicadas hubieran podido tener un sentido más completo. Por ejemplo, el profesor que se ve en una pizarra, y que por morphing se convierte en Tom Cruise, es el fantástico Ben Polak en una de sus lecciones de Teoría de juegos, en Open Yale Courses. Sus clases las usé para preparar los exámenes de Game Theory (Stanford, en Coursera). Me fue de una utilidad enorme pero, ¿verdad que  a priori parece un poco contradictorio que un curso online consista casi básicamente en vídeos de un profesor en la pizarra de su clase? 

La verdad es que inicialmente quise emplear una mayor variedad de melodías de fondo, pero dada la brevedad del vídeo, hubiera desorientado bastante. De este modo, creo que al final (desechando además un par de ideas que ya estaban listas para ser ensambladas al conjunto del vídeo), más o menos logré el efecto de integrar unas partes con otras, y que la transición entre los distintos conceptos (más difícil que la transición entre melodías) no resultase forzada.

Debo confesar que la canción de Battiato la escogí por la melodía. Y según fui redactando el texto del vídeo, me dí cuenta de que casaba perfectamente con la letra de esa canción, por lo que la Battiato encontró su sitio en la parte final del vídeo (final, salvo por el guiño de la última frase/canción).

A pesar de que en el vídeo menciono los MOOC, lo cierto es que al hablar de los profesores online que he tenido me refiero especialmente a algunos "no tan masivos" (Lola Heredia, del curso de Formador ocupacional), pero también por ejemplo a Michael Kearns, que con su personal estilo se mete a sus 80.000 alumnos en el bolsillo y logra inspirar una simpatía muy particular. Y eso, en lo que respecta a pedagogía, es MUY eficaz.