Minería de Datos y Análisis de Sentimientos
1ª Edición (2025)
Presentación
Todos aquellos que trabajan en análisis de datos o ciencia de datos habrán observado que los datos se generan de forma continua y a un ritmo cada vez más acelerado. Aunque los analistas suelen estar formados para trabajar con datos tabulares o estructurados, principalmente numéricos, una gran parte de los datos que proliferan hoy en día son no estructurados y centrados en texto.
En este curso aprenderás cómo, mediante la aplicación de los principios de datos limpios y ordenados (tidy data), es posible facilitar muchas tareas de minería de texto, haciéndolas más eficaces y coherentes con las herramientas que ya se usan ampliamente en análisis de datos. Tratar el texto como marcos de datos compuestos por palabras individuales permite manipular, resumir y visualizar fácilmente las características del lenguaje, e integrar el procesamiento de lenguaje natural en flujos de trabajo ya conocidos.
Este curso es una introducción práctica a la minería de texto con el paquete tidytext
y otras herramientas tidy en R. El enfoque es eminentemente práctico, centrado en ejemplos con software y exploraciones de datos reales.
Información
Profesorado:
Dr. José V. Die Departamento de Genética-ETSIAM. Universidad de Córdoba.
Dr. José R. Caro Departamento de Estadística e Investigación Operativa, Economía Aplicada y Organización de Empresas. Universidad de Córdoba.
Dirección Académica:
- Dr. José V. Die Dept. de Genética-ETSIAM. Universidad de Córdoba.
Fechas del Curso y Lugar
Lugar: Aula de Informática, Facultad de Filosofía y Letras. Plaza del Cardenal Salazar 3, Córdoba.
- El curso se ha organizado en los siguientes días y horas:
Semana 1 | Día | Hora |
---|---|---|
Lunes, 6 octubre | 10:00-13:00 | |
Martes, 7 octubre | 09:30-13:30 | |
Miércoles, 8 octubre | 09:30-13:30 | |
Miércoles, 8 octubre | 15:00-18:00 | |
Jueves, 9 octubre | 09:30-13:30 |
Semana 2 | Día | Hora |
---|---|---|
Martes, 14 octubre | 10:00-13:00 | |
Miércoles, 15 octubre | 10:00-13:00 | |
Miércoles, 15 octubre | 15:00-18:00 | |
Jueves, 16 octubre | 10:00-13:00 |
Programa del Curso
- motivación del curso (slides)
Módulo 1: Fundamentos básicos de R
.
Módulo 3: Análisis de Sentimientos.
- diccionarios
- implementación del análisis de sentimientos
- código
Módulo 4: Dinámica temporal de palabras y emociones.
- paquete
lubridate
- evolución temporal de emociones
- código
Módulo 5: Relaciones entre palabras.
Caso estudio: Netflix.
- Identificación de palabras asociadas a emociones
- Caracterización del tono emocional
- Identificación de los títulos asociados a una emoción
- Evolución de una emoción a lo largo del tiempo
- Modelización de una emoción a lo largo del tiempo
- code
Cambios de última hora: Es posible que el esquema y plan del curso visto anteriormente pueda sufrir modificaciones y readaptaciones en función de la disponibilidad del aula de impartición y/o el grado de avance de la materia.
Archivos de interés
- Guía de estilo (por Hadley Wickham)
- Code to Joy (The Economist, por Andrew Smith)
- Colores y paletas en R (Zeileis and Murrell, 2023)
Código de Conducta
Los organizadores del curso ‘Minería de Datos y Análisis de Sentimientos con R’ se comprometen a proporcionar una experiencia acogedora y libre de acoso para todos, independientemente de su género, identidad de género y expresión, edad, orientación sexual, diversidad funcional, apariencia física, tamaño corporal, raza, etnia, religión (o falta de ella) u elecciones de tecnología. No toleramos el acoso de los participantes en el curso de ninguna forma. El lenguaje y las imágenes sexuales no son apropiadas para ningún lugar del curso, incluídas las clases teóricas, ejercicios, descansos, RRSS y otros medios on line. Los participantes del curso que violen estas reglas pueden ser sancionados o expulsados del curso a discreción de los organizadores del curso.
Este código de conducta se aplica a todos los participantes, incluyendo al personal y profesorado del curso, y se aplica a todos los modos de interacción, tanto en persona como on line, incluyendo los repositorios de proyectos GitHub, la plataforma Moodle, los canales de RRSS.
Los participantes en el curso aceptan:
- Ser considerados en la forma de expresarse y de actuar y ser respetuosos con los límites de los demás asistentes.
- Abstenerse de comportamientos y expresiones degradantes, discriminatorias o acosadoras. El acoso incluye, pero no se limita a: intimidación deliberada; fotografía o grabación no deseada; interrupción sostenida o deliberada de las conversaciones y otros eventos; contacto físico inapropiado; uso de imágenes sexuales o discriminatorias; comentarios, bromas y atención sexual no deseada. Si piensas que alguien te ha acosado o te ha tratado de manera inapropiada, por favor diríjete en persona a cualquier responsable del curso.
- Cuidar unos de otros. Si observas una situación peligrosa, alguien en apuros o violaciones de este código de conducta, incluso si parecen intrascendentes, avisa a un responsable del curso.
Damos prioridad a la seguridad de las personas marginadas sobre la comodidad de las personas privilegiadas. No actuaremos sobre las quejas relativas a
- ismos “inversos”, incluidos el “racismo inverso”, el “sexismo inverso” y la “cisfobia”
- comunicación razonable de límites, como “déjame en paz”, “vete” o “no voy a discutir esto contigo”
- comunicarse en un “tono” que no te parece agradable criticar comportamientos o suposiciones racistas, sexistas, cisexistas o de otro tipo de opresión
¿Necesitas ayuda?
Si tienes alguna duda o inquietud, habla con José Die.
Si alguno de los asistentes tiene un comportamiento de acoso, cualquier responsable del curso puede tomar la acción legal que consideremos apropiada, que incluye, entre otras, advertir a esa persona o pedirle que abandone el curso. (Si alguien considera que ha sido injustamente acusado de violar este código de conducta, debe comunicarse con el resto de responsables del curso por escrito con una descripción concreta de su queja).
Cualquier comentario sobre este y cualquier otro aspecto del curso es muy bien recibido y agradecemos tu colaboración para que que sea una experiencia segura, agradable y amistosa para todos los que participan.
Este código de conducta se ha adaptado del código de conducta de ROpenSci, v.2.5, Jan 30, 2024. Este código de conducta está bajo la licencia CC BY-SA 4.0. Por favor, revisa la página para obtener más información sobre la licencia y la atribución.
Organiza :