Humanidades Digitales. Del corpus a la interpretación: Estilometría con R – Cursos de Verano 2021
7 al 9 de septiembre
Objetivos
- Presentar el problema filológico de la atribución textual de textos literarios.
- Mostrar la importancia de la modelización y manejo de un corpus.
- Aproximación al data mining: extracción de textos de la web.
- Aproximación al tratamiento de datos: del html al txt vía regex (Regular expressions).
- Introducción al XML/TEI. Codificación de una obra de teatro/poesía.
- Trabajar con transformación / extracción del XML al TXT.
- Explicar el almacenamiento, recuperación y gestión de datos. Github (control de cambios)
- Introducir a los métodos de análisis estilísticos con ayuda de ordenadores.
- Introducción teórico práctica a la estilometría.
- Conocer lenguajes de programación. Vocabulario básico. R/Rstudio. Funciones, variables, paquetes, ayuda.
- Presentar y profundizar en Stylo, Metrics: Cluster, PCA, Bootstrap, etc.
- Métodos de análisis secuencial (estudio de caso de comedias colaboradas)
- Introducir a humanistas, en especial a filólogos, en los métodos que están detrás del análisis estadístico: PCA, Machine Learning, Neural Networks.
- Encontrar las diferencias entre ciencia y pseudociencia y conocimiento racional e irracional.
- Ofrecer mecanismos que ayuden a identificar la segunda, algo que debería estar al alcance de cualquier educador, comunicador y profesional de la salud y sería muy recomendable que se extendiese al público en general.
INFORMACIÓN GENERAL
Para los alumnos que realicen el curso se reconocerá 0.5 créditos por cada curso o actividad equivalente a 12.5 h. para Grado