Respuestas
Respuesta:
En el apartado Visualización de datos están disponibles las gráficas que muestran los resultados obtenidos del proyecto Aracne. Hemos distinguido tres grupos de resultados en función de la cuestión que tratan.
Riqueza
En el apartado Riqueza se muestran los datos relativos a las mediciones de riqueza. Tal y como se mencionaba en el apartado Modus operandi, han sido tres las variables analizadas:
La relación TTR en nuestras particulares adaptaciones lematizada y semántica: lemas distintos entre palabras totales (primera gráfica) y lemas distintos con categoría semántica entre palabras totales con categoría semántica (segunda gráfica). Los valores en ambos casos oscilan entre 0 y 1.
La densidad léxica: palabras con categoría semántica (nombres, adjetivos, verbos, adverbios acabados en –mente) entre palabras totales. Los valores oscilan entre 0 y 1.
La complejidad del texto, calculada como el valor medio ponderado sobre distintos rasgos de sofisticación lingüística del texto (complejidad sintáctica, tiempos y modos verbales, dificultad de las palabras utilizadas, referencialidad y abstracción). Los valores oscilan entre 0 y 10 (siendo 10 la máxima sencillez, 0 la máxima complejidad).
Las cuatro gráficas que se derivan de estas mediciones se han representado siguiendo una estructura común. Por un lado, dada la naturaleza de la variable TTR y el sesgo que produce (véase el apartado Consideraciones teóricas sobre la riqueza léxica), la agregación de datos se ha hecho teniendo en cuenta la longitud de los textos. Es decir, la comparación de los valores de riqueza se ha hecho entre artículos de longitud semejante. Se distinguen así siete grupos en función del número de palabras del artículo (indicado en el eje horizontal de la gráfica). Si bien esta restricción sobre extensión de los textos y comparabilidad es solo propia de la medición del TTR (y sus derivados), hemos optado por mantenerla también en la comparación de la densidad y la complejidad para comprobar si hay diferencias reseñables en los valores obtenidos según la longitud del texto (y evitar posibles sesgos inesperados).
Por otro lado, los datos de riqueza se han agrupado en intervalos de veinte años. Es decir, hemos fraccionado el intervalo de años entre 1914 y 2014 en cinco épocas, y la información de riqueza sobre esos cinco bloques son los que hemos agregado. Cada una de las barras verticales representadas en las gráficas corresponde a un intervalo de años. Esta agrupación ha sido la que mostraba una representación más homogénea, más comparable y permitía una visualización de datos eficaz. No obstante, los valores en bruto sin agregar están disponibles para descargar para quien quiera volver sobre ellos o analizarlos individualmente. Sobre las mediciones representadas por las barras verticales se ha trazado una línea que representa el valor medio de la variable analizada sobre el total del corpus de Aracne, es decir, el cómputo de la media global sin distinción de épocas. De este modo, podemos observar si los valores obtenidos para una determinada extensión en una época concreta están por encima o por debajo de la media global.
Las cuatro gráficas obtenidas de la medición de las tres variables referidas a la riqueza revelan datos muy homogéneos. Las dos gráficas relativas al TTR muestran un descenso de los índices de variación a medida que los textos se hacen más largos, siendo más acusado el descenso en la primera gráfica. La espectacularidad de este descenso no debe ni alarmarnos ni desviarnos de nuestro análisis de resultados, puesto que forma parte del resultado esperable. Como comentamos en las consideraciones teóricas sobre la riqueza, los índices de variación léxica tienden a disminuir según aumenta la extensión del texto analizado porque la probabilidad de que aparezcan palabras nuevas que no hayan aparecido antes disminuye según se alarga el texto. La segunda gráfica (correspondiente a nuestra adaptación del TTR semántico) muestra, por tanto, un descenso menos pronunciado porque se han excluido del cómputo las preposiciones, artículos, conjunciones y otras palabras gramaticales que no aportan variación léxica.
Lo que debemos comparar, por consiguiente, son las diferencias entre las cinco épocas (las cinco barras verticales) en cada uno de los valores de extensión del texto (y no las diferencias de riqueza entre textos de distinta longitud, puesto que ya sabemos que esa comparación está sesgada por la propia naturaleza de la variable TTR). Lo que se observa es que los valores se mantienen en general muy estables, con diferencias mínimas entre épocas. Los valores además están muy concentrados, las diferencias respecto a la media nunca superan el 10 % y se mantienen sorprendentemente uniformes en todas las épocas y para todas las longitudes.
Explicación:
Respuesta:
espero que te ayude
Explicación:
Representar consiste en retratar una realidad material mediante símbolos de diferente naturaleza, mientras que interpretar consiste en reconstruir la realidad material a la que se refiere una representación de la realidad