Información del corpus

Estadísticas generales

Tokens966405
Palabras866203
Tipos23158
Lemas15491
Hápax legómenon10831
Dis legómenon3489
Etiquetas POS493

Tokens = cadenas de caracteres limitadas por espacios en blanco e incluyendo signos de puntuación.
Palabras = cadenas de caracteres limitadas por espacios en blanco y excluyendo signos de puntuación.
Tipos = palabras distintas (contabilizadas a partir de formas estandarizadas y sin diferenciar mayúsculas de minúsculas).

Documentos

Número de documentos725
Media (tokens por documento)1333
Mediana (tokens por documento)984
Documento más extenso (tokens)15663
Documento más breve (tokens)108
Documento más antiguo (año)1600
Documento más reciente (año)1896

Agrupación por clase de palabra

Clase de palabraN%
nombre común21153521.89
preposición15499616.04
determinante10522510.89
puntuación10020210.37
verbo912049.44
numeral713407.38
conjunción700577.25
adjetivo450074.66
pronombre379653.93
nombre propio339323.51
adverbio268372.78
sin etiquetar177361.84
palabra extranjera2710.03
interjección980.01
Total966405100.00

Agrupación por proyecto

ProyectoN%
CORDEREGRA36557137.83
HISPATESD24759325.62
ALEA1817636918.25
CORTENEX16788317.37
ALEA1964430.67
VIVE24380.25
_1080.01
Total966405100.00

Agrupación por tipo textual

Tipo textualN%
inventiario de bienes69732772.16
declaración de testigos19291719.96
certificación médica713027.38
otro46400.48
OTH2190.02
Total966405100.00

Agrupación por siglo

SigloN%
XVIII57819759.83
XVII27068528.01
XIX11752312.16
Total966405100.00

Agrupación por provincia

ProvinciaN%
Granada16749217.33
Jaén11300211.69
Almería11205711.60
Badajoz11097311.48
Madrid751837.78
Cádiz725687.51
Burgos687937.12
Málaga681787.05
Cáceres612486.34
Sevilla330453.42
Huelva273202.83
Murcia148631.54
Valladolid127201.32
La Rioja53490.55
Cantabria49440.51
Toledo39820.41
Palencia37850.39
Zamora21500.22
Navarra20110.21
Álava16800.17
Soria14440.15
León13800.14
Córdoba8830.09
Gipuzkoa6050.06
Teruel2930.03
Salamanca2380.02
Cádiz 2190.02
Total966405100.00

Agrupación por archivo

ArchivoN%
Archivo de la Real Chancillería de Granada23739624.56
Archivo Histórico Provincial de Badajoz10798111.17
Archivo Histórico Provincial de Jaén10545910.91
Archivo Histórico de Protocolos de Madrid732907.58
Archivo Histórico Provincial de Burgos666566.90
Archivo Histórico Provincial de Almería637746.60
Archivo Histórico Provincial de Cáceres599026.20
Archivo Histórico Provincial de Cádiz511015.29
Archivo Histórico de Protocolos de Granada495705.13
Archivo de la Real Chancillería de Valladolid445784.61
Archivo Histórico Provincial de Huelva265732.75
Archivo Histórico Provincial de Sevilla247022.56
Archivo Histórico Municipal de Lorca148631.54
Archivo Municipal de Puerto Real142531.47
Archivo Histórico Provincial de Málaga119451.24
Archivo Histórico Municipal de Baeza64430.67
Archivo Municipal de Vera58070.60
Archivo Histórico Provincial de Córdoba8830.09
Archivo Histórico Municipal de Loja7810.08
AHPC4480.05
Total966405100.00

Agrupación por siglo y provincia (frecuencias absolutas)

XV XVI XVII XVIII XIX Total (provincia) Total (área)
Almería 26626 47667 37764 112057 392551
Granada 51452 113411 2629 167492
Jaén 109268 3734 113002
Málaga 26420 33732 8026 68178 69061
Córdoba 883 883
Cádiz 70676 1892 72568 132933
Sevilla 168 32877 33045
Huelva 27320 27320
Madrid 36074 39109 75183 143976
Burgos 67453 1340 68793
otros 166019 39719 22146 227884 227884
Total (siglo) 0 0 270685 578197 117523 966405 966405

Agrupación por siglo y provincia (frecuencias relativas)

XV XVI XVII XVIII XIX Total (provincia) Total (área)
Almería 0.00 0.00 2.76 4.93 3.91 11.60 40.62
Granada 0.00 0.00 5.32 11.74 0.27 17.33
Jaén 0.00 0.00 0.00 11.31 0.39 11.69
Málaga 0.00 0.00 2.73 3.49 0.83 7.05 7.15
Córdoba 0.00 0.00 0.00 0.00 0.09 0.09
Cádiz 0.00 0.00 0.00 7.31 0.20 7.51 13.76
Sevilla 0.00 0.00 0.02 3.40 0.00 3.42
Huelva 0.00 0.00 0.00 2.83 0.00 2.83
Madrid 0.00 0.00 0.00 3.73 4.05 7.78 14.90
Burgos 0.00 0.00 0.00 6.98 0.14 7.12
otros 0.00 0.00 17.18 4.11 2.29 23.58 23.58
Total (siglo) 0.00 0.00 28.01 59.83 12.16 100.00 100.00

Medidas de diversidad léxica

MedidaDescripciónFórmulaResultado
TTR type-token ratio TTR = V N 0.027
RTTR Giraud's root type-token ratio RTTR = V N 24.882
CTTR Carroll's corrected type-token ratio CTTR = V 2N 17.594
C Herdan's C index C = log V log N 0.735
S Somer's S index S = log ( log 𝑉 ) log ( log 𝑁 ) 0.882
M Maas' index M = ( log 𝑁 - log 𝑉 ) log 𝑁 2 0.036
H Honoré's index H = 100 * ( log ⁡N 1 - V 1 V ) 2568.454
K Yule's K index K = 10 4 * [ - 1 N + i = 1 V f v ( i , N ) * ( i N ) 2 ] 171.990
D Simpson's D index D = i = 1 V f v ( i , N ) * ( i N ) * ( i - 1 N - 1 ) 0.017
HTR Hapax-token ratio HTR = V 1 V 0.468
DTR Dis-token ratio DTR = V 2 V 0.151
VGR Vocabulary growth rate VGR = V 1 N 0.013

N = número de palabras; V = número de tipos; V1 = número de hápax legómenon; V2 = número de dis legómenon; f v ( i , N ) = números de tipos que ocurren i veces en una muestra de tamaño N.