Corpus info

General stats

Tokens1308436
Words1177746
Types27973
Lemmas18586
Hapax legomenon13356
Dis legomenon4155
POS tags533

Tokens = strings separated by white spaces (punctuation marks included).
Words = strings separated by white spaces (punctuation marks excluded).
Types = unique words (based on standardized spelling and case insensitive).

Documents

Number of documents1147
Average (tokens per document)1141
Median (tokens per document)831
Longest document (tokens)15663
Shortest document (tokens)53
Oldest document (year)1499
Most recent document (year)1896

Group by part of speech

Main POS tagN%
common noun28945022.12
preposition20591115.74
determiner14211710.86
punctuation1306909.99
verb1163338.89
numeral965237.38
conjunction935157.15
adjective638454.88
pronoun472233.61
untagged437043.34
proper noun422563.23
adverb364052.78
foreign word3510.03
interjection1130.01
Total1308436100.00

Group by project

ProjectN%
CORDEREGRA53776741.10
HISPATESD28607021.86
CORTENEX19756515.10
ALEA1817592113.45
VIVE1045627.99
ALEA1964430.49
_1080.01
Total1308436100.00

Group by text type

Text typeN%
inventory of goods96402473.68
witness statement25514419.50
medical certificate728035.56
other164651.26
Total1308436100.00

Group by century

CenturyN%
XVIII59484745.46
XVII29277522.38
XVI27863921.30
XIX14175410.83
XV4210.03
Total1308436100.00

Group by province

ProvinceN%
Granada21977416.80
Almería14098810.78
Sevilla13585310.38
Badajoz13146310.05
Jaén1276389.76
Madrid1085768.30
Málaga872796.67
Cádiz762515.83
Cáceres719415.50
Burgos687935.26
Huelva336352.57
Valladolid283432.17
Córdoba233361.78
Murcia153391.17
Soria93950.72
Zamora55650.43
La Rioja53490.41
Cantabria49440.38
Toledo39820.30
Palencia37850.29
Navarra20110.15
Álava16800.13
León13800.11
Gipuzkoa6050.05
Teruel2930.02
Salamanca2380.02
Total1308436100.00

Group by institution

InstitutionN%
Archivo de la Real Chancillería de Granada27277120.85
Archivo Histórico Provincial de Badajoz1269709.70
Archivo Histórico Provincial de Sevilla1240019.48
Archivo Histórico Provincial de Jaén1054598.06
Archivo Histórico de Protocolos de Madrid975897.46
Archivo Histórico Provincial de Almería770425.89
Archivo Histórico de Protocolos de Granada766115.86
Archivo de la Real Chancillería de Valladolid710675.43
Archivo Histórico Provincial de Cáceres705955.40
Archivo Histórico Provincial de Burgos666565.09
Archivo Histórico Provincial de Cádiz550134.20
Archivo Histórico Provincial de Huelva319602.44
Archivo Histórico Provincial de Córdoba233361.78
Archivo Histórico Municipal de Baeza210791.61
Archivo Histórico Municipal de Lorca148631.14
Archivo Municipal de Puerto Real142531.09
Archivo Histórico Provincial de Málaga119450.91
Archivo Municipal de Vera110020.84
Archivo del Patronato de la Alhambra y Generalife102710.78
Archivo General de Simancas76480.58
Archivo Histórico Provincial de Madrid54710.42
Archivo Municipal de Huéscar36970.28
Archivo histórico provincial de Sevilla30610.23
_18260.14
Archivo Histórico de Procolos de Madrid15790.12
Archivo Histórico de Huelva9280.07
Archivo Histórico Municipal de Loja7810.06
Archivo Municipal e Histórico de Protocolos Notariales de Guadix5140.04
Archivo Histórico Provincial4480.03
Total1308436100.00

Group by century and province (absolute frequencies)

XV XVI XVII XVIII XIX Total (province) Total (area)
Almería 28931 26626 47667 37764 140988 488400
Granada 52282 51452 113411 2629 219774
Jaén 8952 5684 109268 3734 127638
Málaga 19101 26420 33732 8026 87279 110615
Córdoba 22453 883 23336
Cádiz 71980 4271 76251 245739
Sevilla 421 72084 8604 44847 9897 135853
Huelva 664 4101 28870 33635
Madrid 19393 37900 51283 108576 177369
Burgos 67453 1340 68793
others 54779 169888 39719 21927 286313 286313
Total (century) 421 278639 292775 594847 141754 1308436 1308436

Group by century and province (relative frequencies)

XV XVI XVII XVIII XIX Total (province) Total (area)
Almería 0.00 2.21 2.03 3.64 2.89 10.78 37.33
Granada 0.00 4.00 3.93 8.67 0.20 16.80
Jaén 0.00 0.68 0.43 8.35 0.29 9.76
Málaga 0.00 1.46 2.02 2.58 0.61 6.67 8.45
Córdoba 0.00 1.72 0.00 0.00 0.07 1.78
Cádiz 0.00 0.00 0.00 5.50 0.33 5.83 18.78
Sevilla 0.03 5.51 0.66 3.43 0.76 10.38
Huelva 0.00 0.05 0.31 2.21 0.00 2.57
Madrid 0.00 1.48 0.00 2.90 3.92 8.30 13.56
Burgos 0.00 0.00 0.00 5.16 0.10 5.26
others 0.00 4.19 12.98 3.04 1.68 21.88 21.88
Total (century) 0.03 21.30 22.38 45.46 10.83 100.00 100.00

Measures of lexical diversity

MeasureDescriptionFormulaResult
TTR type-token ratio TTR = V N 0.024
RTTR Giraud's root type-token ratio RTTR = V N 25.776
CTTR Carroll's corrected type-token ratio CTTR = V 2N 18.226
C Herdan's C index C = log V log N 0.732
S Somer's S index S = log ( log 𝑉 ) log ( log 𝑁 ) 0.882
M Maas' index M = ( log 𝑁 - log 𝑉 ) log 𝑁 2 0.036
H Honoré's index H = 100 * ( log ⁡N 1 - V 1 V ) 2675.226
K Yule's K index K = 10 4 * [ - 1 N + i = 1 V f v ( i , N ) * ( i N ) 2 ] 171.469
D Simpson's D index D = i = 1 V f v ( i , N ) * ( i N ) * ( i - 1 N - 1 ) 0.017
HTR Hapax-token ratio HTR = V 1 V 0.477
DTR Dis-token ratio DTR = V 2 V 0.149
VGR Vocabulary growth rate VGR = V 1 N 0.011

N = number of words; V = number of types; V1 = number of hapax legomenon; V2 = number of dis legomenon; f v ( i , N ) = numbers of types occurring i times in a sample of length N.