Corpus de mètrica

Corpus de sonets castellans dels Segles d’Or (XVI i XVII) anotats amb la informació mètrica.

Poetes

Amb l’objectiu de crear-ne un corpus com més representatiu millor, hi hem inclòs qualsevol autor dels segles XVI i XVII de qui disposem almenys 10 sonets digitalitzats. A hores d’ara, el corpus consta de més de 5000 sonets (més de 71000 versos), i inclou autors com:

Agustin de Salazar y Torres, Antonio Enríquez Gómez, Bartolomé Leonardo de Argensola, Lupercio Leonardo de Argensola, Bernardino de Rebolledo, Bocángel y Unzueta, Miguel de Cervantes, Diego Hurtado de Mendoza, Diego Ximenez Ayllon, Fernando de Herrera, Francisco de Aldana, Francisco de Borja y Aragón, Francisco de la Torre, Francisco de Medrano, Garcilaso de la Vega, Luis de Góngora, Gutierre de Cetina, Hernando de Acuña, Joseph de Litala y Castelví, Juana Inés de la Cruz, Juan Boscán, Juan de Almeida, Juan de Arguijo, Juan de Tassis y Peralta, Juan de Timoneda, Lope de Vega, Lope de Zárate, López de Mendoza, Luis Carrillo y Sotomayor, Luis de Ulloa y Pereira, Antonio Mira de Amescúa, Pedro de Padilla, Pedro Espinosa, Pedro Soto de Rojas, Francisco de Quevedo, Tirso de Molina, Trillo y Figueroa, Baltasar de Alcázar, Fray Luis de León, Jerónimo Cáncer y Velasco, Francisco de Figueroa, Antonio Hurtado de Mendoza, Juan de Jauregui, Luis Martín de la Plaza, Gregorio de Matos, Anastasio Pantaleón de Ribera, Jacinto Polo de Medina, Diego Ramírez Pagán, Adnrés Rey de Artieda, Juan de Salinas, Esteban Manuel de Villegas, Cristóbal de Virués, entre d’altress. Accedeix a la pàgina de descàrrega per a veure el llistat complet d’autors.

Els textos han estat extrets de la Biblioteca Virtual Miguel de Cervantes.

Marcat

Cada sonet ha estat anotat en XML seguint l’estàndard TEI. A més de l’encapçalament i la informació estructural, cada sonet té representats formalment els patrons mètrics de cada vers. El patró està format per la seqüència de síl·labes àtones (representades amb el signe –) i tòniques (símbol +). La mètrica de cada vers queda representada així:

    <l n="1" met="---+---+-+-">Cuando me paro a contemplar mi estado,</l>

Anotació

L’anotació dels patrons mètrics s’ha realitzat de manera semiautomàtica. En primer lloc, s’han processat tots els sonets amb un sistema automàtic d’escansió, que assigna a cada vers el seu patró mètric. En segon lloc, hem validat a mà cada patró mètric i hi hem corregit les errades detectades.

Actualment el corpus es troba en fase de validació manual. L’encapçalament TEI de cada sonet indica si els patrons mètrics han estat validats a mà o no.

Han col·laborat en l’anotació mètrica del corpus Mª Ángeles Herrero Herrero, María Ribes Lafoz, Noelia Sánchez, Sara Trigueros i Borja Navarro Colorado.

Per a conéixer-ne els detalls de l’anotació, pot consultar-ne la guia d’anotació o les publicacions del projecte.

Com citar-ne el corpus

Si utilitza aquest corpus en treballs acadèmics, per favor, cite el recurs de manera apropiada:

Borja Navarro Colorado, María Ribes Lafoz and Noelia Sánchez (2016) “Metrical annotation of a large corpus of Spanish sonnets: representation, scansion and evaluation”, Proceedings of the 10th edition of the Language Resources and Evaluation Conference, 23-28 May 2016, Portorož (Slovenia).

Llicència

L’anotació mètrica d’aquest corpus es troba sota llicència de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.