Corpus abierto de obras literarias en español, en formato txt, para estudios de estilometría.
Actualización Septiembre 2020
- Novelas Siglo de Oro: 66
- Comedias Siglo de Oro: 345
- Entremeses Siglo de Oro: 22
- Novelas 1880-1940: 42
Repositorios utilizados:
- Siglo de Oro - Comedias https://tc12.uv.es/ TC/12 Red del Patrimonio Teatral Clásico Español
- Siglo de Oro - Comedias https://oraprdnt.uqtr.uquebec.ca/pls/public/gscw031?owa_no_site=5478 Teatro de los Siglos de Oro
- Siglo de Oro - Novelas https://github.com/7PartidasDigital/NovelaBarroca José Manuel Fradejas Rueda (Universidad de Valladolid)
- Siglo de Oro - Comedias, entremeses... http://www.comedias.org/textlist.html AHCT Lista de textos
- Novelas 1880-1940 https://github.com/cligs/textbox/tree/master/spanish/novela-espanola Novelas 1880-1940
- Otros http://www.cervantesvirtual.com/ Biblioteca Virtual Miguel de Cervantes
Cualquier persona interesada en colaborar en este proyecto, puede hacerlo en Github o bien contactando por email: [email protected]
Full text versions, in plain text format, harvested from trustworthy public domain sites.
This collection is published under Creative Common Attribution CC BY. This license lets you distribute, remix, adapt, and build upon this repository, even commercially, as long as you credit this Github for the corpus creation.