Os investigadores que preferirem lidar com os dados do CORDIAL-SIN usando ferramentas próprias encontram no quadro abaixo os ficheiros de texto apropriados, organizados por excerto, localidade e nível de transcrição/anotação.
Distribuição | Transcrição(1) | Edição(1) | Versão anotada(1) | Treebank(2, 3) |
---|---|---|---|---|
Por excerto (2058 ficheiros) | transcription_excerpt.zip | edition_excerpt.zip | annotation_excerpt.zip | treebank_excerpt.zip |
Por localidade (42 ficheiros) | transcription_location.zip | edition_location.zip | annotation_location.zip | treebank_location.zip |
Corpus total (1 ficheiro) | transcription_corpus.zip | edition_corpus.zip | annotation_corpus.zip | treebank_corpus.zip |
(1) O trabalho original de transcrição, normalização e anotação POS do CORDIAL-SIN foi financiado por fundos nacionais através da FCT – Fundação para a Ciência e a Tecnologia, I.P., no âmbito dos projetos PRAXIS XXI/P/PLP/13046/1998, POSI/PLP/33275/1999, POCTI/LIN/46980/2002.
(2) A constituição do CORDIAL-SIN-treebank foi financiada por fundos nacionais através da FCT – Fundação para a Ciência e a Tecnologia, I.P., no âmbito dos projetos PTDC/LIN/71559/2006, UID/LIN/00214/2013, PTDC/LLT-LIN/32086/2017, UID/00214/2019.
(3) Os ficheiros PSD são pesquisáveis com a ferramenta CorpusSearch.
Os ficheiros em formato XML/PSDX podem ser descarregados a partir do quadro abaixo:
Distribuição | Corpus(4, 5) | Treebank(4, 6) |
---|---|---|
Corpus total (1 ficheiro) | XML_corpus.zip | PSDX_corpus.zip |
(4) Este trabalho foi financiado por fundos nacionais através da FCT – Fundação para a Ciência e a Tecnologia, I.P., no âmbito do projeto PTDC/LLT-LIN/32086/2017.
(5) Os ficheiros XML estão alojados no TEITOK e são pesquisáveis online.
(6) Os ficheiros PSDX estão alojados no TEITOK e são pesquisáveis online.