Written corpus ccKres 1.0

作者： Peter Holozan , Miha Grčar , Tomaž Erjavec , Nataša Logar , Simon Krek

DOI:

关键词: Encoding (semiotics) 、 Newspaper 、 Artificial intelligence 、 Natural language processing 、 Corpus linguistics 、 XML 、 Computer science

摘要: Corpus ccKres consists of 9,376 documents, each containing information about the source (e.g. newspapers, magazines), year publication, text type (fiction, newspaper), title and author if they are known. The corpus is POS-tagged lemmatised, encoded in XML TEI format (Text Encoding Initiative P5). contains approximately 9% Kres corpus, a balanced Slovene: http://eng.slovenscina.eu/korpusi/kres.

暂无可下载资源，当前可以选择系统获取到有开放资源时通知我或者直接发起求助文献求助

参考文章(0)

Written corpus ccKres 1.0

来源期刊

我的账户

Written corpus ccKres 1.0

来源期刊

相似文章 0

我的账户