作者: Leo Wanner , Simon Mille , Alicia Burga , Vanesa Vidal , Roc Boronat
DOI:
关键词:
摘要: We present a cost-effective strategy for the creation of mid-size fine-grained Spanish dependency tree bank surface-, deep-syntactic and semantic structures as defined in Meaning-Text Theory. The starts from small seed corpus, AnCora whose annotation is considerably more coarse-grained than our target annotation. show that this discrepancy can be bridged largely by automatic means. This allows us to develop resources with limited human effort within period time. also propose preliminary evaluation actual amount work process requires. Resumen: En este articulo presentamos una estrategia de bajo coste para la creacion un corpus estructuras sintacticas (tanto superficiales como profundas) y semanticas, tal son definidas en Teoria Sentido-Texto. El es tamano medio, pero muy preciso detallado. La parte pequeno dependencias, el AnCora, cuya anotacion mucho menos detallada que nuestra. Mostramos discrepancia entre ambas anotaciones se puede salvar gran medida traves medios automaticos, lo cual permite los recursos necesarios desarrollen poco tiempo con esfuerzo humano limitado. Asimismo, proponemos evaluacion preliminar cantidad trabajo requerido terminos reales proceso anotacion. Palabras clave: dependencia, sentido-texto, sintaxis superficial, profunda, espanol, base datos arboles