Respuestas
Respuesta:
es hiperonimo
Explicación:
hiperonimo
Respuesta:
Resumen: En este trabajo se presenta un enfoque para la extracción automática de pares hipónimo-hiperónimo. En particular se propone un método de extracción de información léxica, orientado a la relación de hiponimia, que utiliza un conjunto de patrones léxicos propios del español, así como un esquema simétrico de calificación de pares/patrones cuyo objetivo es enriquecer la confiabilidad del método de extracción. La eficacia del método propuesto se evaluó obteniendo hipónimos correspondientes a un vocabulario de hiperónimos dado. Los resultados logrados confirman la utilidad del método propuesto para extraer hipónimos, así como la relevancia del esquema de calificación de pares/patrones.
Palabras Clave: Hipónimo, hiperónimo, patrones léxico-sintácticos, extracción de información.
Abstract: This paper presents an approach to the automatic extraction of hyponyms and hyperonyms. In particular, it proposes an information extraction method that is specially suited for identifying pairs of hyponym-hyperonym by using a set of Spanish lexical patterns. It also proposes a symmetric weighting scheme of pairs/patterns whose goal is to enhance the confidence of the extraction method. The effectiveness of the proposed approach was evaluated by extracting hyponyms from a given vocabulary of hyperonyms. Results show the usefulness of the proposed extraction method as well as the relevance of the pairs/patterns weighting scheme.
Key Words: Hyponym, hypernym, lexical-syntactic pattern, information extraction.
INTRODUCCIÓN
La búsqueda y extracción de información en Internet juega un papel relevante para la lexicografía y la terminología actuales, lo que ha llevado a implementar nuevos métodos y técnicas para acceder a esta información (Llisterri, 2003; Águila, 2006; Rojo, 2008). Muchos de estos métodos y técnicas son híbridos, pues emplean el conocimiento aportado por la lingüística, la estadística y las ciencias computacionales para resolver tareas como la construcción de diccionarios electrónicos (Wilks, Slator & Guthrie, 1996), terminologías (Cabré, Estopà & Vivaldi, 2001) o redes léxicas (Fellbaum, 1998), por mencionar algunos recursos relevantes.
El presente trabajo se sitúa en el terreno de la extracción de información y su objetivo principal consiste en delimitar un método de extracción de pares hipónimo/hiperónimo usando un conjunto de patrones léxicos propios del español. Básicamente, el método propuesto en esta investigación aplica dichos patrones a documentos recopilados de Internet (textos escritos en prosa) y detecta automáticamente un conjunto de hipónimos relacionados a un vocabulario previamente proporcionado.
Siguiendo el enfoque planteado por Hearst (1992), consideramos el uso de patrones léxico-sintácticos para llevar acabo nuestro proceso de extracción. Este enfoque parte de la idea de que en una lengua existe esta clase de patrones, los cuales permiten expresar hipónimos e hiperónimos dentro de un texto. Por ejemplo, la frase ‘es un´ es comúnmente utilizada como un operador que relaciona un hipónimo con su respectivo hiperónimo (Wilks et al., 1996).
Tales patrones, como mostró Hearst (1992), pueden ser aplicados dentro un proceso de búsqueda automática para recuperar hipónimos de una colección de textos. A la fecha existen varias propuestas para descubrir patrones de hiponimia de manera automática (Pasca, 2004; Pantel & Pennacchiotti, 2006; Barbu, 2008). En particular, en esta investigación se utiliza el conjunto de patrones que han sido recuperados a través del método desarrollado por Ortega (2007).
Naturalmente, dada la riqueza y complejidad que conlleva toda lengua humana, los enfoques automáticos basados en patrones para descubrir relaciones léxicas no son completamente confiables. Es por ello, que para mejorar su precisión se evalúa la confianza de los patrones encontrados y/o la confianza de los pares hipónimo-hiperónimo detectados (Pantel & Pennacchiotti, 2006; Ortega, Villaseñor & Montes, 2007; Blohm, Cimiano & Stemle, 2007; Barbu, 2008).
Explicación: