Siguiendo el enfoque planteado por Hearst (1992), consideramos el uso de patrones léxico-sintácticos para llevar acabo nuestro proceso de extracción. Este enfoque parte de la idea de que en una lengua existe esta clase de patrones, los cuales permiten expresar hipónimos e hiperónimos dentro de un texto. Por ejemplo, la frase ‘es un´ es comúnmente utilizada como un operador que relaciona un hipónimo con su respectivo hiperónimo (Wilks et al., 1996).
Tales patrones, como mostró Hearst (1992), pueden ser aplicados dentro un proceso de búsqueda automática para recuperar hipónimos de una colección de textos. A la fecha existen varias propuestas para descubrir patrones de hiponimia de manera automática (Pasca, 2004; Pantel & Pennacchiotti, 2006; Barbu, 2008). En particular, en esta investigación se utiliza el conjunto de patrones que han sido recuperados a través del método desarrollado por Ortega (2007).
Naturalmente, dada la riqueza y complejidad que conlleva toda lengua humana, los enfoques automáticos basados en patrones para descubrir relaciones léxicas no son completamente confiables. Es por ello, que para mejorar su precisión se evalúa la confianza de los patrones encontrados y/o la confianza de los pares hipónimo-hiperónimo detectados (Pantel & Pennacchiotti, 2006; Ortega, Villaseñor & Montes, 2007; Blohm, Cimiano & Stemle, 2007; Barbu, 2008).
En esta investigación, evaluamos la calidad de los pares extraídos al estimar un valor de confianza de los patrones aplicados para extraerlos. De manera simétrica, también la calidad de los patrones es estimada mediante un valor de confianza de los pares extraídos. Un esquema similar lo presentan Pantel y Pennacchiotti (2006), donde se utiliza una medida probabilística, ‘la información mutua´, para medir el grado de asociación entre pares y patrones. En contraste, en el presente estudio, ‘la medida F´, utilizada tradicionalmente en el área de recuperación de información y propuesta por Van Rijsbergen (1979) es adaptada para calcular un valor de confianza de los patrones, así como de los pares descubiertos. Precisamente, este esquema simétrico de calificación pares/patrones es una de las contribuciones principales de esta investigación. Gracias a la integración de este esquema es posible determinar con mayor precisión los pares de hipónimos/hiperónimos.
1.Relaciones de hiponimia e hiperonimia
Se denomina hiperónimo a aquel término general que puede ser utilizado para referirse a la realidad nombrada por un término más particular o hipónimo. Así, un hiperónimo no posee ningún rasgo semántico, que no comparta su hipónimo, mientras que éste sí posee rasgos semánticos que lo diferencian de aquél. En otras palabras, el significado del concepto más específico (hipónimo) está incluido en el significado del concepto más general (hiperónimo) (Cruse, 1986). Ejemplos de pares hipónimo/hiperónimo son los siguientes:
i. Gorrión [hipónimo]pájaro [hiperónimo]
ii. Pájaro [hipónimo] animal [hiperónimo]
iii. Animal [hipónimo] entidad [hiperónimo]
Donde los rasgos semánticos de ‘animal´ son compartidos por los de ‘pájaro´, pero este posee otros rasgos que lo diferencian del primero. Dicha relación de inclusión, en un plano léxico, permite establecer clasificaciones y jerarquías, de modo que puede hacerse patente cómo se relaciona conceptualmente una palabra con otras.
De acuerdo con Cruse (1986), Wilks et al. (1996), así como Miller (1998), las relaciones de hiponimia e hiperonimia son aquellas que se dan, dentro de un plano léxico-semántico, entre dos o más palabras, de tal suerte que una de ellas se subordina conceptualmente a otra. Esto equivale a decir que el concepto referido por una palabra (hipónimo) es una instancia concreta de un objeto prototípico (hiperónimo), situado jerárquicamente en un nivel superior.
Siguiendo con la explicación hecha por Miller (1998), las relaciones de hiponimia e hiperonimia son básicas dentro de toda interfaz léxico-semántica de una lengua natural, debido a que una de sus funciones más importantes es estructurar sistemas de conceptos dentro de la mente de un humano, organizados conforme a las propiedades o atributos que tales conceptos prediquen de una entidad o un evento. Si bien esta clase de información es reconocible en cualquier palabra, áreas de estudio como la lexicografía, la lexicografía computacional o la extracción de información han caracterizado a los nombres como unidades léxicas prototípicas que proyectan vínculos de hiponimia e hiperonimia.
Respuesta:
Explicación:
INTRODUCCIÓN
Siguiendo el enfoque planteado por Hearst (1992), consideramos el uso de patrones léxico-sintácticos para llevar acabo nuestro proceso de extracción. Este enfoque parte de la idea de que en una lengua existe esta clase de patrones, los cuales permiten expresar hipónimos e hiperónimos dentro de un texto. Por ejemplo, la frase ‘es un´ es comúnmente utilizada como un operador que relaciona un hipónimo con su respectivo hiperónimo (Wilks et al., 1996).
Tales patrones, como mostró Hearst (1992), pueden ser aplicados dentro un proceso de búsqueda automática para recuperar hipónimos de una colección de textos. A la fecha existen varias propuestas para descubrir patrones de hiponimia de manera automática (Pasca, 2004; Pantel & Pennacchiotti, 2006; Barbu, 2008). En particular, en esta investigación se utiliza el conjunto de patrones que han sido recuperados a través del método desarrollado por Ortega (2007).
Naturalmente, dada la riqueza y complejidad que conlleva toda lengua humana, los enfoques automáticos basados en patrones para descubrir relaciones léxicas no son completamente confiables. Es por ello, que para mejorar su precisión se evalúa la confianza de los patrones encontrados y/o la confianza de los pares hipónimo-hiperónimo detectados (Pantel & Pennacchiotti, 2006; Ortega, Villaseñor & Montes, 2007; Blohm, Cimiano & Stemle, 2007; Barbu, 2008).
En esta investigación, evaluamos la calidad de los pares extraídos al estimar un valor de confianza de los patrones aplicados para extraerlos. De manera simétrica, también la calidad de los patrones es estimada mediante un valor de confianza de los pares extraídos. Un esquema similar lo presentan Pantel y Pennacchiotti (2006), donde se utiliza una medida probabilística, ‘la información mutua´, para medir el grado de asociación entre pares y patrones. En contraste, en el presente estudio, ‘la medida F´, utilizada tradicionalmente en el área de recuperación de información y propuesta por Van Rijsbergen (1979) es adaptada para calcular un valor de confianza de los patrones, así como de los pares descubiertos. Precisamente, este esquema simétrico de calificación pares/patrones es una de las contribuciones principales de esta investigación. Gracias a la integración de este esquema es posible determinar con mayor precisión los pares de hipónimos/hiperónimos.
1.Relaciones de hiponimia e hiperonimia
Se denomina hiperónimo a aquel término general que puede ser utilizado para referirse a la realidad nombrada por un término más particular o hipónimo. Así, un hiperónimo no posee ningún rasgo semántico, que no comparta su hipónimo, mientras que éste sí posee rasgos semánticos que lo diferencian de aquél. En otras palabras, el significado del concepto más específico (hipónimo) está incluido en el significado del concepto más general (hiperónimo) (Cruse, 1986). Ejemplos de pares hipónimo/hiperónimo son los siguientes:
i. Gorrión [hipónimo]pájaro [hiperónimo]
ii. Pájaro [hipónimo] animal [hiperónimo]
iii. Animal [hipónimo] entidad [hiperónimo]
Donde los rasgos semánticos de ‘animal´ son compartidos por los de ‘pájaro´, pero este posee otros rasgos que lo diferencian del primero. Dicha relación de inclusión, en un plano léxico, permite establecer clasificaciones y jerarquías, de modo que puede hacerse patente cómo se relaciona conceptualmente una palabra con otras.
De acuerdo con Cruse (1986), Wilks et al. (1996), así como Miller (1998), las relaciones de hiponimia e hiperonimia son aquellas que se dan, dentro de un plano léxico-semántico, entre dos o más palabras, de tal suerte que una de ellas se subordina conceptualmente a otra. Esto equivale a decir que el concepto referido por una palabra (hipónimo) es una instancia concreta de un objeto prototípico (hiperónimo), situado jerárquicamente en un nivel superior.
Siguiendo con la explicación hecha por Miller (1998), las relaciones de hiponimia e hiperonimia son básicas dentro de toda interfaz léxico-semántica de una lengua natural, debido a que una de sus funciones más importantes es estructurar sistemas de conceptos dentro de la mente de un humano, organizados conforme a las propiedades o atributos que tales conceptos prediquen de una entidad o un evento. Si bien esta clase de información es reconocible en cualquier palabra, áreas de estudio como la lexicografía, la lexicografía computacional o la extracción de información han caracterizado a los nombres como unidades léxicas prototípicas que proyectan vínculos de hiponimia e hiperonimia.
Respuesta:
tecnologia: celular computadoras tablet televisión radio
ciencia: geologia fisica quimica botanica astronomia
Explicación:
dame corona porfa