Análisis

The content on this page was translated automatically.

Análisis sintáctico

El análisis sintáctico es un proceso que consiste en "utilizar una gramática para asignar un análisis sintáctico a una cadena de palabras, un entramado de hipótesis de palabras emitidas por un reconocedor del habla" (Carroll, 2003, p. 233). En MTK, utilizamos dos tipos de gramáticas: de constituyentes y de dependencia .

Gramática de constitución

La idea fundamental de la constituyente es que los grupos de palabras forman una única unidad o frase, denominada constituyente (Jurafsky & Martin, 2000).

La gramática constitutiva describe la estructura sintáctica de las frases en términos de jerarquías frasales.

 

Gramática de la dependencia

 

Las gramáticas de dependencia se centran en las relaciones directas entre las palabras de una frase concreta.

 

 

Análisis sintáctico y lenguajes formales

El enfoque basado en frases identifica frases y categorías estructurales en una frase determinada. Analizando la estructura de la frase a través de la lente de una gramática constitutiva, podríamos extraer la información relevante de los límites de la frase, lo que ayudaría a identificar conceptos.

La gramática de dependencia, por su parte, parece significativa para identificar las relacionesAnálisis entre conceptos y atributos de un concepto concreto. La razón es su capacidad para descubrir relaciones basadas en cabezas (por ejemplo, el verbo como cabeza), categorías funcionales (por ejemplo, sujeto, objeto directo, complemento de una preposición y otros).

SBVR

En el contexto del lenguaje natural, los elementos centrales importantes para la SBVR son el verbo y su relación con el sujeto/actor y el objeto. Es posible identificar el verbo mediante un enfoque constitutivo. Sin embargo, algunos casos, como las construcciones pasivas, pueden plantear problemas. Además, la identificación del sujeto y el objeto correctos suele fallar con la gramática constitutiva, cuando las frases son más largas o el sujeto aparece después del verbo. La gramática dependentista se centra en la identificación del verbo y las dependencias entre las distintas partes de la frase. En el MTK, hemos construido una interfaz que utiliza los resultados producidos por la gramática de dependencia (Stanford Parser) y extrae los verbos, sujetos y objetos que tienen alguna relación  con este verbo (= palabra principal). Las primeras pruebas han demostrado que incluso las construcciones pasivas como
"Los productos han sido comprados por la empresa" han sido procesadas correctamente.