Parsing

The content on this page was translated automatically.

Parsing

Il parsing è un processo di "utilizzo di una grammatica per assegnare un'analisi sintattica a una stringa di parole, un reticolo di ipotesi di parole prodotte da un riconoscitore vocale" (Carroll, 2003, p. 233). In MTK utilizziamo due tipi di grammatica: costitutiva e di dipendenza .

Grammatica costitutiva

L'idea fondamentale della costitutiva è che gruppi di parole formano una singola unità o frase, chiamata costituente (Jurafsky & Martin, 2000).

La grammatica costitutiva descrive la struttura sintattica delle frasi in termini di gerarchie frasali.

 

Grammatica della dipendenza

 

Le grammatiche delle dipendenze si concentrano sulle relazioni dirette tra le parole di una determinata frase.

 

 

Parsing e linguaggi formali

L'approccio basato sulle frasi identifica le frasi e le categorie strutturali in una data frase. Analizzando la struttura della frase attraverso la lente di una grammatica costitutiva, potremmo essere in grado di estrarre le informazioni rilevanti dei confini delle frasi, aiutando l'identificazione dei concetti.

La grammatica delle dipendenze, invece, sembra essere significativa per identificare le relazioniParsing tra i concetti e gli attributi di un particolare concetto. Il motivo è la sua capacità di scoprire relazioni basate sulla testa (ad esempio, il verbo come testa), categorie funzionali (ad esempio, soggetto, oggetto diretto, complemento di una preposizione e altre).

SBVR

Nel contesto del linguaggio naturale, gli elementi fondamentali per l'SBVR sono il verbo e la sua relazione con il soggetto/attore e l'oggetto. È possibile identificare il verbo utilizzando un approccio di tipo costitutivo. Tuttavia, alcuni casi, come le costruzioni passive, potrebbero causare problemi. Inoltre, l'identificazione del soggetto e dell'oggetto corretti spesso fallisce con la grammatica costitutiva, quando le frasi sono più lunghe o il soggetto compare dopo il verbo. La grammatica delle dipendenze si concentra sull'identificazione del verbo e sulle dipendenze tra le diverse parti della frase. Nell'MTK abbiamo costruito un'interfaccia che utilizza i risultati prodotti dalla grammatica delle dipendenze (Stanford Parser) ed estrae i verbi, i soggetti e gli oggetti che sono in qualche relazione  con questo verbo (= parola principale). I primi test hanno dimostrato che anche le costruzioni passive come
"I prodotti sono stati acquistati dall'azienda" sono state elaborate correttamente.