AI FÖR NATURLIGT SPRÅK

Kursinfo

Kursmaterial

FAQ

Kursmaterial

/

Kapitel

Dependensparsning

Dependensträd

Flertydiga dependensträd

Här är en mening:

Lektorn slog studenten med linjalen

Denna mening kan tolkas på två olika sätt, vilket reflekteras i att det finns två möjliga dependensträd för den. Du ska hitta det träd som har den största totala dependenslängden. Längden på en dependensbåge är antalet steg som man i ordföljden behöver gå till vänster respektive höger för att komma från huvudordet till dependenten. Den totala dependenslängden får du genom att summera alla dependenslängder i trädet.

Ange trädet genom att för varje ord lista dess huvudord, från vänster till höger, separerade med blanksteg. Om ett ord inte har något huvudord skriver du ROT.

Ett tips: I frasen med linjalen är det linjalen som är huvudordet.

Dependensparsning

Dataformat för dependensträd

De datamängder som släpps av Universal Dependencies-projektet använder det så kallade CoNLL-U-formatet. Läs avsnittet Syntactic Annotation i dokumentationen av detta format. Titta sedan på utvecklingsdelen av den svenska trädbanken Talbanken. I den första meningen av denna datamängd, vilka ord är dependenter till huvudverbet?

Skriv in orden i den ordning som de förekommer i meningen, med ett blanksteg däremellan.

Denna webbsajt innehåller kursmaterialet för kursen ETE335 AI för naturligt språk.
Materialet är licenserat under en Creative Commons Erkännande 4.0 Internationell licens.
Copyright © 2022, Marco Kuhlmann & Oskar Holmström