AI FÖR NATURLIGT SPRÅK
Kursinfo
Kursmaterial
FAQ
Kursmaterial
/
Kapitel
Dependensparsning
Dependensträd
Flertydiga dependensträd
Här är en mening:
Lektorn slog studenten med linjalen
Denna mening kan tolkas på två olika sätt, vilket reflekteras i att det finns två möjliga dependensträd för den. Du ska hitta det träd som har den största totala dependenslängden. Längden på en dependensbåge är antalet steg som man i ordföljden behöver gå till vänster respektive höger för att komma från huvudordet till dependenten. Den totala dependenslängden får du genom att summera alla dependenslängder i trädet.
Ange trädet genom att för varje ord lista dess huvudord, från vänster till höger, separerade med blanksteg. Om ett ord inte har något huvudord skriver du ROT.
Ett tips: I frasen med linjalen är det linjalen som är huvudordet.
Dependensparsning
Dataformat för dependensträd
De datamängder som släpps av Universal Dependencies-projektet använder det så kallade CoNLL-U-formatet. Läs avsnittet Syntactic Annotation i dokumentationen av detta format. Titta sedan på utvecklingsdelen av den svenska trädbanken Talbanken. I den första meningen av denna datamängd, vilka ord är dependenter till huvudverbet?
Skriv in orden i den ordning som de förekommer i meningen, med ett blanksteg däremellan.
Denna webbsajt innehåller kursmaterialet för kursen ETE335 AI för naturligt språk.
Materialet är licenserat under en Creative Commons Erkännande 4.0 Internationell licens.
Copyright © 2022, Marco Kuhlmann & Oskar Holmström