AI FÖR NATURLIGT SPRÅK
Kursinfo
Kursmaterial
FAQ
Kursmaterial
/
Kapitel
Ordinbäddningar
Ordinbäddningar
Egenskaper hos ordinbäddningar
Vilken av dessa egenskaper kan ses som en fördel hos ordinbäddningar, jämfört med one hot-vektorer?
Distributionell semantik
Samförekomstmatriser
Samförekomstmatriser kan bli väldigt stora. Antag att du hanterar ett språk med en vokabulär på 75 000 ord. Hur många element har den fullständiga samförekomstmatrisen? Antag att alla ord i vokabulären kan användas som både målord (ord som du vill få ut ordinbäddningar för) och kontextord.
Räkna parametrar
Ponera att du istället för samförekomstmatrisen från förra uppgiften sparar en matris med ordinbäddningar. Antalet kolonner i den matrisen motsvarar då inte antalet målord utan den valda längden på inbäddningarna. Om denna längd är 100, hur många element har då den nya matrisen?
Att mäta likhet mellan ord
Cosinuslikhet
Här är två ordvektorer:
$\mathbf{a} = \begin{bmatrix} -2 & 2 \end{bmatrix}$
$\mathbf{b} = \begin{bmatrix} 1 & 0 \end{bmatrix}$
Ange cosinuslikheten mellan dessa vektorer, avrundad till två decimaler.
Denna webbsajt innehåller kursmaterialet för kursen ETE335 AI för naturligt språk.
Materialet är licenserat under en Creative Commons Erkännande 4.0 Internationell licens.
Copyright © 2022, Marco Kuhlmann & Oskar Holmström