AI FÖR NATURLIGT SPRÅK

Kursinfo

Kursmaterial

FAQ

Kursmaterial

/

Kapitel

Ordinbäddningar

Ordinbäddningar

Egenskaper hos ordinbäddningar

Vilken av dessa egenskaper kan ses som en fördel hos ordinbäddningar, jämfört med one hot-vektorer?

Distributionell semantik

Samförekomstmatriser

Samförekomstmatriser kan bli väldigt stora. Antag att du hanterar ett språk med en vokabulär på 75 000 ord. Hur många element har den fullständiga samförekomstmatrisen? Antag att alla ord i vokabulären kan användas som både målord (ord som du vill få ut ordinbäddningar för) och kontextord.

Räkna parametrar

Ponera att du istället för samförekomstmatrisen från förra uppgiften sparar en matris med ordinbäddningar. Antalet kolonner i den matrisen motsvarar då inte antalet målord utan den valda längden på inbäddningarna. Om denna längd är 100, hur många element har då den nya matrisen?

Att mäta likhet mellan ord

Cosinuslikhet

Här är två ordvektorer:

$\mathbf{a} = \begin{bmatrix} -2 & 2 \end{bmatrix}$

$\mathbf{b} = \begin{bmatrix} 1 & 0 \end{bmatrix}$

Ange cosinuslikheten mellan dessa vektorer, avrundad till två decimaler.

Denna webbsajt innehåller kursmaterialet för kursen ETE335 AI för naturligt språk.
Materialet är licenserat under en Creative Commons Erkännande 4.0 Internationell licens.
Copyright © 2022, Marco Kuhlmann & Oskar Holmström