I relation utvinning (NLP), vad är skillnaden mellan övervakad, semi-övervakad och utan övervakad relation utvinning?


Svar 1:

I övervakad inlärning finns det en stor datauppsättning som har allt eleven kan behöva. Den har dokument tillsammans med alla förhållanden mellan ord och den text du vill ha. Eleven måste lära sig att utföra denna uppgift på osynliga dokument.

I halvledd lärande har du en stor uppsättning dokument, och för en mindre delmängd av dessa har du all information.

Vid undervisning utan tillsyn har eleven endast dokument. Den kan leta efter intressanta mönster som ligger till grund för uppgifterna. Dessa mönster kan vara meningsfulla, men de kan också vara slumpmässiga artefakter. När tillräckligt med data finns är det lättare att identifiera meningsfulla mönster. Men utan en handledare som tittar på mönstren kommer algoritmen inte att kunna ge den mening. Till exempel kan det konstateras att orden 'president', 'Obama' och 'Barack' ofta samarbetar, eller att en inträffar i situationer där en annan också vanligtvis finns (en indikator på att de kan vara synonymer). I allmänhet kan det inte konstateras att detta beskriver en person.