Kedy použiť kosínusovú podobnosť?

Obsah:

Kedy použiť kosínusovú podobnosť?
Kedy použiť kosínusovú podobnosť?
Anonim

Kosínusová podobnosť sa vo všeobecnosti používa ako metrika na meranie vzdialenosti, keď na veľkosti vektorov nezáleží. Stáva sa to napríklad pri práci s textovými údajmi reprezentovanými počtom slov.

Kedy by som mal použiť kosínusovú podobnosť?

Kosínusová podobnosť meria podobnosť medzi dvoma vektormi vnútorného produktového priestoru. Meria sa pomocou kosínusu uhla medzi dvoma vektormi a určuje, či dva vektory smerujú približne rovnakým smerom. Často sa používa na meranie podobnosti dokumentov v analýze textu.

Prečo používať kosínusovú podobnosť namiesto euklidovskej vzdialenosti?

Kosínusová podobnosť je výhodná, pretože aj keď sú dva podobné dokumenty vzdialené od seba o euklidovskú vzdialenosť kvôli veľkosti (napríklad slovo „kriket“sa v jednom dokumente objavilo 50-krát a v inom 10-krát), mohli stále medzi sebou majú menší uhol. Čím menší uhol, tým väčšia podobnosť.

Aký je rozdiel medzi kosínusovou podobnosťou a euklidovskou vzdialenosťou?

V tomto článku sme študovali formálne definície euklidovskej vzdialenosti a kosínusovej podobnosti. Euklidovská vzdialenosť zodpovedá norme L2 rozdielu medzi vektormi. Kosínusová podobnosť je úmerná bodovému súčinu dvoch vektorov a nepriamo úmerná súčinu ich veľkostí.

Aký je rozdiel medzi kosínusovou podobnosťou a kosínusovou vzdialenosťou?

Ľudia zvyčajne používajú kosínusovú podobnosť ako metriku podobnosti medzi vektormi. Teraz môže byť vzdialenosť definovaná ako 1-cos_similarity. Intuícia za tým je, že ak sú 2 vektory dokonale rovnaké, podobnosť je 1 (uhol=0) a teda vzdialenosť je 0 (1-1=0).

Odporúča: