跳至內容

雅卡爾指數

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

雅卡爾指數(英語:Jaccard index), 閣叫做交並比(Intersection over Union)、雅卡爾相𫝛係數(Jaccard similarity coefficient), 是用於比較樣本集的相𫝛性佮多樣性的統計量。雅卡爾係數能量度有限樣本集的仝款,其定義替兩个集合交集大細佮併集大細之間的比例:


$ J ( A , B )={ { | A \ cap B | } \ over { | A \ cup B | } }={ { | A \ cap B | } \ over { | A | + | B |-| A \ cap B | } } . $

若是 _ A _ 佮 _ B 完全重合 _,則定義 _ J _ ( _ A _ , _ B _ )  =  一。所以有


$ 零 \ leq J ( A , B ) \ leq 一 . $

雅卡爾距離(Jaccard distance)是用佇咧量度平本集中間的無相𫝛度,其定義為一減去雅卡爾係數,即


$ d _ { J } ( A , B )=一-J ( A , B )={ { | A \ cup B |-| A \ cap B | } \ over | A \ cup B | } . $

此外,亦有人將雅卡爾距離定義兩集合對稱差 $ A \ triangle B=( A \ cup B )-( A \ cap B ) $ 的大細佮併集大細之間的比例。

雅卡爾距離是所有限樣本集合間的度量。

參見

  • 簡單匹配係數
  • 漢明距離
  • Dice 係數

參考文獻