<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="zh-Hant-TW">
	<id>https://wiki.taigi.ima.org.tw/w/index.php?action=history&amp;feed=atom&amp;title=Dice%E4%BF%82%E6%95%B8</id>
	<title>Dice係數 - 修訂紀錄</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.taigi.ima.org.tw/w/index.php?action=history&amp;feed=atom&amp;title=Dice%E4%BF%82%E6%95%B8"/>
	<link rel="alternate" type="text/html" href="https://wiki.taigi.ima.org.tw/w/index.php?title=Dice%E4%BF%82%E6%95%B8&amp;action=history"/>
	<updated>2026-06-01T02:02:20Z</updated>
	<subtitle>本 wiki 上此頁面的修訂紀錄</subtitle>
	<generator>MediaWiki 1.43.1</generator>
	<entry>
		<id>https://wiki.taigi.ima.org.tw/w/index.php?title=Dice%E4%BF%82%E6%95%B8&amp;diff=458337&amp;oldid=prev</id>
		<title>TaiwanTonguesApiRobot：​從 JSON 檔案批量匯入</title>
		<link rel="alternate" type="text/html" href="https://wiki.taigi.ima.org.tw/w/index.php?title=Dice%E4%BF%82%E6%95%B8&amp;diff=458337&amp;oldid=prev"/>
		<updated>2025-08-23T03:59:44Z</updated>

		<summary type="html">&lt;p&gt;從 JSON 檔案批量匯入&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新頁面&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;戴斯係數&amp;#039;&amp;#039;&amp;#039;（Dice coefficient）， 嘛叫做索倫森-戴斯係數（Sørensen–Dice coefficient）， 號名號 Thorvald Sørensen 和 Lee Raymond Dice，是一種集合相仝度量函數，通常用於計算兩个樣本的相仝度：&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: $ s={ \ frac { 二 | X \ cap Y | } { | X | + | Y | } } $&lt;br /&gt;
&lt;br /&gt;
伊佇形式的頂懸和 Jaccard 指數無偌大區別，但是有一寡無仝的性質。&lt;br /&gt;
&lt;br /&gt;
和 Jaccard 類似，伊的範圍做零到一。佮 Jaccard 無仝的是，相應的差異函數&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: $ d=一-{ \ frac { 二 | X \ cap Y | } { | X | + | Y | } } $&lt;br /&gt;
&lt;br /&gt;
毋是一个合適的距離度量措施，因為伊無三角形不等性的性質。比如講予定 { a } , { b } , 和 { a , b } , 前兩个集合的距離為一，第三个集合佮其他的任意兩个集合的距離做三分之一。&lt;br /&gt;
&lt;br /&gt;
佮 Jaccard 類似，集合操作會用得用兩个向量 _ A _ 和 _ B _ 的操作來表示 :&lt;br /&gt;
&lt;br /&gt;
$ $&lt;br /&gt;
s _ { v }={ \ frac { 二 | A \ cdot B | } { | A | ^ { 二 } + | B | ^ { 二 } } }&lt;br /&gt;
$ $&lt;br /&gt;
&lt;br /&gt;
上式予出兩个向量的距離輸出，嘛予出閣較一般情形下向量之間的相𫝛度量措施。&lt;br /&gt;
戴斯係數會當計算兩字符串的相𫝛度：Dice（s 一 , s 二）=二 \ * comm ( s 一 , s 二 ) / ( leng ( s 一 ) + leng ( s 二 ) )。&lt;br /&gt;
其中，comm ( s 一 , s 二 ) 是 s 一、s 二中相仝字符的個數 leng ( s 一 )，leng ( s 二 ) 是字符合 s 一、s 二的長度。&lt;br /&gt;
&lt;br /&gt;
佇信息檢索當中，予定關鍵詞集合 _ X _ 和 _ Y _，相𫝛度定義為兩倍共同信息 ( 重疊部份 ) 除以基數的總和   :&lt;br /&gt;
&lt;br /&gt;
當做字符串之間的相𫝛度量的時陣，計算兩字符串之間的係數，_ x _ 和 _ y _，使用 bigrams 公式如下 :&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: $ s={ \ frac { 二 n _ { t } } { n _ { x } + n _ { y } } } $&lt;br /&gt;
&lt;br /&gt;
其中 _ n _ t 兩字符串共有的 bigrams 的數，_ n _ x 是 _ x _ 中 bigrams 的數，_ n _ y 是 _ y _ 中 bigrams 的數。譬如講愛計算下跤兩字符合之間的相𫝛度 :&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: ` night `&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: ` nacht `&lt;br /&gt;
&lt;br /&gt;
咱會當佇各單詞內底提出如下 bigrams 集合矣 :&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: { ` ni ` , ` ig ` , ` gh ` , ` ht ` }&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
: { ` na ` , ` ac ` , ` ch ` , ` ht ` }&lt;br /&gt;
&lt;br /&gt;
逐个集合有四个元素，這个兩个集合干焦一个仝款的元素 : ` ht ` .&lt;br /&gt;
&lt;br /&gt;
代入公式咱會當計算出，_ s _  =  ( 二  ·  一 )   /   ( 四   +   四 )  =  空九二五 .&lt;br /&gt;
&lt;br /&gt;
==仝見==&lt;br /&gt;
&lt;br /&gt;
* 雅卡爾指數（Jaccard index）, 等仝款 : $ D=二 J / ( 一 + J ) $ and $ J=D / ( 二-D ) $&lt;br /&gt;
* Tversky index&lt;br /&gt;
* Levenshtein distance&lt;br /&gt;
* Sørensen similarity index&lt;br /&gt;
&lt;br /&gt;
==參考文獻==&lt;br /&gt;
&lt;br /&gt;
==參考資料==&lt;br /&gt;
&lt;br /&gt;
[[分類: 待校正]]&lt;/div&gt;</summary>
		<author><name>TaiwanTonguesApiRobot</name></author>
	</entry>
</feed>