国产精品一久久香蕉产线看-国产精品一区在线播放-国产精品自线在线播放-国产毛片久久国产-一级视频在线-一级视频在线观看免费

聚類分析的一些評價手段

時間:2022-07-10 20:15:00 其他 我要投稿
  • 相關推薦

聚類分析的一些評價手段

什么是聚類

聚類簡單的說就是要把一個文檔集合根據文檔的相似性把文檔分成若干類,但是究竟分成多少類,這個要取決于文檔集合里文檔自身的性質。下面這個圖就是一個簡單的例子,我們可以把不同的文檔聚合為3類。另外聚類是典型的無指導學習,所謂無指導學習是指不需要有人干預,無須人為文檔進行標注。

聚類的評價

既然聚類是把一個包含若干文檔的文檔集合分成若干類,像上圖如果聚類算法應該把文檔集合分成3類,而不是2類或者5類,這就設計到一個如何評價聚類結果的問題。下面介紹幾種聚類算法的評價指標,看下圖

如圖認為x代表一類文檔,o代表一類文檔,方框代表一類文檔,完美的聚類顯然是應該把各種不同的圖形放入一類,事實上我們很難找到完美的聚類方法,各種方法在實際中難免有偏差,所以我們才需要對聚類算法進行評價看我們采用的方法是不是好的算法。

評價方法一:purity

purity方法是極為簡單的一種聚類評價方法,只需計算正確聚類的文檔數占總文檔數的比例:

其中Ω = {ω1,ω2, . . . ,ωK}是聚類的集合ωK表示第k個聚類的集合。C = {c1, c2, . . . , cJ}是文檔集合,cJ表示第J個文檔。N表示文檔總數。

如上圖的purity = ( 3+ 4 + 5) / 17 = 0.71

其中第一類正確的有5個,第二個4個,第三個3個,總文檔數17。

purity方法的優勢是方便計算,值在0~1之間,完全錯誤的聚類方法值為0,完全正確的方法值為1。同時,purity方法的缺點也很明顯它無法對退化的聚類方法給出正確的評價,設想如果聚類算法把每篇文檔單獨聚成一類,那么算法認為所有文檔都被正確分類,那么purity值為1!而這顯然不是想要的結果。

評價方法二:RI

實際上這是一種用排列組合原理來對聚類進行評價的手段,公式如下:

其中TP是指被聚在一類的兩個文檔被正確分類了,TN是只不應該被聚在一類的兩個文檔被正確分開了,FP只不應該放在一類的文檔被錯誤的放在了一類,FN只不應該分開的文檔被錯誤的分開了。對上圖

TP+FP = C(2,6) + C(2,6) + C(2,5) = 15 + 15 + 10 = 40 其中C(n,m)是指在m中任選n個的組合數。

TP = C(2,5) + C(2,4) + C(2,3) + C(2,2) = 20

FP = 40 - 20 = 20

相似的方法可以計算出TN = 72 FN = 24

所以RI = ( 20 + 72) / ( 20 + 20 + 72 +24) = 0.68

評價方法三:F值

這是基于上述RI方法衍生出的一個方法

RI方法有個特點就是把準確率和召回率看得同等重要,事實上有時候我們可能需要某一特性更多一點,這時候就適合F值方法


【聚類分析的一些評價手段】相關文章:

網絡營銷的手段和方法03-24

一些開啟寒假的文案12-01

一些太空知識點的總結03-23

高調做事也需要一些技巧03-18

《多一些寬容》教案設計03-30

收集一些無風格的小眾文案01-16

關于“雙減”政策的一些感想10-11

正式一些的拜年祝福語01-20

《水能溶解一些物質》教學設計05-08

評價表自我評價01-22

主站蜘蛛池模板: 麻豆一区二区三区在线观看 | 波多野结衣免费线在线 | 国产亚洲欧美日韩在线观看不卡 | 亚洲大胆美女人体一二三区 | 黄色高清视频在线观看 | 五月激情婷婷网 | 成年人午夜剧场 | 精品日本亚洲一区二区三区 | 久久成人亚洲香蕉草草 | 日本黄色a视频 | 国产福利麻豆精品一区 | 亚洲成人视屏 | 成人污视频在线观看 | 国产日韩欧美另类 | 一级毛片牲交大片 | 亚洲天堂首页 | 波多野结衣视频在线免费观看 | 日本韩国在线播放 | 在线日韩不卡 | 一级性视频 | 男女国产视频 | 日韩黄色一级视频 | 国产白丝在线观看 | 国精品日韩欧美一区二区三区 | 中国一级做a爰片久久毛片 中国一级做a爱片免费 | 精品视频69v精品视频 | 精品国偷自产在线视频99 | 韩国理伦在线 | 国产三级全黄在线观看 | 一级做a爱片性色毛片武则天五则 | 757午夜视频国产精品 | 午夜激情在线观看 | 国产成人精品综合 | 亚洲精品午夜久久aaa级久久久 | 一个人免费看的视频www | 极品美女丝袜被的网站 | 日本一区二区三区中文字幕 | 韩国伦理片在线免费观看 | 亚洲欧美久久婷婷爱综合一区天堂 | 国产精品成人一区二区 | 日韩不卡免费视频 |