支持度
中文名称:支持度
英文名称:support;support degree
支持度,简单的字面理解就是支持的程度,一般以百分比表示。生活中常见的使用场合有投票、竞选、民意调查等,比如某校高一三班进行班委竞选,该班级共有学生50名,在班长一职的竞选中,张三得到40票。那么就可以说在该班班长竞选中,张三的支持度是:40/50*100%=80%。
该名词还常出现在数据挖掘的关联分析中,常跟 置信度(或可信性)一起出现。
如:某超市中有1000个顾客购物,其中200个顾客购买了面包(物品集A),那么面包(物品集A)的支持度为:
P(A)=20%(200/1000)。
关联规则从一个侧面揭示了事务之间的某种联系。
支持度和置信度总是伴随着关联规则存在的,它们是对关联规则的必要的补充。
对某条关联规则而言,如 A -> B (support=30%, confidence= 60%)
其中的support=30%是说,在所有的事务中同时出现A和B的概率。
而,confidence=60%是说,所有事务中,在出现A的情况下出现B的概率,即条件概率。
那么我们要怎样设置支持度和置信度呢?
支持度揭示了A和B同时出现的频率,如果A和B一起出现的频率非常小,那么就说明了A和B之间的联系
并不大;但若一起出现的频率非常频繁,那么A和B总是相关联的知识也许已经成为常识而存在了。这就
涉及到如何正确设置支持度的问题。
当然,对数据库中的隐藏的关联规则的挖掘有一个重要的性质就是知识总是出现在不同的层面上,
因此这也是一个需要着重考虑的问题。
置信度揭示了A出现时,B是否一定会出现,如果出现则其大概有多大的可能出现。如果置信度为100%,
则说明了A出现时,B一定出现。那么,对这种情况而言,假设A和B是市场上的两种商品,就没有理由不进行捆绑销售了。
如果置信度太低,那么就会产生这样的疑问,A和B关系并不大,也许与A关联的并不是B.
当然了,就做题而言,往往给出支持度和置信度的要求。在一个具体的数据挖掘任务中,也是用户自行设置这两个值。
热门专栏
热门词条
应收账款
区域货币
区间估计
金融危机
资本成本
CPI(Consumer Price Index)
汇率
资产
经济
美元
单向定单
租赁期
外汇通
外汇佣金
服务
SME
ISO
认可
增量成本
什一税
CFO
MIT
加工
MG金融集团
销售
股价反弹
抽签偿还
股利收入
技术
空头陷阱
资本
REF
市场
中国股市
中小企业
备付金率
美国
两会
价格
吊空
指数
股灾
葡萄牙币
调至市价
pt
清算
电子汇兑
税粮
下降三角形
外汇
FDI
投资
Writer
银行
阴烛
管理
MACD
企业
width
黄金
冲账
短期同业拆借
Theta
peg
货币
外汇交易法
金融中介理论
艾略特波段理论的含义
消费发展战略
产品
巴塞尔资本协议
计期汇票
贴现现金流
联系汇率制度
拔档
美国贝勒大学
汇差清算率
延期付款汇票
短期国际商业贷款
Exposure
集中竞价
标准普尔(S&P)
金融
不完全竞争市场理论 (金融)
公司
正利差
分期付款汇票
软通货
出口物价指数
指标
选择权买方
资金
百分比回撤
单位
无记名汇票最低报价戴维·凯特标准·普尔 500指数抵押品持平德国工业产值德国消费者物价指数成本协同效益
非农就业人口
股票
交易
道琼斯公用事业平均指数
持平
指示汇票
产品竞争力
财务指标 盈利能力比率
外汇实盘交易方式
德国伊弗研究所景气调查