标注偏置问题(Label Bias Problem)和HMM、MEMM、CRF模型比较

news/2024/7/10 6:13:15 标签: 优化

路径1-1-1-1的概率:0.4*0.45*0.5=0.09

路径2-2-2-2的概率:0.018

路径1-2-1-2:0.06

路径1-1-2-2:0.066

由此可得最优路径为 1-1-1-1


而实际上,在上图中,
状态1偏向于转移到状态2,而状态2总倾向于停留在状态2,这就是所谓的标注偏置问题,由于分支数不同,概率的分布不均衡,导致状态的转移存在不公平的情况。

PS:标注偏置问题存在于最大熵马尔可夫模型(MEMM)中,虽然MEMM解决了HMM输出独立性假设的问题,但是只解决了观察值独立的问题,状态之间的假设则是标注偏置问题产生的根源,CRF则解决了标注偏置问题,是HMM模型的进一步优化

 

 

 

 


HMM模型中存在两个假设:一是输出观察值之间严格独立,二是状态的转移过程中当前状态只与前一状态有关(一阶马尔可夫模型)。


MEMM模型克服了观察值之间严格独立产生的问题,但是由于状态之间的假设理论,使得该模型存在标注偏置问题。


CRF模型解决了标注偏置问题,去除了HMM中两个不合理的假设,当然,模型相应得也变复杂了。

 


http://www.niftyadmin.cn/n/1534719.html

相关文章

listview崩溃问题

放很小的图标没关系 每一项加上800x800的图片就在我机子上跑不动了闪退 然后在模拟器上一切正常 把图片全部压缩成100x100就ok了 大概是朱哥说的渲染过度问题? 反正以后别放大图片了OTZ转载于:https://www.cnblogs.com/hishark/p/7896180.html

8、iptables 语法规则

文章目录1.语法构成2.常见的动作类型3.添加新的规则4.查看规则列表5.删除清空规则6.设置默认策略7.通用匹配8.隐含匹配9.显示匹配10.SNAT11.DNAT开启IPV4转发功能12.备份和还原1.语法构成 iptables [-t 表名] 选项 [链名] [条件] [-j 控制类型] 注意事项: 不指定表名…

中国版Office 365 应用程序注册

作者:陈希章 发表于 2017年3月23日中国版Office 365是由世纪互联进行运营的一个云服务,单纯从技术角度来看的话,它基本保持了与国际版的同步。但是由于两个版本本质上是完全独立的,其中最关键的就是账号系统是分开的,所…

特征选择算法之开方检验

前文提到过,除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,开方检验等…

网页自动刷新、前进、后退、关闭

<!DOCTYPE> <head><title>网页自动刷新、前进、后退、关闭</title><meta http-equiv"Content-Type" content"text/html; charsetutf-8" /><meta http-equiv"refresh" content"20" /><!--网页2…

Java并发包之ThreadPoolExecutor

概述 ThreadPoolExecutor作为java.util.concurrent包对外提供基础实现&#xff0c;以内部线程池的形式对外提供管理任务执行&#xff0c;线程调度&#xff0c;线程池管理等等服务。 构造参数 corePoolSize 核心线程数。maximumPoolSize 最大线程数。keepAliveTime最大存活时间…

3.K8S网络之pod中容器到容器之间的通信

文章目录1.引入1.1.创建一个网络名称空间1.2.root网络名称空间1.3.docker网络名称空间4.pod容器到容器之间的通信通信的原理1.引入 在Linux中&#xff0c;网络命名空间提供了一个逻辑的网络堆栈&#xff0c;包含自己的路由&#xff0c;防火墙规则和网络设备。 1.1.创建一个网络…

文本分类算法的效果

基于统计的分类算法是主流&#xff0c;主要包括以下几种分类模型&#xff1a; 相似度模型&#xff08;Rocchio、K-近邻&#xff09;、 概率模型&#xff08;贝叶斯&#xff09;、 线性模型&#xff08;LLSF、SVM&#xff09;、 非线性模型&#xff08;决策树、神经网络&#x…