统计自然语言处理-刘挺 NLP_4
更新时间:2023-05-19 05:41:01 阅读量: 实用文档 文档下载
- 自然语言处理刘挺pdf推荐度:
- 相关推荐
隐马尔科夫模型和词性标注刘挺 哈工大信息检索研究室 2004年春
大纲 隐马尔科夫模型– 隐马尔科夫模型概述 – 任务1:计算观察序列的概率 – 任务2:计算能够解释观察序列的最大可能 的状态序列 – 任务3:根据观察序列寻找最佳参数模型 词性标注
隐马尔科夫模型概述
马尔科夫链 状态序列: X1, X2, X3, …– 常常是“时序”的 从Xt-1到Xt的转换只依赖于Xt-1X1 X2 X3 X4
转移概率 Transition Probabilities 假设一个状态Xt有N个可能的值– Xt=s1, Xt=s2,….., Xt=sN. 转移概率的数量为:N2– P(Xt=si|Xt-1=sj), 1≤ i, j ≤N 转移概率可以表示为N×N的矩阵或者有 向图
MM Bigram MM(一阶MM)
MM Trigram MM(二阶MM)
有限状态自动机 状态:输入输出字母表中的符号 弧:状态的转移 仍然是VMM (Visible MM)
HMM HMM,从状态产生输出
HMM HMM,不同状态可能产生相同输出
HMM HMM,从弧产生输出
HMM HMM,输出带有概率
HMM HMM,两个状态间有多条弧,具有不 同的概率
隐马尔可夫模型 Hidden Markov Model 估算隐藏于表面事件背后的事件的概率– 观察到一个人每天带雨伞的情况,反过来 推测天气情况
Hidden Markov Model HMM是一个五元组(S, S0,Y, Ps, PY ).– – – – S : {s1…sT }是状态集,S0是初始状态 Y : {y1…yV }是输出字母表 PS(sj|si):转移(transition)概率的分布,也表示为aij PY(yk|si,sj): 发射(emission)概率的分布,也表示为bijk 给定一个HMM和一个输出序列Y={y1,y2,…,yk)– 任务1:计算观察序列的概率 – 任务2:计算能够解释观察序列的最大可能的状态序列 – 任务3:根据观察序列寻找最佳参数模型
任务1:计算观察序列的概率
计算观察序列的概率 前提:HMM模型的参数已经训练完毕 想知道:根据该模型输出某一个观察序 列的概率是多少 应用:基于类的语言模型,将词进行归 类,变计算词与词之间的转移概率为类 与类之间的转移概率,由于类的数量比 词少得多,因此一定程度避免了数据稀 疏问题
Trellis or Lattice(栅格)
发射概率为1的情况 Y=“toe” P(Y)=0.6×0.88×1+0.4×0.1×1=0.568
算法描述 从初始状态开始扩展 在时间点t扩展得到的状态必须能够产生于观 察序列在t时刻相同的输出– 比如在t=1时,观察序列输出‘t’,因此只有状态A 和C得到了扩展 在t+1时刻,只能对在t时刻保留下来的状态节 点进行扩展– 比如在t=2时,只能对t=1时刻的A和C两个状态进 行扩展 每条路径上的概率做累乘,不同路径的概率 做累加 直到观察序列全部考察完毕,算法结束
发射概率不为1的情况 0.236608就是在上述模型下“toe”出现的 概率
正在阅读:
统计自然语言处理-刘挺 NLP_405-19
我的青春在路上(发百度)05-19
国际贸易实务作业(1)09-22
2017-2023年中国船舶修理市场研究与产业竞争格局报告(目录)09-02
在2021年全区未来工厂智能化车间提升推进会议上的讲话08-16
食品安全校长讲话稿3篇05-12
九年级历史上学期第二次月考试题(扫描版) 新人教版04-30
西南大学1906批次(0087)《计算机网络》第二套限时随机答案01-03
2010年编辑记者资格考试笔记整理03-08
湖南省怀化市六年级下学期语文开学考试B卷04-09
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 自然语言
- 统计
- 处理
- 刘挺
- NLP
- 激光在军事上的应用
- 影楼绩效考核系统
- 放松训练的研究现状与展望_王珊珊
- 生物质石墨烯内暖纤维问世 石墨烯产业应用前景可期
- 大学物理-波的能量
- 代金刚,医学博士,中国中医科学院医学实验中心
- 数据结构上机实验报告10.1和10.4
- 安阳工学院大学生创业基金管理办法(暂行)
- 自动化专业英语教程
- 我国农村税费改革面临的新问题及综合改革建议
- EPDM/EVA无卤阻燃绝缘材料的开发与应用
- 仁爱英语七年级上册unit2Topic2 what does she look like
- 地铁项目安全生产奖惩制度
- 室内设计色彩学--之《室内与室内家具怎样配色》
- 2015数学建模学校账号使用手册
- 4.北京市学生儿童城镇居民基本医疗保险参保操作指南——网上注册及采集银行账户流程
- 基于FLUENT的管道内壁表面状态对流体摩擦阻力的影响研究_付宜风
- 超声波的原理及应用实验论文
- 2010年下半年系统集成项目管理工程师上午试题和答案
- 厌氧折流板的工艺设计特征及研究报告应用