1. 研究目的与意义(文献综述包含参考文献)
单词是语言中重要的基本元素。
一个单词可以代表一个信息单元,有着指代名称、功能、动作、性质等作用。
在语言的进化史中,不断有新的单词涌现,也有许多单词随着时代的变迁而边缘化直至消失。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
本论文主要由以下四部分组成:1、基于字典、词库匹配的分词方法(字符串匹配、机械分词法)进行分词;2、对于未登录到词库的词,使用了基于汉字成词能力的 hmm 模型和 viterbi 算法。
隐马尔可夫模型(hidden markov model, hmm),隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成观测随机序列的过程。
模型 hmm的典型模型是一个五元组: statusset: 状态值集合 observedset: 观察值集合 transprobmatrix: 转移概率矩阵 emitprobmatrix: 发射概率矩阵 initstatus: 初始状态分布。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。