利用中文分词探索人民日报高频词变迁开题报告

 2023-04-04 11:21:29

1. 研究目的与意义(文献综述包含参考文献)

单词是语言中重要的基本元素。

一个单词可以代表一个信息单元,有着指代名称、功能、动作、性质等作用。

在语言的进化史中,不断有新的单词涌现,也有许多单词随着时代的变迁而边缘化直至消失。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容、问题解决措施及方案

本论文主要由以下四部分组成:1、基于字典、词库匹配的分词方法(字符串匹配、机械分词法)进行分词;2、对于未登录到词库的词,使用了基于汉字成词能力的 hmm 模型和 viterbi 算法。

隐马尔可夫模型(hidden markov model, hmm),隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成观测随机序列的过程。

模型 hmm的典型模型是一个五元组: statusset: 状态值集合 observedset: 观察值集合 transprobmatrix: 转移概率矩阵 emitprobmatrix: 发射概率矩阵 initstatus: 初始状态分布。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。