基于HMM的中文整句输入法实现

更新时间:2023-04-23 11:37:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

开发起源2003年时我还是一名Unix程序员,MacOSX的Darwin核心吸引了我,于是购买了一台有128MB内存、G3800处理器的iBookG3。作为一个中文用户,

基于H M的中文整句输入法实现 M文,卿锋

开发起源

出发点也很单纯,只是为了让自己能无障碍地输入中文。但随着有越来越多用户开始使用

2 0年时我还是一名U i程序员, cOSX 03 nx Ma 的它,以及自己知识的积累,我发现开发一个输 Dr n awi核心吸引了我,于是购买了一台有 18 入法绝易事。 2 MB

内存、 3 0处理器的iokG。 G 0 8 B o 3作为一个中文一

用户,日常使用Ma Sx cO 时遇到的第一个问题就

个拼音输入法最基本需要支持的功能有:双

是内置中文拼音输入法很难用,与当[Widw  ̄ no s上流行的紫光、音加加等输入法完全没法相拼

拼、词库管理、模糊拼音、热键管理、特殊符号录入、拼音纠错等。除此之外,还要为高级用户准备一

提并论,不能对用户输入实时反馈,没有模糊拼音,没有双拼,极其匮乏的词库… 更糟糕的是还没有任何第三方的输入法可以使用,朋友用过

些特殊功能,比如辅助码、音调选择、自定义字

符、繁体输出等。从现在QM庞杂的设置选项里, I就能看出当初为适应用户需求所做的工作。

个人搜集的以后打趣说, cO Ma Sx有最华丽的界面和最难词库对于拼音输入法来说非常重要,词库已经无法满足用户的需求,虽然Q M可以通 I用的输入法,以至于只能看没法用。当时国内的Ma开发界圈子很小,国产第三方软 c过外挂词库增加词汇量,但不是每个用户都会这么做。通过努力,我争取到了S g u o o的词库授权,

件几乎没有。我在渤麦堂 (当时国内最大的Ma c开发网站 )认识了几位Ma开发爱好者,里 c互相交流学习的过程中渐渐对Ma开发产生了兴趣。 c 虽然工作很忙,但每次打开笔记本,输入法的事法还停留在远古时代。

应用其备受好评的基础词库以后, I QM的输入流畅度得到了显著提高。后来又得到了搜狗细胞词库的支持,这极大增强了Q M的可用性。 I

技情就直接堵在我的眼前,提醒我这个平台的输入输入法领域还有一个比较有“术含量”的技术,就是整句输入。为了让QI[做到整句识 M ̄够别,我特意购买了黑马神拼的整句技术,融合进入QI M后能够让用户体验到不错的整句识别,但由于黑马

的数据库有些年头,在应对新的网络语言时会力不从心,而且数据库也过于庞大,难于下载。但通过黑马的代码,我了解了NL自 P(

心里觉得堵得慌,就在工作空闲期间研究起苹果提供的一个例- a i n uMeh d ̄B sc p t to,正如名字所 I言,的 ̄[ai,真 B sc要实现中文拼音的输入,还需

要很多的改进。而苹果提供的开发文档也糟糕, 大多数情况下都是不断摸索尝试着去理解A I P的含义,网上的资源也极其有限,当时真有孤立无援的感觉。

然语言处理 )领域的~些知识,也为我后面对这Q M发展做了很好的铺垫。 I

这里要特别感谢输入法界的一位前辈,在了解我

进步与发展在做QI M之前,我对输入法的开发一窍不通,

打算进一步完善 Q M的整句以后, I倾囊相授他了解的H MM模型工程实践及算法方面的知识,正

是有他的指导我才能完成这么一个看起来对于

本文来源:https://www.bwwdw.com/article/11tq.html

Top