asysbang

标题: 拼音输入法词库研究 [打印本页]

作者: admin    时间: 2019-12-26 15:54
标题: 拼音输入法词库研究
针对google拼音的词库
1.创建词库过程

    lemma num: 10   词库里面单词总数

    词典Trie,里面包含一个SpellingTrie,

    SpellingTrie :定义了每个字母的  声母韵母和首字母属性

    // The max length of a lemma.
    const size_t kMaxLemmaSize = 8;   

   添加“学而时习之 440.811451858 0 xue er shi xi zhi”  默认是不能匹配的,需要修改share/dictbuilder.cpp  if (lemma_size > 4) {i--;continue;}  把4改成7

    typedef unsigned short char16;

2.解析词库过程





欢迎光临 asysbang (http://asysbang.com/) Powered by Discuz! X2.5