A B C D E F G H I J K L M N O P Q R S T U V W X Y _
A
- AbstractDependencyParser - com.hankcs.hanlp.dependency 中的 类
-
- AbstractDependencyParser() -
类 com.hankcs.hanlp.dependency.AbstractDependencyParser 的构造方法
-
- add(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- add(SString) -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- add(String) -
类 com.hankcs.hanlp.collection.set.UnEmptyStringSet 中的方法
-
- add(String) -
类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
-
- add(IWord) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 向词典中加入一个词语
- add(String, String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- add(Item) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 插入条目
- add(String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- add(String, V) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 向中加入单词
- add(String) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
- 添加一个词语
- add(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
-
- add(String) -
类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
-
- add(String, String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 往自定义词典中插入一个新词(非覆盖模式)
- add(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 增加新词
- add(String) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
- 加入停用词到停用词词典中
- add(int, char[]...) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- add(int, Collection<char[]>) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- add(int, Vertex) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 添加顶点
- add(int, List<AtomNode>) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 添加顶点,由原子分词顶点添加
- addAll(Collection<? extends String>) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- addAll(List<Item>) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 插入全部条目
- addAll(String) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
-
- addAll(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
-
- addAll(String[]) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- addAll(List<Term>) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- addAll(String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- addAll(List<String>) -
类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
-
- addAll(List<Vertex>) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 全自动添加顶点
- addAllKeyword(Collection<String>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
-
- addAllNotCombine(List<Item>) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 插入新条目,不执行合并
- addChild(BaseNode) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 添加子节点
- addChild(BaseNode) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- addChild(BaseNode) -
类 com.hankcs.hanlp.collection.trie.bintrie.Node 中的方法
-
- addEmit(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 添加一个匹配到的模式串(这个状态对应着这个模式串)
- addEmit(Collection<String>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 添加一些匹配到的模式串
- addEmit(int) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 添加一个匹配到的模式串(这个状态对应着这个模式串)
- addEmit(Collection<Integer>) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 添加一些匹配到的模式串
- addKeyword(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
-
- addLabel(E) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
-
- addLabel(E, Integer) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
-
- addLabel(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
-
- addLabel(String, Integer) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
- 添加一个标签和频次
- addNotCombine(Item) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 插入条目,但是不合并,如果已有则忽略
- addOutgoingTransition(char, boolean) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 新建一个转移目标
Creates an outgoing _transition labeled with a
given char that has a new node as its target.
- addOutgoingTransition(char, MDAGNode) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 建立一条边(起点是自己)
- addPair(IWord, IWord) -
类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
-
- addPair(String, String) -
类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
- 添加一个转移例子,会在内部完成统计
- addPair(String, String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 添加一个共现
- addSentence(String) -
接口 com.hankcs.hanlp.suggest.ISuggester 中的方法
-
- addSentence(String) -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
-
- addSentence(String) -
接口 com.hankcs.hanlp.suggest.scorer.IScorer 中的方法
- 输入一个候选句子
- addSentence(String) -
类 com.hankcs.hanlp.suggest.Suggester 中的方法
-
- addState(Character) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
-
- addState(Character) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- addString(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- Adds a string to the MDAG.
- addStrings(Collection<String>) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- Adds a Collection of Strings to the MDAG.
- addTerm(String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 统计词频
- addToDictionary(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
- 加入到词典中,允许子类自定义过滤等等,这样比较灵活
- addToDictionary(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的方法
-
- addToDictionary(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的方法
-
- addToDictionary(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的方法
-
- addToDictionary(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
-
- addToOverlaps(Intervalable, List<Intervalable>, List<Intervalable>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 添加到重叠区间列表中
- addTria(String, String, String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- AhoCorasickDoubleArrayTrie<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 类
- 基于双数组Trie树的AhoCorasick自动机
- AhoCorasickDoubleArrayTrie() -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 的构造方法
-
- AhoCorasickDoubleArrayTrie.Hit<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 类
- 一个命中结果
- AhoCorasickDoubleArrayTrie.Hit(int, int, V) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 的构造方法
-
- AhoCorasickDoubleArrayTrie.IHit<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 接口
- 命中一个模式串的处理方法
- AhoCorasickDoubleArrayTrie.IHitFull<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 接口
-
- AhoCorasickDoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other 中的 类
- 使用AhoCorasickDoubleArrayTrie实现的最长分词器
需要用户调用setTrie()提供一个AhoCorasickDoubleArrayTrie - AhoCorasickDoubleArrayTrieSegment() -
类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 的构造方法
-
- apply(List<Term>) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
- 对分词结果应用过滤
- ArrayCompare - com.hankcs.hanlp.algoritm 中的 类
- 比较两个数组
- ArrayCompare() -
类 com.hankcs.hanlp.algoritm.ArrayCompare 的构造方法
-
- ArrayDistance - com.hankcs.hanlp.algoritm 中的 类
- 求两个集合中最相近的两个数
- ArrayDistance() -
类 com.hankcs.hanlp.algoritm.ArrayDistance 的构造方法
-
- ArrayTool - com.hankcs.hanlp.collection.trie.bintrie.util 中的 类
-
- ArrayTool() -
类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 的构造方法
-
- AtomNode - com.hankcs.hanlp.seg.NShort.Path 中的 类
- 原子分词节点
- AtomNode(String, int) -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 的构造方法
-
- AtomNode(char, int) -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 的构造方法
-
- atomSegment(char[]) -
类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的静态方法
-
- atomSegment(char[], int, int) -
类 com.hankcs.hanlp.seg.Segment 中的静态方法
- 原子分词
- atomSegmentToTable(char[]) -
类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的静态方法
-
- ATTRIBUTE -
类 com.hankcs.hanlp.dictionary.nr.NRConstant 中的静态变量
- 本词典专注的词的属性
- ATTRIBUTE -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
-
- attribute -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 词的属性,谨慎修改属性内部的数据,因为会影响到字典
如果要修改,应当new一个Attribute
B
- b -
类 com.hankcs.hanlp.collection.sequence.SString 中的变量
- 开始位置,包含
- B -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态变量
- 始##始
- base -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
- 双数组之base
- base -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
-
- BaseChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
-
- BaseChineseDictionary() -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 的构造方法
-
- BaseChineseDictionary.Searcher - com.hankcs.hanlp.dictionary.ts 中的 类
- 最长分词
- BaseChineseDictionary.Searcher(char[], DoubleArrayTrie<String>) -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 的构造方法
-
- BaseChineseDictionary.Searcher(String, DoubleArrayTrie<String>) -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 的构造方法
-
- BaseNode<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
- 节点,统一Trie树根和其他节点的基类
- BaseNode() -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 的构造方法
-
- BaseNode.Status - com.hankcs.hanlp.collection.trie.bintrie 中的 枚举
-
- BaseNode.TrieEntry - com.hankcs.hanlp.collection.trie.bintrie 中的 类
-
- BaseNode.TrieEntry(String, V) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry 的构造方法
-
- BaseScorer<T extends ISentenceKey> - com.hankcs.hanlp.suggest.scorer 中的 类
- 基本打分器
- BaseScorer() -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 的构造方法
-
- BaseSearcher<V> - com.hankcs.hanlp.dictionary 中的 类
- 查询字典者
- BaseSearcher(char[]) -
类 com.hankcs.hanlp.dictionary.BaseSearcher 的构造方法
-
- BaseSearcher(String) -
类 com.hankcs.hanlp.dictionary.BaseSearcher 的构造方法
-
- BasicTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 基础分词器,只做基本NGram分词,不识别命名实体,不使用用户词典
- BasicTokenizer() -
类 com.hankcs.hanlp.tokenizer.BasicTokenizer 的构造方法
-
- begin -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
- 模式串在母文本中的起始位置
- begin -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
- key的起点
- BigramDependencyModel - com.hankcs.hanlp.model.bigram 中的 类
- 2-gram依存模型,根据两个词的词和词性猜测它们最可能的依存关系
- BigramDependencyModel() -
类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 的构造方法
-
- BiGramDictionary - com.hankcs.hanlp.dictionary 中的 类
- 已过时。 现在基于DoubleArrayTrie的BiGramDictionary已经由CoreBiGramTableDictionary替代,可以显著降低内存
- BiGramDictionary() -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 的构造方法
- 已过时。
- BiGramDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 2元语法词典路径
- BIN_EXT -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 二进制文件后缀
- binarySearch(BaseNode[], BaseNode) -
类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 中的静态方法
- 二分查找
- binarySearch(BaseNode[], char) -
类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 中的静态方法
-
- BinTrie<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
- 首字直接分配内存,之后二分动态数组的Trie树,能够平衡时间和空间
- BinTrie() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 的构造方法
-
- BiSegment(char[], int, WordNet, WordNet) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 二元语言模型分词
- BM25 - com.hankcs.hanlp.summary 中的 类
- 搜索相关性评分算法
- BM25(List<List<String>>) -
类 com.hankcs.hanlp.summary.BM25 的构造方法
-
- boost -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的变量
- 权重
- build(TreeMap<String, V>) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 由一个排序好的map创建
- build(Keyset) -
类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 中的方法
- 构建
- build(byte[][], int[]) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- 构建
- build(List<String>, int[]) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
-
- build(TreeMap<String, V>) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- build(List<String>, List<V>) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- build(List<String>, V[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- build(Set<Map.Entry<String, V>>) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 构建DAT
- build(TreeMap<String, V>) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 方便地构造一个双数组trie树
- build(List<String>, int[], int[], int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 唯一的构建方法
- build(TreeMap<String, V>) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- ByteArray - com.hankcs.hanlp.corpus.io 中的 类
- 对字节数组进行封装,提供方便的读取操作
- ByteArray(byte[]) -
类 com.hankcs.hanlp.corpus.io.ByteArray 的构造方法
-
- bytesHighFirstToChar(byte[], int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 字节数组转char,高位在前,适用于读取writeChar的数据
- bytesHighFirstToDouble(byte[], int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 读取double,高位在前
- bytesHighFirstToFloat(byte[], int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 读取float,高位在前
- bytesHighFirstToInt(byte[], int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 字节数组和整型的转换,高位在前,适用于读取writeInt的数据
- bytesHighFirstToLong(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
-
- bytesToChar(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个2位字节数组转换为char字符。
- bytesToDouble(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个8位字节数组转换为双精度浮点数。
- bytesToFloat(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个4位字节数组转换为浮点数。
- bytesToInt(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个4位字节数组转换为4整数。
- bytesToInt(byte[], int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 字节数组和整型的转换
- bytesToLong(byte[]) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个8位字节数组转换为长整数。
- ByteUtil - com.hankcs.hanlp.utility 中的 类
- 对数字和字节进行转换。
- ByteUtil() -
类 com.hankcs.hanlp.utility.ByteUtil 的构造方法
-
C
- c -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
- 节点代表的字符
- c -
类 com.hankcs.hanlp.dictionary.BaseSearcher 中的变量
- 待分词文本的char
- calculateWeight(Vertex, Vertex) -
类 com.hankcs.hanlp.utility.MathTools 中的静态方法
- 从一个词到另一个词的词的花费
- CanGetNext() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 是否仍然有下一个元素可供读取
- CC_NUM -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CharacterBasedGenerativeModel - com.hankcs.hanlp.model.trigram 中的 类
- 基于字符的生成模型(其实就是一个TriGram文法模型,或称2阶隐马模型)
- CharacterBasedGenerativeModel() -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 的构造方法
-
- CharacterBasedGenerativeModelSegment - com.hankcs.hanlp.seg 中的 类
- 基于字构词的生成式模型分词器基类
- CharacterBasedGenerativeModelSegment() -
类 com.hankcs.hanlp.seg.CharacterBasedGenerativeModelSegment 的构造方法
-
- CharacterHelper - com.hankcs.hanlp.utility 中的 类
- 字符集识别辅助工具类
- CharacterHelper() -
类 com.hankcs.hanlp.utility.CharacterHelper 的构造方法
-
- charArray -
类 com.hankcs.hanlp.seg.common.WordNet 中的变量
- 原始句子对应的数组
- CharArray - com.hankcs.hanlp.suggest.scorer.editdistance 中的 类
- 对字符数组的封装,可以代替String
- CharArray(char[]) -
类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 的构造方法
-
- charAt(int) -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- CharTable - com.hankcs.hanlp.dictionary.other 中的 类
- 字符正规化表
- CharTable() -
类 com.hankcs.hanlp.dictionary.other.CharTable 的构造方法
-
- CharTablePath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 字符正规化表(全角转半角,繁体转简体)
- charToBytes(char) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个char字符转换位字节数组(2个字节),b[0]存储高位字符,大端
- charTreeSet -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 字母表
- CharType - com.hankcs.hanlp.dictionary.other 中的 类
- 字符类型
- CharType() -
类 com.hankcs.hanlp.dictionary.other.CharType 的构造方法
-
- charType(char) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
-
- charType(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断字符类型
- CharTypePath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 字符类型对应表
- check -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
- 双数组值check
- check -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
-
- checkForOverlaps(Intervalable, IntervalNode.Direction) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 寻找重叠
- checkForOverlapsToTheLeft(Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 往左边寻找重叠
- checkForOverlapsToTheRight(Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 往右边寻找重叠
- child -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
- 子节点
- cint(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 把表示数字含义的字符串转你成整形
- cleanBlankOrDigit(String) -
类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
- 清除数字和空格
- clear() -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- clear() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- clear() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 清空词图
- clear() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 清除所有元素
- clearStoredHashCode() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Clears this node's stored hash value
- clone() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 克隆一个状态
Creates an MDAGNode possessing the same accept state status and outgoing transitions as this node.
- clone(MDAGNode, char) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 克隆一个状态
原来soleParentNode转移到本状态,现在转移到克隆后的状态
Creates an MDAGNode possessing the same accept state status ant _transition set
(incoming & outgoing) as this node. outgoing transitions as this node.
- close() -
类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
-
- com.hankcs.hanlp - 软件包 com.hankcs.hanlp
-
- com.hankcs.hanlp.algoritm - 软件包 com.hankcs.hanlp.algoritm
-
- com.hankcs.hanlp.algoritm.ahocorasick.interval - 软件包 com.hankcs.hanlp.algoritm.ahocorasick.interval
-
- com.hankcs.hanlp.algoritm.ahocorasick.trie - 软件包 com.hankcs.hanlp.algoritm.ahocorasick.trie
-
- com.hankcs.hanlp.collection.AhoCorasick - 软件包 com.hankcs.hanlp.collection.AhoCorasick
-
- com.hankcs.hanlp.collection.dartsclone - 软件包 com.hankcs.hanlp.collection.dartsclone
-
- com.hankcs.hanlp.collection.dartsclone.details - 软件包 com.hankcs.hanlp.collection.dartsclone.details
-
- com.hankcs.hanlp.collection.MDAG - 软件包 com.hankcs.hanlp.collection.MDAG
-
- com.hankcs.hanlp.collection.sequence - 软件包 com.hankcs.hanlp.collection.sequence
-
- com.hankcs.hanlp.collection.set - 软件包 com.hankcs.hanlp.collection.set
-
- com.hankcs.hanlp.collection.trie - 软件包 com.hankcs.hanlp.collection.trie
-
- com.hankcs.hanlp.collection.trie.bintrie - 软件包 com.hankcs.hanlp.collection.trie.bintrie
-
- com.hankcs.hanlp.collection.trie.bintrie.util - 软件包 com.hankcs.hanlp.collection.trie.bintrie.util
-
- com.hankcs.hanlp.corpus.dependency.CoNll - 软件包 com.hankcs.hanlp.corpus.dependency.CoNll
-
- com.hankcs.hanlp.corpus.dependency.model - 软件包 com.hankcs.hanlp.corpus.dependency.model
-
- com.hankcs.hanlp.corpus.dictionary - 软件包 com.hankcs.hanlp.corpus.dictionary
-
- com.hankcs.hanlp.corpus.dictionary.item - 软件包 com.hankcs.hanlp.corpus.dictionary.item
-
- com.hankcs.hanlp.corpus.document - 软件包 com.hankcs.hanlp.corpus.document
-
- com.hankcs.hanlp.corpus.document.sentence - 软件包 com.hankcs.hanlp.corpus.document.sentence
-
- com.hankcs.hanlp.corpus.document.sentence.word - 软件包 com.hankcs.hanlp.corpus.document.sentence.word
-
- com.hankcs.hanlp.corpus.io - 软件包 com.hankcs.hanlp.corpus.io
-
- com.hankcs.hanlp.corpus.nr - 软件包 com.hankcs.hanlp.corpus.nr
-
- com.hankcs.hanlp.corpus.occurrence - 软件包 com.hankcs.hanlp.corpus.occurrence
-
- com.hankcs.hanlp.corpus.synonym - 软件包 com.hankcs.hanlp.corpus.synonym
-
- com.hankcs.hanlp.corpus.tag - 软件包 com.hankcs.hanlp.corpus.tag
-
- com.hankcs.hanlp.corpus.util - 软件包 com.hankcs.hanlp.corpus.util
-
- com.hankcs.hanlp.dependency - 软件包 com.hankcs.hanlp.dependency
-
- com.hankcs.hanlp.dependency.common - 软件包 com.hankcs.hanlp.dependency.common
-
- com.hankcs.hanlp.dictionary - 软件包 com.hankcs.hanlp.dictionary
-
- com.hankcs.hanlp.dictionary.common - 软件包 com.hankcs.hanlp.dictionary.common
-
- com.hankcs.hanlp.dictionary.nr - 软件包 com.hankcs.hanlp.dictionary.nr
-
- com.hankcs.hanlp.dictionary.ns - 软件包 com.hankcs.hanlp.dictionary.ns
-
- com.hankcs.hanlp.dictionary.nt - 软件包 com.hankcs.hanlp.dictionary.nt
-
- com.hankcs.hanlp.dictionary.other - 软件包 com.hankcs.hanlp.dictionary.other
-
- com.hankcs.hanlp.dictionary.py - 软件包 com.hankcs.hanlp.dictionary.py
-
- com.hankcs.hanlp.dictionary.stopword - 软件包 com.hankcs.hanlp.dictionary.stopword
-
- com.hankcs.hanlp.dictionary.ts - 软件包 com.hankcs.hanlp.dictionary.ts
-
- com.hankcs.hanlp.model - 软件包 com.hankcs.hanlp.model
-
- com.hankcs.hanlp.model.bigram - 软件包 com.hankcs.hanlp.model.bigram
-
- com.hankcs.hanlp.model.crf - 软件包 com.hankcs.hanlp.model.crf
-
- com.hankcs.hanlp.model.maxent - 软件包 com.hankcs.hanlp.model.maxent
-
- com.hankcs.hanlp.model.trigram - 软件包 com.hankcs.hanlp.model.trigram
-
- com.hankcs.hanlp.model.trigram.frequency - 软件包 com.hankcs.hanlp.model.trigram.frequency
-
- com.hankcs.hanlp.phrase - 软件包 com.hankcs.hanlp.phrase
-
- com.hankcs.hanlp.recognition.nr - 软件包 com.hankcs.hanlp.recognition.nr
-
- com.hankcs.hanlp.recognition.ns - 软件包 com.hankcs.hanlp.recognition.ns
-
- com.hankcs.hanlp.recognition.nt - 软件包 com.hankcs.hanlp.recognition.nt
-
- com.hankcs.hanlp.seg - 软件包 com.hankcs.hanlp.seg
-
- com.hankcs.hanlp.seg.common - 软件包 com.hankcs.hanlp.seg.common
-
- com.hankcs.hanlp.seg.common.wrapper - 软件包 com.hankcs.hanlp.seg.common.wrapper
-
- com.hankcs.hanlp.seg.CRF - 软件包 com.hankcs.hanlp.seg.CRF
-
- com.hankcs.hanlp.seg.Dijkstra - 软件包 com.hankcs.hanlp.seg.Dijkstra
-
- com.hankcs.hanlp.seg.Dijkstra.Path - 软件包 com.hankcs.hanlp.seg.Dijkstra.Path
-
- com.hankcs.hanlp.seg.HMM - 软件包 com.hankcs.hanlp.seg.HMM
-
- com.hankcs.hanlp.seg.NShort - 软件包 com.hankcs.hanlp.seg.NShort
-
- com.hankcs.hanlp.seg.NShort.Path - 软件包 com.hankcs.hanlp.seg.NShort.Path
-
- com.hankcs.hanlp.seg.Other - 软件包 com.hankcs.hanlp.seg.Other
-
- com.hankcs.hanlp.seg.Viterbi - 软件包 com.hankcs.hanlp.seg.Viterbi
-
- com.hankcs.hanlp.seg.Viterbi.Path - 软件包 com.hankcs.hanlp.seg.Viterbi.Path
-
- com.hankcs.hanlp.suggest - 软件包 com.hankcs.hanlp.suggest
-
- com.hankcs.hanlp.suggest.scorer - 软件包 com.hankcs.hanlp.suggest.scorer
-
- com.hankcs.hanlp.suggest.scorer.editdistance - 软件包 com.hankcs.hanlp.suggest.scorer.editdistance
-
- com.hankcs.hanlp.suggest.scorer.lexeme - 软件包 com.hankcs.hanlp.suggest.scorer.lexeme
-
- com.hankcs.hanlp.suggest.scorer.pinyin - 软件包 com.hankcs.hanlp.suggest.scorer.pinyin
-
- com.hankcs.hanlp.summary - 软件包 com.hankcs.hanlp.summary
-
- com.hankcs.hanlp.tokenizer - 软件包 com.hankcs.hanlp.tokenizer
-
- com.hankcs.hanlp.utility - 软件包 com.hankcs.hanlp.utility
-
- combine(String, String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 合并两部词典
- combine(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 合并多部词典
- combine(SimpleItem) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
- 合并两个条目,两者的标签map会合并
- combine(SimpleDictionary<V>) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 以我为主词典,合并一个副词典,我有的词条不会被副词典覆盖
- combine(StringDictionary...) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
- 合并词典,第一个为主词典
- combine(String...) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
-
- combine(TFDictionary, int, boolean) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
-
- combine(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的静态方法
-
- combine() -
类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
-
- combineByCustomDictionary(List<Vertex>) -
类 com.hankcs.hanlp.seg.Segment 中的静态方法
- 使用用户词典合并粗分结果
- combineWhenNotInclude(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 合并,只补充除第一个词典外其他词典的新词
- combineWithNormalization(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 对除第一个之外的词典执行标准化,并且合并
- CommonAhoCorasickSegmentUtil - com.hankcs.hanlp.seg.Other 中的 类
- 一个通用的使用AhoCorasickDoubleArrayTrie实现的最长分词器
- CommonAhoCorasickSegmentUtil() -
类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 的构造方法
-
- CommonDictionary<V> - com.hankcs.hanlp.dictionary.common 中的 类
- 通用的词典,对应固定格式的词典,但是标签可以泛型化
- CommonDictionary() -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 的构造方法
-
- CommonDictionary.Searcher - com.hankcs.hanlp.dictionary.common 中的 类
- 前缀搜索,长短都可匹配
- CommonDictionary.Searcher(char[]) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 的构造方法
-
- CommonDictionary.Searcher(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 的构造方法
-
- CommonDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
-
- CommonDictionaryMaker(EasyDictionary) -
类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 的构造方法
-
- commonPrefixSearch(String, int, int) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
- 前缀查询
- commonPrefixSearch(String) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- commonPrefixSearch(byte[], int, int) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- Returns the keys that begins with the given key and its corresponding values.
- commonPrefixSearch(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- commonPrefixSearch(String, int, int, int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 前缀查询
- commonPrefixSearch(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 前缀查询
- commonPrefixSearch(char[], int) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 前缀查询
- commonPrefixSearchWithValue(char[], int) -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
- 前缀查询
- commonPrefixSearchWithValue(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
- 前缀查询
- commonPrefixSearchWithValue(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 前缀查询,包含值
- commonPrefixSearchWithValue(char[], int) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 前缀查询,通过字符数组来表示字符串可以优化运行速度
- commonPrefixSearchWithValue(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 已过时。 最好用优化版的
- commonPrefixSearchWithValue(char[], int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 优化的前缀查询,可以复用字符数组
- CommonStringDictionary - com.hankcs.hanlp.dictionary.common 中的 类
- 最简单的词典,每一行只有一个词,没别的
- CommonStringDictionary() -
类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 的构造方法
-
- CommonSuffixExtractor - com.hankcs.hanlp.corpus.dictionary 中的 类
- 公共后缀提取工具
- CommonSuffixExtractor() -
类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 的构造方法
-
- CommonSynonymDictionary - com.hankcs.hanlp.dictionary.common 中的 类
- 一个没有指定资源位置的通用同义词词典
- CommonSynonymDictionary.SynonymItem - com.hankcs.hanlp.dictionary.common 中的 类
- 词典中的一个条目
- CommonSynonymDictionary.SynonymItem(Synonym, List<Synonym>, CommonSynonymDictionary.SynonymItem.Type) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 的构造方法
-
- CommonSynonymDictionary.SynonymItem(Synonym, List<Synonym>, char) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 的构造方法
-
- CommonSynonymDictionary.SynonymItem.Type - com.hankcs.hanlp.dictionary.common 中的 枚举
-
- CommonSynonymDictionaryEx - com.hankcs.hanlp.dictionary.common 中的 类
- 一个没有指定资源位置的通用同义词词典
- CommonSynonymDictionaryEx.SynonymItem - com.hankcs.hanlp.dictionary.common 中的 类
- 词典中的一个条目
- CommonSynonymDictionaryEx.SynonymItem(Synonym, Map<String, Synonym>) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 的构造方法
-
- compare(Intervalable, Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorByPosition 中的方法
-
- compare(Intervalable, Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorBySize 中的方法
-
- compare(Long[], Long[]) -
类 com.hankcs.hanlp.algoritm.ArrayCompare 中的静态方法
- 比较数组A与B的大小关系
- compareTo(Object) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- compareTo(SString) -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- compareTo(BaseNode) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- compareTo(char) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 重载,与字符的比较
- compareTo(BaseNode<V>.TrieEntry) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry 中的方法
-
- compareTo(TermFrequency) -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
-
- compareTo(State) -
类 com.hankcs.hanlp.dependency.common.State 中的方法
-
- compareTo(State) -
类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的方法
-
- compareTo(QueueElement) -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的方法
-
- compareTo(CharArray) -
类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 中的方法
-
- compareTo(IdVector) -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的方法
-
- compareTo(PinyinKey) -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
-
- compile(String, String) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler 中的静态方法
- 编译,比如将词性为数词的转为##数##
- compile(IWord) -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
- 编译单词
- compile(Word) -
类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
- 将一个单词编译为等效字串
- compile(IWord) -
类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
-
- compiledWord -
类 com.hankcs.hanlp.dependency.common.Node 中的变量
-
- compilePOS(Nature) -
类 com.hankcs.hanlp.dependency.common.POSUtil 中的静态方法
-
- compileWithoutNS(List<IWord>) -
类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
- 在忽略ns的前提下预编译
- compileWithoutNT(List<IWord>) -
类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
- 在忽略ns的前提下预编译
- CompoundWord - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
- 复合词,由两个或以上的word构成
- CompoundWord(List<Word>, String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 的构造方法
-
- compute(Graph) -
类 com.hankcs.hanlp.algoritm.Dijkstra 中的静态方法
-
- compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
-
- compute(long[], long[]) -
类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
-
- compute(int[], int[]) -
类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
-
- compute(char[], char[]) -
类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
- 编辑距离
- compute(char[], char[]) -
类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 中的静态方法
-
- compute(String, String) -
类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 中的静态方法
-
- compute(char[], char[]) -
类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 中的静态方法
-
- compute(String, String) -
类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 中的静态方法
-
- compute(long[], long[]) -
类 com.hankcs.hanlp.algoritm.VectorDistance 中的静态方法
-
- compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.algoritm.VectorDistance 中的静态方法
-
- compute(int[], int[], double[], double[][], double[][]) -
类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
- 求解HMM模型,所有概率请提前取对数
- compute(List<Vertex>, TransformMatrixDictionary<Nature>) -
类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
- 特化版的求解HMM模型
- compute(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
- 处理语料,准备词典
- compute() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 输入数据完毕,执行计算
- compute(List<Term>) -
类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的静态方法
-
- compute(String) -
类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的静态方法
-
- compute(List<Term>) -
类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的静态方法
-
- compute(String) -
类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的静态方法
-
- compute(List<Term>) -
类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的静态方法
-
- compute(String) -
类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的静态方法
-
- computeAverageDistance(Long[], Long[]) -
类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
-
- computeEnum(List<EnumItem<E>>, TransformMatrixDictionary<E>) -
类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
- 标准版的Viterbi算法,查准率高,效率稍低
- computeEnumSimply(List<EnumItem<E>>, TransformMatrixDictionary<E>) -
类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
- 仅仅利用了转移矩阵的“维特比”算法
- computeLeftEntropy(PairFrequency) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 计算左熵
- computeMinimumDistance(TreeSet<Long>, TreeSet<Long>) -
类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
-
- computeMinimumDistance(Long[], Long[]) -
类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
-
- computeMutualInformation(String, String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- computeMutualInformation(PairFrequency) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- computeRightEntropy(PairFrequency) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 计算右熵
- computeScore(LinkedList<double[]>, int) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
- 给一系列特征函数结合tag打分
- computeScore(String) -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
-
- computeScore(String) -
接口 com.hankcs.hanlp.suggest.scorer.IScorer 中的方法
- 计算分值
- computeScoreList(Table, int) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
-
- Config - com.hankcs.hanlp.seg 中的 类
- 分词器配置项
- Config() -
类 com.hankcs.hanlp.seg.Config 的构造方法
-
- config -
类 com.hankcs.hanlp.seg.Segment 中的变量
- 分词器配置
- confirmNature(Nature) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 将属性的词性锁定为nature
- confirmNature(Nature, boolean) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 将属性的词性锁定为nature,此重载会降低性能
- CoNLLFixer - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- 修正一些非10行的依存语料
- CoNLLFixer() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 的构造方法
-
- CoNllLine - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- CoNLL语料中的一行
- CoNllLine(String...) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 的构造方法
-
- CoNLLLoader - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- CoNLL格式依存语料加载
- CoNLLLoader() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 的构造方法
-
- CoNLLSentence - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- CoNLL中的一个句子
- CoNLLSentence(List<CoNllLine>) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 的构造方法
- 构造一个句子
- CoNLLSentence(CoNLLWord[]) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 的构造方法
-
- CoNLLWord - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
-
- CoNLLWord(int, String, String) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
-
- CoNLLWord(int, String, String, String) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
-
- CoNLLWord(CoNllLine) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
-
- CoNLLWord(CoNllLine[], int) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
-
- connect(int, int, double) -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
- 连接两个节点
- contains(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 是否包含
Determines whether a String is present in the MDAG.
- contains(Object) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- contains(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
-
- contains(char) -
类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
-
- contains(String) -
类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
-
- contains(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
- 是否含有键
- contains(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
- 是否包含词语
- contains(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 词典中是否含有词语
- contains(String) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
-
- containsAll(Collection<?>) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- containsKey(Object) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- containsKey(String) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
- 是否包含key
- containsKey(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- containsKey(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- containsKey(String) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- containsKey(String) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
- 是否包含key
- containsKey(String, int) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
- 包含key,且key至少长length
- containsKey(String) -
类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 中的静态方法
- 是否包含key
- containsKey(String, int) -
类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 中的静态方法
- 时报包含key,且key至少长length
- containsLabel(E) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
-
- containsLabel(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
-
- containsValue(Object) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- Context - com.hankcs.hanlp.model.maxent 中的 类
- 将参数与特征关联起来的类,用来储存最大熵的参数,也用来储存模型和经验分布
- Context(int[], double[]) -
类 com.hankcs.hanlp.model.maxent.Context 的构造方法
- 构建一个新的上下文
- convert(List<Term>, boolean) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
- 将分词结果转换为同义词列表
- convert(List<Term>, boolean) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
- 将分词结果转换为同义词列表
- CONVERT -
类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态变量
- 正规化使用的对应表
- convert(char) -
类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
- 将一个字符正规化
- convert(char[]) -
类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
-
- convert(String) -
类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
-
- convert(String) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 文本转拼音
- convert(String, boolean) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 文本转拼音
- convert(String[]) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
-
- convert(String) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
-
- convert(String, boolean) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
-
- convert(String) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
-
- convert(String, int) -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的静态方法
-
- convert(List<Vertex>, boolean) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 将一条路径转为最终结果
- convert(List<Vertex>) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 将一条路径转为最终结果
- convert2Array(String, boolean) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 将拼音文本转化为完整的拼音,支持汉英混合的杂乱文本,注意如果混用拼音和输入法头的话,并不会有多高的准确率,声调也不会准的
- convert2CompatibleList(List<List<Word>>) -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
- 将word列表转为兼容的IWord列表
- convert2Document(File) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- convert2DocumentList(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- convert2Pair(String, boolean) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 将混合文本转为拼音
- convert2SentenceList(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- convert2SimpleSentenceList(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- convert2Tone5(Pinyin) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 将拼音的音调统统转为5调或者最大的音调
- convertFromToneNumber(String) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
-
- convertFromToneNumber(String[]) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
-
- convertId2String(long) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- convertId2StringWithIndex(long) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- convertIntToTwoChar(int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
-
- convertList2Array(List<Pinyin>) -
类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
- 将列表转为数组
- convertPinyinList2TonePinyinList(List<Pinyin>) -
类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
- 转换List pinyinList到List,其中的String为带声调符号形式
- convertSingle(String) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 将单个音节转为拼音
- convertString2Id(String) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- convertString2IdWithIndex(String, long) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- convertString2IdWithIndex(String, int) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- convertToneNumber2ToneMark(String) -
类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
- Convert tone numbers to tone marks using Unicode
Algorithm for determining location of tone mark
A simple algorithm for determining the vowel on which the tone mark
appears is as follows:
First, look for an "a" or an "e".
- convertToPinyin(String) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
- 转为拼音
- convertToPinyin(String, boolean) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
-
- convertToPinyinArray(String) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
- 转为拼音
- convertToPinyinFirstCharString(String, String, boolean) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 转化为拼音(首字母)
- convertToPinyinList(String) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 转化为拼音
- convertToPinyinString(String, String, boolean) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 转化为拼音
- convertToSimplifiedChinese(String) -
类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 中的静态方法
-
- convertToSimplifiedChinese(char[]) -
类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 中的静态方法
-
- convertToSimplifiedChinese(String) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 简转繁
- convertToTraditionalChinese(String) -
类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 中的静态方法
-
- convertToTraditionalChinese(char[]) -
类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 中的静态方法
-
- convertToTraditionalChinese(String) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 繁转简
- convertTwoCharToInt(char, char) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
-
- copy() -
类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 中的方法
-
- copy() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 复制自己
- CoreBiGramMixDictionary - com.hankcs.hanlp.dictionary 中的 类
- 核心词典的二元接续词典,混合采用词ID和词本身储存
- CoreBiGramMixDictionary() -
类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 的构造方法
-
- CoreBiGramTableDictionary - com.hankcs.hanlp.dictionary 中的 类
- 核心词典的二元接续词典,采用整型储存,高性能
- CoreBiGramTableDictionary() -
类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 的构造方法
-
- CoreDictionary - com.hankcs.hanlp.dictionary 中的 类
- 使用DoubleArrayTrie实现的核心词典
- CoreDictionary() -
类 com.hankcs.hanlp.dictionary.CoreDictionary 的构造方法
-
- CoreDictionary.Attribute - com.hankcs.hanlp.dictionary 中的 类
- 核心词典中的词属性
- CoreDictionary.Attribute(int) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
-
- CoreDictionary.Attribute(Nature[], int[]) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
-
- CoreDictionary.Attribute(Nature, int) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
-
- CoreDictionary.Attribute(Nature[], int[], int) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
-
- CoreDictionary.Attribute(Nature) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
- 使用单个词性,默认词频1000构造
- CoreDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 核心词典路径
- CoreDictionaryTransformMatrixDictionary - com.hankcs.hanlp.dictionary 中的 类
- 核心词典词性转移矩阵
- CoreDictionaryTransformMatrixDictionary() -
类 com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary 的构造方法
-
- CoreDictionaryTransformMatrixDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 核心词典词性转移矩阵路径
- CoreStopWordDictionary - com.hankcs.hanlp.dictionary.stopword 中的 类
- 核心停用词词典
- CoreStopWordDictionary() -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 的构造方法
-
- CoreStopWordDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 停用词词典路径
- CoreSynonymDictionary - com.hankcs.hanlp.dictionary 中的 类
- 核心同义词词典
- CoreSynonymDictionary() -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 的构造方法
-
- CoreSynonymDictionaryDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 同义词词典路径
- CoreSynonymDictionaryEx - com.hankcs.hanlp.dictionary 中的 类
- 核心同义词词典
- CoreSynonymDictionaryEx() -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 的构造方法
-
- CorpusLoader - com.hankcs.hanlp.corpus.document 中的 类
-
- CorpusLoader() -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 的构造方法
-
- CorpusLoader.Handler - com.hankcs.hanlp.corpus.document 中的 接口
-
- CorpusLoader.HandlerThread - com.hankcs.hanlp.corpus.document 中的 类
- 多线程任务
- CorpusLoader.HandlerThread(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 的构造方法
-
- CorpusUtil - com.hankcs.hanlp.corpus.util 中的 类
-
- CorpusUtil() -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 的构造方法
-
- cost -
类 com.hankcs.hanlp.dependency.common.Edge 中的变量
-
- cost -
类 com.hankcs.hanlp.dependency.common.State 中的变量
-
- cost -
类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的变量
- 路径花费
- count(String, String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 统计 keyword 在 srcText 中的出现次数
- CPOSTAG -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 当前词语的词性(粗粒度)
- CQueue - com.hankcs.hanlp.seg.NShort.Path 中的 类
- 一个维护了上次访问位置的优先级队列(最小堆)
- CQueue() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 的构造方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的静态方法
-
- create(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的静态方法
-
- create(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的静态方法
-
- create(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.document.Document 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的静态方法
- 通过参数构造一个单词
- create(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.WordFactory 中的静态方法
- 根据参数字符串产生对应的词语
- create(String) -
类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 中的静态方法
-
- create(String, char, String) -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的静态方法
- 构造一个pf
- create(String, char, String, String) -
类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的静态方法
- 构造一个三阶接续,正向
- create(String, String, char, String) -
类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的静态方法
- 构造一个三阶接续,逆向
- create(String) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的静态方法
- 通过类似 Bh06A32= 番茄 西红柿 的字符串构造一系列同义词
- create(String[]) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的静态方法
-
- create(InputStream) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的静态方法
-
- create(InputStream) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的静态方法
-
- create(String) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
- 从文件加载,同时缓存为二进制文件
- create(ByteArray) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
- 从字节流快速加载
- createByteArray(String) -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的静态方法
- 从文件读取一个字节数组
- createUndefined(String) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的静态方法
- 创建一个@类型的词典之外的条目
- CRFDependencyModelPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- CRF依存模型
- CRFDependencyParser - com.hankcs.hanlp.dependency 中的 类
- 基于随机条件场的依存句法分析器
- CRFDependencyParser() -
类 com.hankcs.hanlp.dependency.CRFDependencyParser 的构造方法
-
- CRFModel - com.hankcs.hanlp.model.crf 中的 类
-
- CRFModel() -
类 com.hankcs.hanlp.model.crf.CRFModel 的构造方法
-
- CRFModel(ITrie<FeatureFunction>) -
类 com.hankcs.hanlp.model.crf.CRFModel 的构造方法
- 以指定的trie树结构储存内部特征函数
- crfModel -
类 com.hankcs.hanlp.model.CRFSegmentModel 中的静态变量
-
- CRFSegment - com.hankcs.hanlp.seg.CRF 中的 类
- 基于CRF的分词器
- CRFSegment() -
类 com.hankcs.hanlp.seg.CRF.CRFSegment 的构造方法
-
- CRFSegmentModel - com.hankcs.hanlp.model 中的 类
- 静态CRF分词模型
- CRFSegmentModel(ITrie<FeatureFunction>) -
类 com.hankcs.hanlp.model.CRFSegmentModel 的构造方法
- 以指定的trie树结构储存内部特征函数
- CRFSegmentModelPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- CRF分词模型
- CT_CHINESE -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 中文字符
- CT_CHINESE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_CHINESE -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 中文字符
- CT_DELIMITER -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 分隔符"!
- CT_DELIMITER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_DELIMITER -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 分隔符"!
- CT_INDEX -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 序号
- CT_INDEX -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_INDEX -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 序号
- CT_LETTER -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 字母
- CT_LETTER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_LETTER -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 字母
- CT_NUM -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 数字
- CT_NUM -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_NUM -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 数字
- CT_OTHER -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 其他
- CT_OTHER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_OTHER -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 其他
- CT_SENTENCE_BEGIN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_SENTENCE_END -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_SINGLE -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
- 单字节
- CT_SINGLE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- CT_SINGLE -
类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
- 单字节
- CustomDictionary - com.hankcs.hanlp.dictionary 中的 类
- 用户自定义词典
- CustomDictionary() -
类 com.hankcs.hanlp.dictionary.CustomDictionary 的构造方法
-
- CustomDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 用户自定义词典路径
D
- d -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的变量
-
- DartMap<V> - com.hankcs.hanlp.collection.dartsclone 中的 类
- 双数组trie树map,更省内存,原本希望代替DoubleArrayTrie,后来发现效率不够
- DartMap(List<String>, List<V>) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 的构造方法
-
- dat -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
-
- DEBUG -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 开发模式
- decorateResultForIndexMode(List<Vertex>, WordNet) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 为了索引模式修饰结果
- decrementTargetIncomingTransitionCounts() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 本状态的目标状态们的入度减一
Decrements (by 1) the incoming _transition counts of all of the nodes
that are targets of outgoing transitions from this node.
- delimiter -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
-
- DEPREL -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 当前词语与中心词的依存关系
- depth -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的变量
- 模式串的长度,也是这个状态的深度
- depth -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的变量
- 模式串的长度,也是这个状态的深度
- deQueue() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 从队列中取出前面的一个元素
- determineMedian(List<Intervalable>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 计算中点
- dfs(Trie.IWalker) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
-
- dictionary -
类 com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary 中的静态变量
-
- dictionary -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
- 人名词典
- dictionary -
类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
- 地名词典
- dictionary -
类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
- 机构名词典
- DictionaryBasedSegment - com.hankcs.hanlp.seg 中的 类
- 基于词典的机械分词器基类
- DictionaryBasedSegment() -
类 com.hankcs.hanlp.seg.DictionaryBasedSegment 的构造方法
-
- DictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
- 一个通用的词典制作工具,词条格式:词 标签 频次
- DictionaryMaker() -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 的构造方法
-
- DictionaryMaker.Filter - com.hankcs.hanlp.corpus.dictionary 中的 接口
-
- DictionaryUtil - com.hankcs.hanlp.corpus.util 中的 类
-
- DictionaryUtil() -
类 com.hankcs.hanlp.corpus.util.DictionaryUtil 的构造方法
-
- Dijkstra - com.hankcs.hanlp.algoritm 中的 类
- 最短路径
- Dijkstra() -
类 com.hankcs.hanlp.algoritm.Dijkstra 的构造方法
-
- DijkstraSegment - com.hankcs.hanlp.seg.Dijkstra 中的 类
- 最短路径分词
- DijkstraSegment() -
类 com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment 的构造方法
-
- distance(Synonym) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
- 语义距离
- distance(String, String) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
- 语义距离
- distance(CommonSynonymDictionary.SynonymItem) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的方法
- 语义距离
- distance(String, String) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
- 语义距离
- distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
- 语义距离
- distance(String, String) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
- 判断两个单词之间的语义距离
- distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的方法
-
- distance(long[], long[]) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的方法
-
- distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
- 语义距离
- distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的方法
-
- distance(long[], long[]) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的方法
-
- Document - com.hankcs.hanlp.corpus.document 中的 类
-
- Document(List<Sentence>) -
类 com.hankcs.hanlp.corpus.document.Document 的构造方法
-
- DoubleArray - com.hankcs.hanlp.collection.dartsclone 中的 类
- 双数组DAWG
- DoubleArray() -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 的构造方法
-
- DoubleArrayBuilder - com.hankcs.hanlp.collection.dartsclone.details 中的 类
- 双数组构建者
- DoubleArrayBuilder() -
类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 的构造方法
-
- DoubleArrayTrie<V> - com.hankcs.hanlp.collection.trie 中的 类
- 双数组Trie树
- DoubleArrayTrie() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 的构造方法
-
- DoubleArrayTrie.Searcher - com.hankcs.hanlp.collection.trie 中的 类
- 一个搜索工具(注意,当调用next()返回false后不应该继续调用next(),除非reset状态)
- DoubleArrayTrie.Searcher(int, char[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 的构造方法
- 构造一个双数组搜索工具
- DoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other 中的 类
- 使用DoubleArrayTrie实现的最长分词器
- DoubleArrayTrieSegment() -
类 com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment 的构造方法
-
- doubleToBytes(double) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个双精度浮点数转换位字节数组(8个字节),b[0]存储高位字符,大端
- dSmoothingPara -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 平滑参数
- dTemp -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- Smoothing 平滑因子
- dumpEnum(String) -
类 com.hankcs.hanlp.dictionary.py.SYTDictionary 中的静态方法
- 导出声母表等等
E
- e -
类 com.hankcs.hanlp.collection.sequence.SString 中的变量
- 结束位置,不包含
- e(CoNLLSentence, CoNLLSentence) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
-
- E -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态变量
- 末##末
- EasyDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
- 一个通用的、满足特定格式的双数组词典
- EasyDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 的构造方法
-
- EasyDictionary.Attribute - com.hankcs.hanlp.corpus.dictionary 中的 类
- 通用词典中的词属性
- EasyDictionary.Attribute(int) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
-
- EasyDictionary.Attribute(Nature[], int[]) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
-
- EasyDictionary.Attribute(Nature, int) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
-
- EasyDictionary.Attribute(Nature) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
- 使用单个词性,默认词频1000构造
- EasyDictionary.Searcher - com.hankcs.hanlp.corpus.dictionary 中的 类
-
- EasyDictionary.Searcher(char[]) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 的构造方法
-
- EasyDictionary.Searcher(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 的构造方法
-
- ed(String, String) -
类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
- 编辑距离
- Edge - com.hankcs.hanlp.dependency.common 中的 类
- 一条边
- Edge(int, int, String, float) -
类 com.hankcs.hanlp.dependency.common.Edge 的构造方法
-
- edge -
类 com.hankcs.hanlp.dependency.common.State 中的变量
-
- Edge - com.hankcs.hanlp.seg.common 中的 类
- 基础边,不允许构造
- Edge(double, String) -
类 com.hankcs.hanlp.seg.common.Edge 的构造方法
-
- EdgeFrom - com.hankcs.hanlp.seg.common 中的 类
- 记录了起点的边
- EdgeFrom(int, double, String) -
类 com.hankcs.hanlp.seg.common.EdgeFrom 的构造方法
-
- edgesTo -
类 com.hankcs.hanlp.seg.common.Graph 中的变量
- 边,到达下标i
- EditDistance - com.hankcs.hanlp.algoritm 中的 类
- 基于语义距离的编辑距离实现
- EditDistance() -
类 com.hankcs.hanlp.algoritm.EditDistance 的构造方法
-
- EditDistanceScorer - com.hankcs.hanlp.suggest.scorer.editdistance 中的 类
- 编辑距离打分器
- EditDistanceScorer() -
类 com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer 的构造方法
-
- Emit - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
- 一个模式串匹配结果
- Emit(int, int, String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 的构造方法
- 构造一个模式串匹配结果
- emit() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 获取这个节点代表的模式串(们)
- emit() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 获取这个节点代表的模式串(们)
- enableAllNamedEntityRecognize(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
-
- enableAllNamedEntityRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用所有的命名实体识别
- enableCustomDictionary(boolean) -
类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
-
- enableCustomDictionary(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用用户词典
- enableDebug() -
类 com.hankcs.hanlp.HanLP.Config 中的静态方法
- 开启调试模式(会降低性能)
- enableDebug(boolean) -
类 com.hankcs.hanlp.HanLP.Config 中的静态方法
- 开启调试模式(会降低性能)
- enableIndexMode(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 设为索引模式
- enableJapaneseNameRecognize(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 是否启用日本人名识别
- enableJapaneseNameRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用日本人名识别
- enableMultithreading(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启多线程
- enableMultithreading(int) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启多线程
- enableNameRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启人名识别
- enableNumberQuantifierRecognize(boolean) -
类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的方法
-
- enableNumberQuantifierRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用数词和数量词识别
即[二, 十, 一] => [二十一],[十, 九, 元] => [十九元]
- enableOffset(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 是否启用偏移量计算(开启后Term.offset才会被计算)
- enableOffset(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用偏移量计算(开启后Term.offset才会被计算)
- enableOrganizationRecognize(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 开启机构名识别
- enableOrganizationRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启机构名识别
- enablePartOfSpeechTagging(boolean) -
类 com.hankcs.hanlp.seg.DictionaryBasedSegment 中的方法
- 开启数词和英文识别(与标准意义上的词性标注不同,只是借用这个配置方法,不是真的开启了词性标注。
- enablePartOfSpeechTagging(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 开启词性标注
- enablePartOfSpeechTagging(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启词性标注
- enablePlaceRecognize(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 开启地名识别
- enablePlaceRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 开启地名识别
- enableTranslatedNameRecognize(boolean) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
- 是否启用音译人名识别
- enableTranslatedNameRecognize(boolean) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 是否启用音译人名识别
- end -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
- 模式串在母文本中的终止位置
- endsWith(String) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
- 词语是否以该词典中的某个单词结尾
- enQueue(QueueElement) -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 将QueueElement根据eWeight由小到大的顺序插入队列
- entry -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
- 条目的key
- entrySet() -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- entrySet() -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- entrySet() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 获取键值对集合
- entrySet() -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 浏览所有词条
- entrySet() -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 获取键值对集合
- entrySet() -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
- 键值对
- EnumItem<E extends Enum<E>> - com.hankcs.hanlp.corpus.dictionary.item 中的 类
- 对标签-频次的封装
- EnumItem() -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
-
- EnumItem(E, Integer) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
- 创建只有一个标签的条目
- EnumItem(E...) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
- 创建一个条目,其标签频次都是1,各标签由参数指定
- equals(Object) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- equals(Object) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 两个状态是否等价,只有状态转移函数完全一致才算相等
Evaluates the equality of this node with another object.
- equals(Object) -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- equivalenceClassMDAGNodeHashMap -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 等价类集合,相当于论文中的register
- eval(String[]) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
- 预测分布
- eval(String[], double[]) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
- 预测分布
- eval(int[], double[], EvalParameters) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
- 预测
- EvalParameters - com.hankcs.hanlp.model.maxent 中的 类
- 封装了模型用来计算概率的一些参数
- EvalParameters(Context[], double, double, int) -
类 com.hankcs.hanlp.model.maxent.EvalParameters 的构造方法
- 创建一个参数,可被用于预测
- EvalParameters(Context[], int) -
类 com.hankcs.hanlp.model.maxent.EvalParameters 的构造方法
-
- Evaluator - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- 测试工具
- Evaluator() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 的构造方法
-
- exactMatchSearch(String) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 精确匹配
- exactMatchSearch(String) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- Returns the corresponding value if the key is found.
- exactMatchSearch(byte[]) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- Returns the corresponding value if the key is found.
- exactMatchSearch(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 精确匹配
- exactMatchSearch(String, int, int, int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- exactMatchSearch(char[], int, int, int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 精确查询
- exceptionToString(Exception) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 将异常转为字符串
- exists(String) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- extract(String, int) -
类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 中的静态方法
- 一句话提取
- extractKeyword(String, int) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 提取关键词
- extractPhrase(String, int) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 提取短语
- extractPhrase(String, int) -
接口 com.hankcs.hanlp.phrase.IPhraseExtractor 中的方法
- 提取短语
- extractPhrase(String, int) -
类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 中的方法
-
- extractSuffix(int, int, boolean) -
类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
- 提取公共后缀
- extractSuffixByWords(int, int, boolean) -
类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
- 此方法认为后缀一定是整个的词语,所以length是以词语为单位的
- extractSuffixExtended(int, int) -
类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
-
- extractSummary(String, int) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 自动摘要
F
- failure() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 获取failure状态
- failure() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 获取failure状态
- FamilyName - com.hankcs.hanlp.corpus.nr 中的 类
-
- FamilyName() -
类 com.hankcs.hanlp.corpus.nr.FamilyName 的构造方法
-
- FeatureFunction - com.hankcs.hanlp.model.crf 中的 类
- 特征函数,其实是tag.size个特征函数的集合
- FeatureFunction(char[], int) -
类 com.hankcs.hanlp.model.crf.FeatureFunction 的构造方法
-
- FeatureFunction() -
类 com.hankcs.hanlp.model.crf.FeatureFunction 的构造方法
-
- FeatureTemplate - com.hankcs.hanlp.model.crf 中的 类
- 特征模板
- FeatureTemplate() -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 的构造方法
-
- fileList -
类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 中的变量
- 这个线程负责处理这些事情
- FILTER -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态变量
- 核心停用词典的核心过滤器
- Filter - com.hankcs.hanlp.dictionary.stopword 中的 接口
- 停用词词典过滤器
- findOverlappingRanges(IntervalNode, Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的静态方法
- 是对IntervalNode.findOverlaps(Intervalable)的一个包装,防止NPE
- findOverlaps(Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
- 寻找与interval有重叠的区间
- findOverlaps(Intervalable) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 中的方法
- 寻找重叠区间
- first -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的变量
-
- first -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
-
- fix(String) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 中的静态方法
-
- fixResultByRule(List<Vertex>) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 通过规则修正一些结果
- floatToBytes(float) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个浮点数转换为字节数组(4个字节),b[0]存储高位字符,大端
- FolderWalker - com.hankcs.hanlp.corpus.io 中的 类
- 遍历目录工具类
- FolderWalker() -
类 com.hankcs.hanlp.corpus.io.FolderWalker 的构造方法
-
- FragmentToken - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
-
- FragmentToken(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 的构造方法
-
- freq(String) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- freq(char[]...) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- freq(char...) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- frequency -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
- 词性对应的词频
- frequency -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
- 词性对应的词频
- from -
类 com.hankcs.hanlp.dependency.common.Edge 中的变量
-
- from -
类 com.hankcs.hanlp.seg.common.EdgeFrom 中的变量
-
- from -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 到该节点的最短路径的前驱节点
- from -
类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的变量
- 节点前驱
- from -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
- 边的起点
G
- GenerateBiGraph(WordNet) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 生成二元词图
- generateKey(String) -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
- 生成能够代表这个句子的键
- generateKey(String) -
类 com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer 中的方法
-
- generateKey(String) -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer 中的方法
-
- generateKey(String) -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer 中的方法
-
- generateParameter(Table, int) -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
-
- generateSingleWordContext(CoNLLWord[], int, String) -
类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
-
- generateUniContext(CoNLLWord[], int, int) -
类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
-
- GenerateWord(List<Vertex>, WordNet) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 对粗分结果执行一些规则上的合并拆分等等,同时合成新词网
- GenerateWordNet(WordNet) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的方法
- 生成一元词网
- get(String) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 获取值
- get(int) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
- get(Object) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- get(String) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- get(Object) -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- get(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- get(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- get(char[]) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- get(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 精确查询
- get(char[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- get(int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
- get(char[]) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- get(String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- get(IWord) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- get(String) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 查询一个单词
- get(String) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
- 查找是否有该后缀
- get(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
- 查询一个单词
- get(String) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
-
- get(String) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
-
- get(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
- 获取条目
- get(int) -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
- 获取条目
- get(String) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
-
- get(String) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
-
- get(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 查单词
- get(String) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
-
- get(char) -
类 com.hankcs.hanlp.dictionary.other.CharType 中的静态方法
- 获取字符的类型
- get(String) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
-
- get(String) -
类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 中的静态方法
-
- get(String, String, String, String) -
类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 中的静态方法
- 获取一个词和另一个词最可能的依存关系
- get(String) -
类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
-
- get(String, String) -
类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
-
- get(int, int) -
类 com.hankcs.hanlp.model.crf.Table 中的方法
- 获取表中某一个元素
- get(char[]...) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- get(char...) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- get(int) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 获取某一行的所有节点
- get(int, int) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 获取某一行长度为length的节点
- getAllStrings() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 取出所有key
Retrieves all the valid Strings that have been inserted in to the MDAG.
- getAttribute() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 获取词的属性
- getBase() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 获取base数组引用,不要修改base
- getBestPath() -
类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
- 获取唯一一条最短路径,当然最短路径可能不只一条
- getBiFrequency(String, String) -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
- 已过时。 获取共现频次
- getBiFrequency(String) -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
- 已过时。 获取共现频次
- getBiFrequency(String, String) -
类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
- 获取共现频次
- getBiFrequency(int, int) -
类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
- 获取共现频次
- getBytes() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 获取全部字节
- getBytes(InputStream) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- getChar() -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- getChar() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- getCharCount(String, String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 得到字符集的字符在字符串中出现的次数
- getCheck() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 获取check数组引用,不要修改check
- getChild(char) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 获取子节点
- getChild(char) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- getChild(char) -
类 com.hankcs.hanlp.collection.trie.bintrie.Node 中的方法
-
- getComplexSentenceList() -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
- 获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
- getConstantInverse() -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- getCorrectionConstant() -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- getCorrectionParam() -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- getDA() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
-
- getDepth() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 获取节点深度
- getDepth() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 获取节点深度
- getEdge(Node, Node) -
类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
- 打分
- getEdgeArray() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
- 获取边的列表,edge[i][j]表示id为i的词语与j存在一条依存关系为该值的边,否则为null
- getEdgeListTo(int) -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
- 获取到达顶点to的边列表
- getEdgesTo() -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
-
- getEmit() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 中的方法
-
- getEmit() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 中的方法
-
- getEmit() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
-
- getEnd() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- getEnd() -
接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
- 终点
- getEntrySet() -
类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
-
- getFirst() -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
-
- getFirst(int) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 获取某一行的第一个节点
- GetFirst() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 读取第一个元素,但不执行DeQueue操作
- getFirstChar() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取首字母
- getFirstCharArray() -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
-
- getFragment() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
-
- getFrequency(E) -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
-
- getFrequency(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
-
- getFrequency(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
- 获取频次
- getFrequency() -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
-
- getFrequency(String, String) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
- 获取转移频次
- getFrequency(E, E) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
- 获取转移频次
- getHead() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取输入法头
- getHeadString() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取输入法头
- getId() -
接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
- 获取ID
- getId() -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
-
- getIdString() -
接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
- 获取字符类型的ID
- getIdString() -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
-
- getIncomingTransitionCount() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Retrieves this node's incoming _transition count
- getIndex() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- getInputStream(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 智能获取InputStream,如果是资源文件则返回相应的InputStream
- getKey() -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
-
- getKeyword() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 中的方法
- 获取对应的模式串
- getKeyword(String) -
类 com.hankcs.hanlp.summary.TextRankKeyword 中的方法
-
- getKeywordList(String, int) -
类 com.hankcs.hanlp.summary.TextRankKeyword 中的静态方法
- 提取关键词
- getLA() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
-
- getLabel() -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
-
- getLabel() -
接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
-
- getLabel() -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
-
- getLargestValueId() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 获取最大的值
- getLength() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
-
- getLetter() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Retrieves the character representing the _transition laben leading up to this node.
- getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
- 获取语义标签
- getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
- 获取语义标签
- getLongestSuffixLength(String) -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
- 获取最长的后缀
- getMaxSynonymItemIdDistance() -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
- 获取最大id
- getMostLikelyLabel() -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
-
- getNature() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 获取该节点的词性,如果词性还未确定,则返回null
- getNature() -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的方法
- 原子的词性
- getNatureFrequency(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
- 已过时。 推荐使用Nature参数!
- getNatureFrequency(Nature) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
- 获取词性的词频
- getNatureFrequency(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
- 已过时。 推荐使用Nature参数!
- getNatureFrequency(Nature) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
- 获取词性的词频
- GetNext() -
类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
- 读取上次读取后的下一个元素,不执行DeQueue操作
- getNonzeroSize() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getNPaths(int) -
类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
- 从短到长获取至多 n 条路径
- getNPaths() -
类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
- 获取前10条最短路径
- getNumOutcomes() -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- getOffset() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
-
- getOffset() -
类 com.hankcs.hanlp.dictionary.BaseSearcher 中的方法
- 获取当前偏移
- getOffset() -
类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
- 获取当前偏移,如果想要知道next分出的词string的起始偏移,那么用 getOffset() - string.length 就行了。
- getOutcomes() -
类 com.hankcs.hanlp.model.maxent.Context 中的方法
- 获取输出
- getOutgoingTransitionCount() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Retrieves this node's outgoing _transition count.
- getOutgoingTransitions() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Retrieves this node's outgoing transitions.
- getOutgoingTransitionSetSize() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Retrieves the size of this node's outgoing _transition set.
- getPairFrequency(String, String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- getParameters() -
类 com.hankcs.hanlp.model.maxent.Context 中的方法
- 获取参数
- getParams() -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- getPaths(int) -
类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
- 获取前index+1短的路径
- getPhraseByLe() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- getPhraseByMi() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- getPhraseByRe() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- getPhraseByScore() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- getPinyin(int) -
类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 中的静态方法
-
- getPinyinWithoutTone() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取纯字母的拼音
- getPinyinWithToneMark() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取带音调的拼音
- getRealWord() -
接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
- 获取原本的词语
- getRealWord() -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
-
- getRealWord() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 获取真实词
- getSearcher(String, int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getSearcher(char[], int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getSearcher(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
-
- getSearcher(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
-
- getSearcher(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
-
- getSearcher(char[]) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 获取一个BinTrie的查询工具
- getSearcher(char[]) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
-
- getSearcher(char[], DoubleArrayTrie<Pinyin[]>) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
-
- getSearcher(char[], DoubleArrayTrie<String>) -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
-
- getSecond() -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
-
- getShengmu() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取声母
- getSimpleMDAGArray() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 获取简化后的状态Array
Returns the array of SimpleMDAGNodes collectively containing the
data of this MDAG, or null if it hasn't been simplified yet.
- getSimpleSentenceList() -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
- 获取简单的句子列表,其中复合词会被拆分为简单词
- getSimpleSentenceList(boolean) -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
- 获取简单的句子列表
- getSimpleSentenceList(Set<String>) -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
- 获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
- getSimpleWordList() -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
-
- getSize() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getStart() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- getStart() -
接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
- 起点
- getStates() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
-
- getStates() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- getStatus() -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 获取节点的成词状态
- getStringsEndingWith(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 后缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
- getStringsStartingWith(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 前缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
- getStringsWithSubstring(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 返回包含字串的key
Retrieves all the Strings in the MDAG that contain a given String.
- getSuccess() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 获取goto表
- getsum() -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- getTagId(String) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
- 获取某个tag的ID
- getTerm() -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
-
- getTermFrequency(String) -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
- 获取词频
- getTermFrequency(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
- 获取词频
- getTone() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取声调
- getTopSentence(int) -
类 com.hankcs.hanlp.summary.TextRankSentence 中的方法
- 获取前几个关键句子
- getTopSentenceList(String, int) -
类 com.hankcs.hanlp.summary.TextRankSentence 中的静态方法
- 一句话调用接口
- getTotalFrequency() -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
- 获取全部频次
- getTotalFrequency(E) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
- 获取e的总频次
- getTotalFrequency() -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
- 获取所有标签的总频次
- getTotalSize() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getTransitionPathNodes(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 获取一个字符串路径上经过的节点
Retrieves the nodes in the _transition path starting
from this node corresponding to a given String .
- getTransitions() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
-
- getTransitions() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- getTransitionSetBeginIndex() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Retrieves the index in a simplified mdag data array that the SimpleMDAGNode
representation of this node's outgoing _transition set begins at.
- getTransitionSetBeginIndex() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Retrieves the index in this node's containing array that its _transition set begins at.
- getTrie() -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 已过时。 谨慎操作,有可能废弃此接口
- getTrie() -
类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
-
- getUA() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
-
- getUnitSize() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getUnsigned(byte) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 获取字节对应的无符号整型数
- getValue() -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
-
- getValue() -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 获取节点对应的值
- getValue() -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
-
- getValue() -
接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
-
- getValue() -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
-
- getValueArray(V[]) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- getValueArray(V[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- getValueArray(V[]) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- getValueAt(int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 获取index对应的值
- getVertexes() -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
-
- getVertexes() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 获取内部顶点表格,谨慎操作!
- getWordArrayWithRoot() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
- 获取包含根节点在内的单词数组
- getWordID(String) -
类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 中的静态方法
- 获取词语的ID
- getWordID(String) -
类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
- 获取词语的ID
- getWordID(String) -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
- 获取词语的ID
- GetWordInfo(String) -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
-
- getWordList() -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
- 获取单词序列
- getYunmu() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
- 获取韵母
- Graph - com.hankcs.hanlp.seg.common 中的 类
-
- Graph(Vertex[]) -
类 com.hankcs.hanlp.seg.common.Graph 的构造方法
- 将一个词网转为词图
- Graph - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
-
- Graph(List<Vertex>[]) -
类 com.hankcs.hanlp.seg.Viterbi.Path.Graph 的构造方法
-
- guessNature() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
- 猜测最可能的词性,也就是这个节点的词性中出现频率最大的那一个词性
H
- handle(Document) -
接口 com.hankcs.hanlp.corpus.document.CorpusLoader.Handler 中的方法
-
- HanLP - com.hankcs.hanlp 中的 类
- HanLP: Han Language Processing
汉语言处理包
常用接口工具类 - HanLP.Config - com.hankcs.hanlp 中的 类
- 库的全局配置,既可以用代码修改,也可以通过hanlp.properties配置(按照 变量名=值 的形式)
- HanLP.Config() -
类 com.hankcs.hanlp.HanLP.Config 的构造方法
-
- hasChild(char) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 是否含有子节点
- hashCode() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- hashCode() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Hashes this node using its accept state status and set of outgoing _transition paths.
- hasMore() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
-
- hasNature(Nature) -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
- 是否有某个词性
- hasNature(Nature) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
-
- hasNature(List<Term>, Nature) -
类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
- 句子中是否含有词性
- hasNext() -
类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
-
- hasOutgoingTransition(char) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Determines whether this node has an outgoing _transition with a given label.
- hasTransitions() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Determines whether this node has any outgoing transitions.
- haveSameTransitions(MDAGNode, MDAGNode) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的静态方法
- 是否含有相同的转移函数
- HEAD -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 当前词语的中心词
- Head - com.hankcs.hanlp.dictionary.py 中的 枚举
- 拼音输入法头
- hit(int, int, V) -
接口 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHit 中的方法
- 命中一个模式串
- hit(int, int, V, int) -
接口 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHitFull 中的方法
- 命中一个模式串
- HMMSegment - com.hankcs.hanlp.seg.HMM 中的 类
- 基于2阶HMM(A Second-Order Hidden Markov Model, TriGram3阶文法模型)+ BMES序列标注的分词器
- HMMSegment() -
类 com.hankcs.hanlp.seg.HMM.HMMSegment 的构造方法
-
- HMMSegmentModelPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- HMM分词模型
I
- ICacheAble - com.hankcs.hanlp.corpus.io 中的 接口
- 可写入或读取二进制
- id -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的变量
- 第一个值化为id
- ID -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- ID 当前词在句子中的序号,1开始.
- id -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
-
- id -
类 com.hankcs.hanlp.dependency.common.Node 中的变量
-
- id -
类 com.hankcs.hanlp.dependency.common.State 中的变量
-
- id2tag -
类 com.hankcs.hanlp.model.crf.CRFModel 中的变量
-
- idArrayList -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的变量
-
- IdVector - com.hankcs.hanlp.suggest.scorer.lexeme 中的 类
- 一个同义词有多个id,多个同义词用这个封装做key
- IdVector(String) -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 的构造方法
-
- IdVector(List<Long[]>) -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 的构造方法
-
- IdVectorScorer - com.hankcs.hanlp.suggest.scorer.lexeme 中的 类
- 单词语义向量打分器
- IdVectorScorer() -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer 的构造方法
-
- increase(int) -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
- 频次增加若干
- increase() -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
- 频次加一
- index -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
- key的字典序坐标
- index -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 在一维顶点数组中的下标,可以视作这个顶点的id
- index -
类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的变量
- 节点在顶点数组中的下标
- index -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
- 边的终点在顶点数组中的下标
- indexMode -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否是索引分词(合理地最小分割)
- IndexTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 索引分词器
- IndexTokenizer() -
类 com.hankcs.hanlp.tokenizer.IndexTokenizer 的构造方法
-
- INFINITE_VALUE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- innerList -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的变量
- 由这些词复合而来
- insert(String, String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 往自定义词典中插入一个新词(覆盖模式)
- insert(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 以覆盖模式增加新词
- insert(int, Vertex, WordNet) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 添加顶点,同时检查此顶点是否悬孤,如果悬孤则自动补全
- Integer2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
- 将整型转为拼音
- Integer2PinyinConverter() -
类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 的构造方法
-
- Interval - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
- 区间
- Interval(int, int) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 的构造方法
- 构造一个区间
- Intervalable - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 接口
- 区间接口
- IntervalableComparatorByPosition - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
- 按起点比较区间
- IntervalableComparatorByPosition() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorByPosition 的构造方法
-
- IntervalableComparatorBySize - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
- 按照长度比较区间,如果长度相同,则比较起点
- IntervalableComparatorBySize() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorBySize 的构造方法
-
- IntervalNode - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
- 线段树上面的节点,实际上是一些区间的集合,并且按中点维护了两个节点
- IntervalNode(List<Intervalable>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 的构造方法
- 构造一个节点
- IntervalTree - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
- 线段树,用于检查区间重叠
- IntervalTree(List<Intervalable>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 的构造方法
- 构造线段树
- intToBytes(int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个整数转换位字节数组(4个字节),b[0]存储高位字符,大端
- IOUtil - com.hankcs.hanlp.corpus.io 中的 类
- 一些常用的IO操作
- IOUtil() -
类 com.hankcs.hanlp.corpus.io.IOUtil 的构造方法
-
- IOUtil.LineIterator - com.hankcs.hanlp.corpus.io 中的 类
- 方便读取按行读取大文件
- IOUtil.LineIterator(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 的构造方法
-
- IPhraseExtractor - com.hankcs.hanlp.phrase 中的 接口
- 从一篇文章中自动识别出最可能的短语
- isAcceptable() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 是否是终止状态
- isAcceptNode() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Retrieves the accept state status of this node.
- isAcceptNode() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Retrieves the accept state status of this node.
- isAllChinese(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是中文
- isAllChineseNum(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是中国数字
- isAllDelimiter(byte[]) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是分隔符
- isAllIndex(byte[]) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是序号
- isAllLetter(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全为英文
- isAllLetterOrNum(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全为英文或字母
- isAllNonChinese(byte[]) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全部不是中文
- isAllNum(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是数字
- isAllowOverlaps() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的方法
- 是否允许重叠
- isAllSingleByte(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 是否全是单字节
- isArabicNumber(char) -
类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
-
- ISaveAble - com.hankcs.hanlp.corpus.dictionary 中的 接口
-
- isBlank(CharSequence) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断字符串是否为空(null和空格)
- isBlankOrNull(String) -
类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
-
- isChinese(char) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断某个字符是否为汉字
- isCJKCharacter(char) -
类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
-
- isConfluenceNode() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Determines if this node is a confluence node
(defined as a node with two or more incoming transitions
- IScorer - com.hankcs.hanlp.suggest.scorer 中的 接口
- 打分接口
- isDBCCase(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断该字符串是否是半角字符
- isDelimiter(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断是否是一个连字符(分隔符)
- isEmpty() -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- isEmpty() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- isEnglishLetter(char) -
类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
-
- ISentenceKey<T> - com.hankcs.hanlp.suggest.scorer 中的 接口
- 可以唯一代表一个句子的键,可以与其他句子区别开来
- isFileExists(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 判断文件是否存在
- isInAggregate(String, String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断一个字符串的所有字符是否在另一个字符串集合中
- isMatch() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 中的方法
-
- isMatch() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 中的方法
-
- isMatch() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
-
- isResource(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 判断资源是否位于jar中
- isRight() -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的方法
-
- isSBCCase(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断该字符串是否是全角字符
- isSpaceLetter(char) -
类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
-
- ISuggester - com.hankcs.hanlp.suggest 中的 接口
-
- isUnknownWord(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
-
- isYearTime(String) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 判断字符串是否是年份
- ISynonym - com.hankcs.hanlp.corpus.synonym 中的 接口
- 同义词接口
- Item - com.hankcs.hanlp.corpus.dictionary.item 中的 类
- 词典中的一个条目,比如“希望 v 7685 vn 616”
- Item(String, String) -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 的构造方法
-
- Item(String) -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 的构造方法
-
- iterator() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- ITrie<V> - com.hankcs.hanlp.collection.trie 中的 接口
- trie树接口
- IWord - com.hankcs.hanlp.corpus.document.sentence.word 中的 接口
- 词语接口
J
- japaneseNameRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别日本人名
- JapanesePersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
-
- JapanesePersonDictionary() -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 的构造方法
-
- JapanesePersonDictionary.Searcher - com.hankcs.hanlp.dictionary.nr 中的 类
- 最长分词
- JapanesePersonDictionary.Searcher(char[], DoubleArrayTrie<Character>) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 的构造方法
-
- JapanesePersonDictionary.Searcher(String, DoubleArrayTrie<Character>) -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 的构造方法
-
- JapanesePersonDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 日本人名词典路径
- JapanesePersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
- 日本人名识别
- JapanesePersonRecognition() -
类 com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition 的构造方法
-
K
- key -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的变量
- 该条目的索引,比如“啊”
- keySet() -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- Keyset - com.hankcs.hanlp.collection.dartsclone.details 中的 类
- key set,其实也包含值(每个key都有一个整型数)
- Keyset(byte[][], int[]) -
类 com.hankcs.hanlp.collection.dartsclone.details.Keyset 的构造方法
- 构造一个KeySet
- keySet() -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- keySet() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 键集合
- keySet() -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- keySet() -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 键集合
- keySet() -
类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 中的方法
-
- KeywordExtractor - com.hankcs.hanlp.summary 中的 类
- 提取关键词的基类
- KeywordExtractor() -
类 com.hankcs.hanlp.summary.KeywordExtractor 的构造方法
-
L
- l -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
- 每个key的长度
- label -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的变量
-
- label -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的变量
- 单词的标签,比如“n”
- label -
类 com.hankcs.hanlp.dependency.common.Edge 中的变量
-
- label -
类 com.hankcs.hanlp.dependency.common.Node 中的变量
-
- label -
类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
-
- labelMap -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的变量
-
- labelMap -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的变量
- 该条目的标签
- labelSet() -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- le -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
- 左信息熵
- learn(List<Word>) -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
- 让模型观测一个句子
- LEMMA -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 当前词语(或标点)的原型或词干,在中文中,此列与FORM相同
- length() -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- length -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
- key的长度
- length() -
类 com.hankcs.hanlp.seg.common.Term 中的方法
- 长度
- LITTLE_FREQUENCY -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- load(ObjectInputStream, V[]) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 载入
- load(ByteArray, V[]) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 载入
- load(ByteArray) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
-
- load(String, V[]) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 从磁盘加载二分数组树
- load(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 只加载值,此时相当于一个set
- load(ByteArray, _ValueArray) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- load(ByteArray, V[]) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- load(String, List<V>) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 从磁盘加载,需要额外提供值
- load(String, V[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 从磁盘加载,需要额外提供值
- load(ByteArray, V[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- load(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 载入双数组,但是不提供值,此时本trie相当于一个set
- load(ByteArray, V[]) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- load(String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 从磁盘加载
- load(String) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
-
- load(String, String) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
- 加载词典
- load(String) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
- 加载词典
- load(ByteArray) -
接口 com.hankcs.hanlp.corpus.io.ICacheAble 中的方法
-
- load(String) -
类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
-
- load(String) -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
- 已过时。
- load(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
-
- load(String) -
类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 中的方法
-
- load(InputStream) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
-
- load(InputStream) -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
-
- load(String, Nature, TreeMap<String, CoreDictionary.Attribute>) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 加载用户词典(追加)
- load(String) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.model.crf.FeatureFunction 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
-
- load(ByteArray) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- loadAsItemList(String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 读取所有条目
- loadCorpus(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- loadSentenceList(String) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 中的静态方法
-
- loadSentenceList(String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- loadTxt(String, CRFModel) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
-
- loadTxt(String) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
-
- logger -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 日志组件
- logPrior(double[]) -
类 com.hankcs.hanlp.model.maxent.UniformPrior 中的方法
- 获取先验概率
- long2char(long) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 转换long型为char数组
- long2String(long) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 转换long类型为string
- LongestBinSegmentToy<V> - com.hankcs.hanlp.seg.Other 中的 类
- 最长分词玩具
- LongestBinSegmentToy(BinTrie<V>) -
类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 的构造方法
-
- LongestCommonSubsequence - com.hankcs.hanlp.algoritm 中的 类
-
- LongestCommonSubsequence() -
类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 的构造方法
-
- LongestCommonSubstring - com.hankcs.hanlp.algoritm 中的 类
- 求最长公共字串的长度
- LongestCommonSubstring() -
类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 的构造方法
-
- longToBytes(long) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 将一个长整数转换位字节数组(8个字节),b[0]存储高位字符,大端
M
- M -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态变量
- 名
- M_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
-
- main(String[]) -
类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
- Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
- main(String[]) -
类 com.hankcs.hanlp.summary.TextRankSentence 中的静态方法
-
- makeEdge(Node[], int, int) -
类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的方法
-
- makeEdge(Node[], int, int) -
类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 中的方法
-
- makeEdge(Node[], int, int) -
类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的方法
-
- makeModel(String, String) -
类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
-
- makeModel(String, String) -
类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
-
- makeToneToTheSame(List<Pinyin>) -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
- 将所有音调都转为1
- MatchToken - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
- 匹配到的片段
- MatchToken(String, Emit) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 的构造方法
-
- MathTools - com.hankcs.hanlp.utility 中的 类
-
- MathTools() -
类 com.hankcs.hanlp.utility.MathTools 的构造方法
-
- matrix -
类 com.hankcs.hanlp.model.crf.CRFModel 中的变量
- tag的转移矩阵
- MAX_FREQUENCY -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_INDEX_LENGTH -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态变量
- 尾数的长度,表示原子词的index
- MAX_POS_PER_WORD -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_SEGMENT_NUM -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_SENTENCE_LEN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_UNKNOWN_PER_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_WORDS -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态变量
- 同一行最多支持编码这么多个单词
- MAX_WORDS -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MAX_WORDS_PER_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MaxEntDependencyModelMaker - com.hankcs.hanlp.corpus.dependency.model 中的 类
- 最大熵模型构建工具,训练暂时不使用自己的代码,借用opennlp训练。
- MaxEntDependencyModelMaker() -
类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 的构造方法
-
- MaxEntDependencyParser - com.hankcs.hanlp.dependency 中的 类
- 最大熵句法分析器
- MaxEntDependencyParser() -
类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 的构造方法
-
- MaxEntModel - com.hankcs.hanlp.model.maxent 中的 类
- 最大熵模型,采用双数组Trie树加速,值得拥有
- MaxEntModel() -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 的构造方法
-
- MaxEntModelPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 最大熵-依存关系模型
- MDAG - com.hankcs.hanlp.collection.MDAG 中的 类
- 最小环形图
A minimalistic directed acyclical graph suitable for storing a set of Strings. - MDAG(File) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
- 从一个文件建立MDAG
Creates an MDAG from a newline delimited file containing the data of interest.
- MDAG(Collection<String>) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
- Creates an MDAG from a collection of Strings.
- MDAG() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
- 空白图
- mdagDataArray -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 调用simplify()后填充此空间
- MDAGMap<V> - com.hankcs.hanlp.collection.MDAG 中的 类
- 最好不要把MDAG当map用,现在的实现在key后面放一个int,导致右语言全部不同,退化为bintrie
- MDAGMap() -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 的构造方法
-
- MDAGNode - com.hankcs.hanlp.collection.MDAG 中的 类
- MDAG中的一个节点
The class which represents a node in a MDAG. - MDAGNode(boolean) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 的构造方法
- 建立一个节点
Constructs an MDAGNode.
- MDAGSet - com.hankcs.hanlp.collection.MDAG 中的 类
- 基于MDAG(又称DAWG,Minimal Acyclic Finite-State Automata)的String Set
- MDAGSet(File) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
-
- MDAGSet(Collection<String>) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
-
- MDAGSet() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
-
- meet(String, State) -
接口 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie.IWalker 中的方法
- 遇到了一个节点
- mergeContinuousNsIntoOne() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 将连续的ns节点合并为一个
- mergeNumberQuantifier(List<Vertex>, WordNet, Config) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 合并数字
- mi -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
- 互信息值
- MIN_PROBABILITY -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MIN_PROBLEM -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- MinimumSpanningTreeParser - com.hankcs.hanlp.dependency 中的 类
-
- MinimumSpanningTreeParser() -
类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 的构造方法
-
- MutualInformationEntropyPhraseExtractor - com.hankcs.hanlp.phrase 中的 类
- 利用互信息和左右熵的短语提取器
- MutualInformationEntropyPhraseExtractor() -
类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 的构造方法
-
N
- NAME -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 等效字符串
- NameDictionaryMaker - com.hankcs.hanlp.corpus.nr 中的 类
-
- NameDictionaryMaker() -
类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 的构造方法
-
- nameRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别中国人名
- nature -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
- 词性列表
- Nature - com.hankcs.hanlp.corpus.tag 中的 枚举
- 词性
- nature -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
- 词性列表
- nature -
类 com.hankcs.hanlp.seg.common.Term 中的变量
- 词性
- NatureDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
-
- NatureDictionaryMaker() -
类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 的构造方法
-
- ner -
类 com.hankcs.hanlp.seg.Config 中的变量
- 命名实体识别是否至少有一项被激活
- newAddressInstance(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个地名实例
- newB() -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 生成线程安全的起始节点
- newE() -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 生成线程安全的终止节点
- newJapanesePersonInstance(String, int) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个日本人名实例
- newNumberInstance(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个数词实例
- newOrganizationInstance(String, int) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个机构名实例
- newPersonInstance(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个人名实例
- newPersonInstance(String, int) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个人名实例
- newPlaceInstance(String, int) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个地名实例
- newPunctuationInstance(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个标点符号实例
- newSegment() -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 创建一个分词器
这是一个工厂方法
与直接new一个分词器相比,使用本方法的好处是,以后HanLP升级了,总能用上最合适的分词器
- newTimeInstance(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个时间实例
- newTranslatedPersonInstance(String, int) -
类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
- 创建一个音译人名实例
- newValueArray() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- next() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的方法
- 取出下一个命中输出
- next() -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 中的方法
-
- next() -
类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
-
- next() -
类 com.hankcs.hanlp.dictionary.BaseSearcher 中的方法
- 分出下一个词
- next() -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 中的方法
-
- next() -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 中的方法
-
- next() -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 中的方法
-
- next() -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 中的方法
-
- next() -
类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 中的方法
-
- next -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
- 下一个,这是一个链表结构的最小堆
- next() -
类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
-
- nextByte() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个字节
- nextChar() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个char,对应于writeChar
- nextDouble() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
-
- nextFloat() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
-
- nextInt() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个int
- nextState(Character) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 按照character转移,根节点转移失败会返回自己(永远不会返回null)
- nextState(Character) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 按照character转移,根节点转移失败会返回自己(永远不会返回null)
- nextStateIgnoreRootState(Character) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 按照character转移,任何节点转移失败会返回null
- nextStateIgnoreRootState(Character) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 按照character转移,任何节点转移失败会返回null
- nextString() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个String,注意这个String是双字节版的,在字符之前有一个整型表示长度
- nextUnsignedShort() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个无符号短整型
- nextUTF() -
类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
- 读取一个UTF字符串
- nextValue() -
类 com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray 中的方法
-
- nextValue() -
类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 中的方法
-
- NGramDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
- 2-gram词典制作工具
- NGramDictionaryMaker() -
类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 的构造方法
-
- NLPTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 可供自然语言处理用的分词器
- NLPTokenizer() -
类 com.hankcs.hanlp.tokenizer.NLPTokenizer 的构造方法
-
- Node<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
- 深度大于等于2的子节点
- Node(char, BaseNode.Status, V) -
类 com.hankcs.hanlp.collection.trie.bintrie.Node 的构造方法
-
- Node() -
类 com.hankcs.hanlp.collection.trie.bintrie.Node 的构造方法
-
- Node - com.hankcs.hanlp.dependency.common 中的 类
- 节点
- Node(Term, int) -
类 com.hankcs.hanlp.dependency.common.Node 的构造方法
-
- Node - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
-
- Node(Vertex) -
类 com.hankcs.hanlp.seg.Viterbi.Path.Node 的构造方法
-
- nonZero(double) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 防止频率为0发生除零错误
- normalization(char[]) -
类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
- 正规化一些字符(原地正规化)
- Normalization -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 是否执行字符正规化(繁体->简体,全角->半角,大写->小写),切换配置后必须删CustomDictionary.txt.bin缓存
- normalizeFrequency(List<Item>) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
- 调整频次,按排序后的次序给定频次
- NotionalTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 实词分词器,自动移除停用词
- NotionalTokenizer() -
类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 的构造方法
-
- nPOS -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的变量
-
- NR - com.hankcs.hanlp.corpus.tag 中的 枚举
- 人名标签
- NR_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- NRConstant - com.hankcs.hanlp.dictionary.nr 中的 类
- 人名识别中常用的一些常量
- NRConstant() -
类 com.hankcs.hanlp.dictionary.nr.NRConstant 的构造方法
-
- NRCorpusLoader - com.hankcs.hanlp.corpus.nr 中的 类
- 对人名语料的解析,并且生成词典
- NRCorpusLoader() -
类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 的构造方法
-
- NRDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
- 一个好用的人名词典
- NRDictionary() -
类 com.hankcs.hanlp.dictionary.nr.NRDictionary 的构造方法
-
- NRDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
- nr词典(词典+ngram转移+词性转移矩阵)制作工具
- NRDictionaryMaker(EasyDictionary) -
类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 的构造方法
-
- NRPattern - com.hankcs.hanlp.dictionary.nr 中的 枚举
- 人名识别模式串
- NS - com.hankcs.hanlp.corpus.tag 中的 枚举
- 地名角色标签
- NS_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- NSDictionary - com.hankcs.hanlp.dictionary.ns 中的 类
- 一个好用的地名词典
- NSDictionary() -
类 com.hankcs.hanlp.dictionary.ns.NSDictionary 的构造方法
-
- NSDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
-
- NSDictionaryMaker(EasyDictionary) -
类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 的构造方法
-
- NShortPath - com.hankcs.hanlp.seg.NShort.Path 中的 类
-
- NShortPath(Graph, int) -
类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 的构造方法
- 构造一个N最短路径计算器
- NShortSegment - com.hankcs.hanlp.seg.NShort 中的 类
- N最短分词器
- NShortSegment() -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 的构造方法
-
- NT - com.hankcs.hanlp.corpus.tag 中的 枚举
-
- NT_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- NTDictionary - com.hankcs.hanlp.dictionary.nt 中的 类
- 一个好用的地名词典
- NTDictionary() -
类 com.hankcs.hanlp.dictionary.nt.NTDictionary 的构造方法
-
- NTDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
-
- NTDictionaryMaker(EasyDictionary) -
类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 的构造方法
-
- NULL -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的静态变量
- 空白节点,用于描述下标超出word数组的词语
- NULL -
类 com.hankcs.hanlp.dependency.common.Node 中的静态变量
-
- numberQuantifierRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别数字和量词
- NX_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
O
- Occurrence - com.hankcs.hanlp.corpus.occurrence 中的 类
- 词共现统计,最多统计到三阶共现
- Occurrence() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 的构造方法
-
- offset -
类 com.hankcs.hanlp.dictionary.BaseSearcher 中的变量
- 指向当前处理字串的开始位置(前面的已经分词分完了)
- offset -
类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
-
- offset -
类 com.hankcs.hanlp.seg.common.Term 中的变量
- 在文本中的起始位置(需开启分词器的offset选项)
- offset -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否计算偏移量
- onGenerateEntry(String) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 由参数构造一个词条
- onGenerateEntry(String) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
-
- onGenerateEntry(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
-
- onLoadTxtFinished() -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
-
- onLoadValue(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
- 实现此方法来加载值
- onLoadValue(String) -
类 com.hankcs.hanlp.dictionary.nr.NRDictionary 中的方法
-
- onLoadValue(String) -
类 com.hankcs.hanlp.dictionary.ns.NSDictionary 中的方法
-
- onLoadValue(String) -
类 com.hankcs.hanlp.dictionary.nt.NTDictionary 中的方法
-
- onSave(Item) -
接口 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker.Filter 中的方法
- 是否保存这个条目
- onSaveValue(V[], String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
-
- onSaveValue(EnumItem<NR>[], String) -
类 com.hankcs.hanlp.dictionary.nr.NRDictionary 中的方法
-
- onSaveValue(EnumItem<NS>[], String) -
类 com.hankcs.hanlp.dictionary.ns.NSDictionary 中的方法
-
- onSaveValue(EnumItem<NT>[], String) -
类 com.hankcs.hanlp.dictionary.nt.NTDictionary 中的方法
-
- open(InputStream) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- Read from a stream.
- open(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- open(String) -
类 com.hankcs.hanlp.corpus.io.FolderWalker 中的静态方法
- 打开一个目录,获取全部的文件名
- ordinaryMax -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
- 内部标签下标最大值不超过这个值,用于矩阵创建
- OrganizationDictionary - com.hankcs.hanlp.dictionary.nt 中的 类
- 机构名识别用的词典,实际上是对两个词典的包装
- OrganizationDictionary() -
类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 的构造方法
-
- OrganizationDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 地名词典路径
- OrganizationDictionaryTrPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 地名词典转移矩阵路径
- OrganizationRecognition - com.hankcs.hanlp.recognition.nt 中的 类
- 地址识别
- OrganizationRecognition() -
类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 的构造方法
-
- organizationRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别机构
- outcomeNames -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的变量
- 事件名
- outcomes -
类 com.hankcs.hanlp.model.maxent.Context 中的变量
- 输出(标签)
- output(int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 检查状态是否对应输出
- overlapsWith(Interval) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
- 是否与另一个区间交叉(有一部分重叠)
- overlapsWith(int) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
- 区间是否覆盖了这个点
P
- Pair<T,U> - com.hankcs.hanlp.collection.dartsclone 中的 类
- 模拟C++中的pair,也兼容JavaFX中的Pair
- Pair(T, U) -
类 com.hankcs.hanlp.collection.dartsclone.Pair 的构造方法
-
- PairFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
- 一个二元的词串的频度
- PairFrequency(String, Integer) -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 的构造方法
-
- PairFrequency(String) -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 的构造方法
-
- parameters -
类 com.hankcs.hanlp.model.maxent.Context 中的变量
- 参数
- parse(List<Term>) -
类 com.hankcs.hanlp.dependency.AbstractDependencyParser 中的方法
-
- parse(List<Term>) -
类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的方法
-
- parse(List<Term>) -
类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 中的方法
-
- parse(String) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的静态方法
- 一句话分词
- parseDependency(String) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 依存文法分析
- parsePath(int[]) -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
- 根据节点下标数组解释出对应的路径
- parsePattern(List<NR>, List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态方法
- 模式匹配
- parsePattern(List<NS>, List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态方法
- 模式匹配
- parsePattern(List<NT>, List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态方法
- 模式匹配
- parseResult(List<Vertex>) -
类 com.hankcs.hanlp.seg.common.Graph 中的静态方法
- 从一个路径中转换出空格隔开的结果
- parseText(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
- 模式匹配
- parseText(String) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 匹配母文本
- parseText(String, AhoCorasickDoubleArrayTrie.IHit<V>) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 处理文本
- parseText(char[], AhoCorasickDoubleArrayTrie.IHit<V>) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 处理文本
- parseText(char[], AhoCorasickDoubleArrayTrie.IHitFull<V>) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 处理文本
- parseText(char[], AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute>) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
- path -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态变量
- 已过时。
- path -
类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 中的静态变量
-
- path -
类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态变量
-
- path -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- path -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
- 第一个是主词典,其他是副词典
- PathNode - com.hankcs.hanlp.seg.NShort.Path 中的 类
- 路径上的节点
- PathNode(int, int) -
类 com.hankcs.hanlp.seg.NShort.Path.PathNode 的构造方法
- 构造一个节点
- PATTERN -
类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态变量
- 匹配&或全角状态字符或标点
- PATTERN_FLOAT_NUMBER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 浮点数正则
- PersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
- 人名识别用的词典,实际上是对两个词典的包装
- PersonDictionary() -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 的构造方法
-
- PersonDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 人名词典路径
- PersonDictionaryTrPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 人名词典转移矩阵路径
- PersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
- 人名识别
- PersonRecognition() -
类 com.hankcs.hanlp.recognition.nr.PersonRecognition 的构造方法
-
- Pinyin - com.hankcs.hanlp.dictionary.py 中的 枚举
- 拼音,组成部分=声母+韵母+声调12345
- PinyinDictionary - com.hankcs.hanlp.dictionary.py 中的 类
-
- PinyinDictionary() -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 的构造方法
-
- PinyinDictionary.Searcher - com.hankcs.hanlp.dictionary.py 中的 类
-
- PinyinDictionary.Searcher(char[], DoubleArrayTrie<Pinyin[]>) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 的构造方法
-
- PinyinDictionary.Searcher(String, DoubleArrayTrie<Pinyin[]>) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 的构造方法
-
- PinyinDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 拼音词典路径
- PinyinKey - com.hankcs.hanlp.suggest.scorer.pinyin 中的 类
-
- PinyinKey(String) -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 的构造方法
-
- pinyins -
类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 中的静态变量
-
- pinyins -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态变量
-
- PinyinScorer - com.hankcs.hanlp.suggest.scorer.pinyin 中的 类
- 拼音打分器
- PinyinScorer() -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer 的构造方法
-
- PinyinUtil - com.hankcs.hanlp.dictionary.py 中的 类
-
- PinyinUtil() -
类 com.hankcs.hanlp.dictionary.py.PinyinUtil 的构造方法
-
- PlaceDictionary - com.hankcs.hanlp.dictionary.ns 中的 类
- 地名识别用的词典,实际上是对两个词典的包装
- PlaceDictionary() -
类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 的构造方法
-
- PlaceDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 地名词典路径
- PlaceDictionaryTrPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 地名词典转移矩阵路径
- PlaceRecognition - com.hankcs.hanlp.recognition.ns 中的 类
- 地址识别
- PlaceRecognition() -
类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 的构造方法
-
- placeRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别地名
- PlaceSuffixDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
- 做一个简单的封装
- PlaceSuffixDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary 的构造方法
-
- POSTAG -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
- 当前词语的词性(细粒度)
- PosTagCompiler - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
- 等效词编译器
- PosTagCompiler() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler 的构造方法
-
- POSTFIX_MUTIPLE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- POSTFIX_SINGLE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- POSUtil - com.hankcs.hanlp.dependency.common 中的 类
- 词性操作工具类
- POSUtil() -
类 com.hankcs.hanlp.dependency.common.POSUtil 的构造方法
-
- Precompiler - com.hankcs.hanlp.corpus.util 中的 类
- 预编译与反编译一些词语
- Precompiler() -
类 com.hankcs.hanlp.corpus.util.Precompiler 的构造方法
-
- Predefine - com.hankcs.hanlp.utility 中的 类
- 一些预定义的静态全局变量
- Predefine() -
类 com.hankcs.hanlp.utility.Predefine 的构造方法
-
- predict(String[]) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
- 预测分布
- predict(Collection<String>) -
类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
- 预测分布
- prefixSearch(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 前缀查询
- printByTo() -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
-
- Probability - com.hankcs.hanlp.model.trigram.frequency 中的 类
- 概率统计工具
- Probability() -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 的构造方法
-
- push(int, Vertex) -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 强行添加,替换已有的顶点
- put(String, V) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- put(String, V) -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- put(String, V) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 插入一个词
- put(char[], V) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- putAll(Map<? extends String, ? extends V>) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
Q
- QueueElement - com.hankcs.hanlp.seg.NShort.Path 中的 类
-
- QueueElement(int, int, double) -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 的构造方法
- 构造一个边节点
- quickAtomSegment(char[], int, int) -
类 com.hankcs.hanlp.seg.Segment 中的静态方法
- 快速原子分词,希望用这个方法替换掉原来缓慢的方法
R
- re -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
- 右信息熵
- readBytes(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 将整个文件读取为字节数组
- readBytesFromResource(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 将资源中的一个资源读入byte数组
- readCsv(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- readLine(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- readLineList(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- readLineListWithLessMemory(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 用省内存的方式读取大文件
- readObjectFrom(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 反序列化对象
- readTxt(String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 一次性读入纯文本
- realWord -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
-
- realWord -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 节点对应的真实词,绝对不含##
- reassignOutgoingTransition(char, MDAGNode, MDAGNode) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 重新设置转移状态函数的目标
Reassigns the target node of one of this node's outgoing transitions.
- Recognition(List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition 中的静态方法
- 执行识别
- Recognition(List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
-
- Recognition(List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition 中的静态方法
- 执行识别
- Recognition(List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
-
- Recognition(List<Vertex>, WordNet, WordNet) -
类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
-
- regularize(char) -
类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
- 进行字符规格化(全角转半角,大写转小写处理)
- remainLongest() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
- 只保留最长匹配
- remainLongest -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的变量
- 只保留最长匹配
- remove(Object) -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- remove(Object) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- remove(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 删除一个词
- remove(Map.Entry<String, V>) -
接口 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary.Filter 中的方法
-
- remove(SimpleDictionary.Filter) -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
- 过滤部分词条
- remove() -
类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
-
- remove(String) -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
- 删除单词
- remove(String) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
- 从停用词词典中删除停用词
- removeAll(Collection<?>) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- removeOutgoingTransition(char) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 移除一个转移目标
Removes a _transition labeled with a given char.
- removeOverlaps(List<Intervalable>) -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 中的方法
- 从区间列表中移除重叠的区间
- removeOverlaps() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
-
- removeString(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- Removes a String from the MDAG.
- removeTone(Pinyin) -
类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
-
- replaceSpecialtyStr(String, String, String) -
类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
-
- reset(BufferedReader) -
类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 中的方法
- 重置分词器
- reset(String) -
类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
- 将分词器复原或置为准备工作的状态
- ResultTerm<V> - com.hankcs.hanlp.seg.common 中的 类
- 一个通用的Term
- ResultTerm(String, V, int) -
类 com.hankcs.hanlp.seg.common.ResultTerm 的构造方法
-
- retainAll(Collection<?>) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- reverse() -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
- 将自己逆转过来返回
- REVERSE_EXT -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 逆转后缀名
- RIGHT -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的静态变量
- 两个词的正向连接符 中国 RIGHT 人民
- roleTag(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
- 角色标注,如果子类要进行label的调整或增加新的首尾等等,可以在此进行
- roleTag(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的方法
-
- roleTag(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的方法
-
- roleTag(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的方法
-
- roleTag(List<List<IWord>>) -
类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
-
- roleTag(List<Vertex>) -
类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
-
- roleTag(List<Vertex>, WordNet) -
类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
-
- roleTag(List<Vertex>, WordNet) -
类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
-
- ROOT -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的静态变量
- 根节点
- run() -
类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 中的方法
-
S
- samples() -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 持久化
- save(ObjectOutputStream) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 持久化
- save(OutputStream) -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- Saves the trie data into a stream.
- save(DataOutputStream) -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
-
- save(String) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
- 保存到二进制输出流
- save(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 将base和check保存下来
- save(ObjectOutputStream) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- save(DataOutputStream) -
接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
-
- save(String) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
- 保存词典
- save(DataOutputStream) -
接口 com.hankcs.hanlp.corpus.io.ICacheAble 中的方法
- 写入
- save(DataOutputStream) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.model.crf.FeatureFunction 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
-
- save(DataOutputStream) -
类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
-
- saveCollectionToTxt(Collection<T>, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- saveCorpus(List<Document>, String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- saveEntrySetToTxt(Set<Map.Entry<Object, Object>>, String, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- saveKeyTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
- 仅仅将值保存到文件
- saveMapToTxt(Map<Object, Object>, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- saveMapToTxt(Map<Object, Object>, String, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- saveNGramToTxt(String) -
类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
- 保存NGram词典
- saveObjectTo(Object, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 序列化对象
- saveSentenceList(List<List<IWord>>, String) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- saveTransformMatrixToTxt(String) -
类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
- 保存转移矩阵
- saveTxt(String, String) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
- 快速保存
- saveTxt(String, StringBuilder) -
类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
-
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
-
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- saveTxtTo(String, DictionaryMaker.Filter) -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
- 允许保存之前对其做一些调整
- saveTxtTo(String) -
接口 com.hankcs.hanlp.corpus.dictionary.ISaveAble 中的方法
- 将自己以文本文档的方式保存到磁盘
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
- 保存NGram词典和转移矩阵
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
-
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
-
- saveTxtTo(String) -
类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
-
- score -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
- 分数
- second -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的变量
-
- second -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
-
- seg(String) -
类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
-
- seg(String) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 分词
- seg(char[]) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 分词
- seg2sentence(String) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 分词断句 输出句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String, Filter...) -
类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
- 切分为句子形式
- seg2sentence(String) -
类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
- 切分为句子形式
- segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
- 用最长分词算法匹配拼音
- segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>, boolean) -
类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
-
- segLongest(char[], DoubleArrayTrie<String>) -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
-
- segLongest(char[], AhoCorasickDoubleArrayTrie<String>) -
类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
-
- segment(String) -
类 com.hankcs.hanlp.HanLP 中的静态方法
- 分词
- segment(char[], AhoCorasickDoubleArrayTrie<V>) -
类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 中的静态方法
- 最长分词,合并未知语素
- Segment - com.hankcs.hanlp.seg 中的 类
- 分词器(分词服务)
是所有分词器的基类(Abstract)
分词器的分词方法是线程安全的,但配置方法则不保证 - Segment() -
类 com.hankcs.hanlp.seg.Segment 的构造方法
- 构造一个分词器
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
- 分词
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
- 分词
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
-
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
- 分词
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
-
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
- 分词
- segment(String) -
类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
-
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
- 分词
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
-
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
- 分词
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
- 分词
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
- 分词
- SEGMENT -
类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态变量
- 预置分词器
- segment(String) -
类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
-
- segment(char[]) -
类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
- 分词
- segmentReverseOrder(char[], AhoCorasickDoubleArrayTrie<V>) -
类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 中的静态方法
- 逆向最长分词,合并未知语素
- SegmentWrapper - com.hankcs.hanlp.seg.common.wrapper 中的 类
- 一个将BufferedReader wrap进来的类
- SegmentWrapper(BufferedReader, Segment) -
类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 的构造方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.HMM.HMMSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment 中的方法
-
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.Segment 中的方法
- 给一个句子分词
- segSentence(char[]) -
类 com.hankcs.hanlp.seg.Viterbi.ViterbiSegment 中的方法
-
- Sentence - com.hankcs.hanlp.corpus.document.sentence 中的 类
- 句子,指的是以。
- Sentence(List<IWord>) -
类 com.hankcs.hanlp.corpus.document.sentence.Sentence 的构造方法
-
- sentence -
类 com.hankcs.hanlp.seg.common.WordNet 中的变量
- 已过时。 应当使用数组,这样比较快
- SENTENCE_BEGIN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- SENTENCE_END -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- sentenceList -
类 com.hankcs.hanlp.corpus.document.Document 中的变量
-
- SentencesUtil - com.hankcs.hanlp.utility 中的 类
- 文本断句
- SentencesUtil() -
类 com.hankcs.hanlp.utility.SentencesUtil 的构造方法
-
- separator -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的变量
- key value之间的分隔符
- SEPERATOR_C_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- SEPERATOR_C_SUB_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- SEPERATOR_E_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- SEPERATOR_E_SUB_SENTENCE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- SEPERATOR_LINK -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- serializeTo(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 将自己序列化到
- set(String, V) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 更新某个键对应的值
- set(String, V) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 更新某个键对应的值
- setAcceptStateStatus(boolean) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Sets this node's accept state status.
- setAllowOverlaps(boolean) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的方法
- 设置是否允许重叠
- setBoost(double) -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
- 设置权重
- setCorrectionParam(double) -
类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
-
- setFailure(State) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
- 设置failure状态
- setFailure(State, int[]) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
- 设置failure状态
- setIndex(int) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- setLabel(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
-
- setLabel(String) -
接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
-
- setLabel(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
-
- setLabels(String[]) -
类 com.hankcs.hanlp.model.maxent.UniformPrior 中的方法
- 初始化
- setLast(int, String) -
类 com.hankcs.hanlp.model.crf.Table 中的方法
-
- setRealWord(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
-
- setTransitionSetBeginIndex(int) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 转移状态在数组中的起始下标
Records the index that this node's _transition set starts at
in an array containing this node's containing MDAG data (simplified MDAG).
- setTransitionSetBeginIndex(int) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Records the index in this node's containing array that its _transition set begins at.
- setTrie(AhoCorasickDoubleArrayTrie<CoreDictionary.Attribute>) -
类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
-
- setValue(V[]) -
类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 中的方法
-
- setValue(V) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
- 设置节点对应的值
- setValue(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
-
- setValue(String) -
接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
-
- setValue(String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
-
- setWord(String) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
-
- Shengmu - com.hankcs.hanlp.dictionary.py 中的 枚举
- 声母
- shouldInclude(Term) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
- 是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词,并且不在停用词表中
- shouldInclude(Term) -
接口 com.hankcs.hanlp.dictionary.stopword.Filter 中的方法
- 是否应当将这个term纳入计算
- shouldInclude(Term) -
类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 中的方法
-
- shouldInclude(Term) -
类 com.hankcs.hanlp.summary.KeywordExtractor 中的方法
- 是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词
- shouldRemove(Term) -
类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
- 是否应当去掉这个词
- ShowTermNature -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 分词结果是否展示词性
- sim(List<String>, int) -
类 com.hankcs.hanlp.summary.BM25 中的方法
-
- simAll(List<String>) -
类 com.hankcs.hanlp.summary.BM25 中的方法
-
- similarity(String, String) -
类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
- 计算两个单词之间的相似度,0表示不相似,1表示完全相似
- similarity(CharArray) -
类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 中的方法
-
- similarity(T) -
接口 com.hankcs.hanlp.suggest.scorer.ISentenceKey 中的方法
-
- similarity(IdVector) -
类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的方法
-
- similarity(PinyinKey) -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
-
- simpleAtomSegment(char[], int, int) -
类 com.hankcs.hanlp.seg.Segment 中的静态方法
- 简易原子分词,将所有字放到一起作为一个词
- SimpleDictionary<V> - com.hankcs.hanlp.corpus.dictionary 中的 类
- 可以调整大小的词典
- SimpleDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 的构造方法
-
- SimpleDictionary.Filter<V> - com.hankcs.hanlp.corpus.dictionary 中的 接口
-
- SimpleGraph - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
-
- SimpleGraph(LinkedList<Vertex>[]) -
类 com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph 的构造方法
-
- SimpleItem - com.hankcs.hanlp.corpus.dictionary.item 中的 类
-
- SimpleItem() -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 的构造方法
-
- SimpleMDAGNode - com.hankcs.hanlp.collection.MDAG 中的 类
- The class capable of representing a MDAG node, its _transition set, and one of its incoming transitions;
objects of this class are used to represent a MDAG after its been simplified in order to save space.
- SimpleMDAGNode(char, boolean, int) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 的构造方法
- Constructs a SimpleMDAGNode.
- SimpleMDAGNode() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 的构造方法
-
- SimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
- 简体=繁体词典
- SimplifiedChineseDictionary() -
类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 的构造方法
-
- simplifiedSourceNode -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 简化后的根节点(简化指的是用数组简化,而不是最小化,这个结构永远是最小化的)
- simplify() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 固化自己
Creates a space-saving version of the MDAG in the form of an array.
- simplify() -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
- 进一步降低内存,提高查询速度
副作用是下次插入速度会变慢
- size() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- size() -
接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
- 长度
- size -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
- base 和 check 的大小
- size() -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 大小,即包含多少个模式串
- size() -
类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
- 大小
- size() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- size() -
类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
-
- size -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
- base 和 check 的大小
- size() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 树叶子节点个数
- size() -
类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
-
- size() -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
- 词典大小
- size() -
类 com.hankcs.hanlp.model.crf.Table 中的方法
-
- size() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
-
- size() -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
- 拼音的个数
- sort(String) -
类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的静态方法
- 排序这个词典
- sortDictionary(String) -
类 com.hankcs.hanlp.corpus.util.DictionaryUtil 中的静态方法
- 给某个字典排序
- sourceNode -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 根节点
- speechTagging -
类 com.hankcs.hanlp.seg.Config 中的变量
- 词性标注
- speechTagging(List<Vertex>) -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
- 词性标注
- SpeedTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 极速分词,基于Double Array Trie实现的词典分词,适用于“高吞吐量”“精度一般”的场合
- SpeedTokenizer() -
类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 的构造方法
-
- spilt(List<IWord>) -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
-
- SString - com.hankcs.hanlp.collection.sequence 中的 类
- (SimpleString)字符串,为了公用内存,避免值传递,优化运行效率而设置的String的替代品
- SString(char[], int, int) -
类 com.hankcs.hanlp.collection.sequence.SString 的构造方法
- 建立一个字符串
- SString(String) -
类 com.hankcs.hanlp.collection.sequence.SString 的构造方法
-
- StandardTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 标准分词器
- StandardTokenizer() -
类 com.hankcs.hanlp.tokenizer.StandardTokenizer 的构造方法
-
- start_probability -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
- 初始概率
- State - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
-
一个状态有如下几个功能
success; 成功转移到另一个状态
failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点
emits; 命中一个模式串
根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。
- State() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 的构造方法
- 构造深度为0的节点
- State(int) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 的构造方法
- 构造深度为depth的节点
- State - com.hankcs.hanlp.collection.AhoCorasick 中的 类
-
一个状态有如下几个功能
success; 成功转移到另一个状态
failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点
emits; 命中一个模式串
根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。
- State() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 的构造方法
- 构造深度为0的节点
- State(int) -
类 com.hankcs.hanlp.collection.AhoCorasick.State 的构造方法
- 构造深度为depth的节点
- State - com.hankcs.hanlp.dependency.common 中的 类
-
- State(float, int, Edge) -
类 com.hankcs.hanlp.dependency.common.State 的构造方法
-
- State - com.hankcs.hanlp.seg.Dijkstra.Path 中的 类
-
- State(double, int) -
类 com.hankcs.hanlp.seg.Dijkstra.Path.State 的构造方法
-
- states -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
- 隐状态
- status -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
- 节点状态
- StopWordDictionary - com.hankcs.hanlp.dictionary.stopword 中的 类
-
- StopWordDictionary(File) -
类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
-
- StopWordDictionary(Collection<String>) -
类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
-
- StopWordDictionary() -
类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
-
- storage -
类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的变量
- 储存
- String2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
- 汉字转拼音,提供拼音字符串转拼音,支持汉英混合的杂乱文本
- String2PinyinConverter() -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 的构造方法
-
- StringDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
- 满足 key=value 格式的词典,其中“=”可以自定义
- StringDictionary(String) -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 的构造方法
-
- StringDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 的构造方法
-
- StringDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
- 方便的工厂类
- StringDictionaryMaker() -
类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 的构造方法
-
- StringUtils - com.hankcs.hanlp.corpus.util 中的 类
-
- StringUtils() -
类 com.hankcs.hanlp.corpus.util.StringUtils 的构造方法
-
- subSequence(int, int) -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- SuffixDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
- 后缀树词典
- SuffixDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 的构造方法
-
- suggest(String, int) -
接口 com.hankcs.hanlp.suggest.ISuggester 中的方法
- 根据一个输入的句子推荐相似的句子
- suggest(String, int) -
类 com.hankcs.hanlp.suggest.Suggester 中的方法
-
- Suggester - com.hankcs.hanlp.suggest 中的 类
- 文本推荐器
- Suggester() -
类 com.hankcs.hanlp.suggest.Suggester 的构造方法
-
- Suggester(List<BaseScorer>) -
类 com.hankcs.hanlp.suggest.Suggester 的构造方法
-
- Suggester(BaseScorer...) -
类 com.hankcs.hanlp.suggest.Suggester 的构造方法
- 构造一个推荐器
- sWord -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的变量
-
- Synonym - com.hankcs.hanlp.corpus.synonym 中的 类
- 同义词
- Synonym(String, String) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
- 已过时。
- Synonym(String, long) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
- 已过时。
- Synonym(String, long, Synonym.Type) -
类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
-
- Synonym.Type - com.hankcs.hanlp.corpus.synonym 中的 枚举
-
- SynonymHelper - com.hankcs.hanlp.corpus.synonym 中的 类
- 一个Util
- SynonymHelper() -
类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 的构造方法
-
- synonymList -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
- 条目的value,是key的同义词列表
- synonymMap -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 中的变量
- 条目的value,是key的同义词近义词列表
- SYTDictionary - com.hankcs.hanlp.dictionary.py 中的 类
- 声母韵母音调词典
- SYTDictionary() -
类 com.hankcs.hanlp.dictionary.py.SYTDictionary 的构造方法
-
- SYTDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 声母韵母语调词典
T
- T_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- Table - com.hankcs.hanlp.model.crf 中的 类
- 给一个实例生成一个元素表
- Table() -
类 com.hankcs.hanlp.model.crf.Table 的构造方法
-
- tag(Table) -
类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
- 维特比后向算法标注
- tag(Table) -
类 com.hankcs.hanlp.model.CRFSegmentModel 中的方法
-
- tag(char[]) -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
- 序列标注
- TAG_BIGIN -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_BIGIN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 句子的开始 begin
- TAG_CLUSTER -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_CLUSTER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 字符串 x
- TAG_END -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_END -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 结束 end
- TAG_GROUP -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_GROUP -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 团体名词 nt
- TAG_NUMBER -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_NUMBER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 数词 m
- TAG_OTHER -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_OTHER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 其它
- TAG_PEOPLE -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_PEOPLE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 人名 nr
- TAG_PLACE -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_PLACE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 地址 ns
- TAG_PROPER -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_PROPER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 专有名词 nx
- TAG_QUANTIFIER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 数量词 mq (现在觉得应该和数词同等处理,比如一个人和一人都是合理的)
- TAG_TIME -
类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
-
- TAG_TIME -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 时间 t
- Term - com.hankcs.hanlp.seg.common 中的 类
- 一个单词,用户可以直接访问此单词的全部属性
- Term(String, Nature) -
类 com.hankcs.hanlp.seg.common.Term 的构造方法
- 构造一个单词
- TermFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
- 词与词频的简单封装
- TermFrequency(String, Integer) -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 的构造方法
-
- TermFrequency(String) -
类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 的构造方法
-
- TermOccurrence - com.hankcs.hanlp.corpus.occurrence 中的 类
- 词频统计
- TermOccurrence() -
类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 的构造方法
-
- TextRankKeyword - com.hankcs.hanlp.summary 中的 类
- 基于TextRank算法的关键字提取,适用于单文档
- TextRankKeyword() -
类 com.hankcs.hanlp.summary.TextRankKeyword 的构造方法
-
- TextRankSentence - com.hankcs.hanlp.summary 中的 类
- TextRank 自动摘要
- TextRankSentence(List<List<String>>) -
类 com.hankcs.hanlp.summary.TextRankSentence 的构造方法
-
- TextUtility - com.hankcs.hanlp.utility 中的 类
- 文本工具类
- TextUtility() -
类 com.hankcs.hanlp.utility.TextUtility 的构造方法
-
- TFDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
- 词频词典
- TFDictionary(String) -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 的构造方法
-
- TFDictionary() -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 的构造方法
-
- third -
类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的变量
-
- threadNumber -
类 com.hankcs.hanlp.seg.Config 中的变量
- 并行分词的线程数
- TMDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
- 转移矩阵词典制作工具
- TMDictionaryMaker() -
类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 的构造方法
-
- to -
类 com.hankcs.hanlp.dependency.common.Edge 中的变量
-
- toArray() -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- toArray(T[]) -
类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
-
- toCharArray() -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- toGraph() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
- 词网转词图
- Token - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
- 一个片段
- Token(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 的构造方法
-
- tokenize(String) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
- 一个最长分词器
- tone2tone5 -
类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态变量
- 将音调统一换为轻声,下标为拼音的ordinal,值为音调5或最大值
- TonePinyinString2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
- 将类似āiyā的词语转为拼音的转换器
- TonePinyinString2PinyinConverter() -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 的构造方法
-
- toSentenceList(String) -
类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
- 将文本切割为句子
- toSentenceList(char[]) -
类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
-
- toString() -
类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
-
- toString() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 中的方法
-
- toString() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
-
- toString() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.sequence.SString 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- toString() -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.document.Document 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的方法
-
- toString() -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
-
- toString() -
类 com.hankcs.hanlp.dependency.common.Node 中的方法
-
- toString() -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的方法
-
- toString() -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 中的方法
-
- toString() -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
-
- toString() -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的方法
-
- toString() -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
-
- toString() -
类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
-
- toString() -
类 com.hankcs.hanlp.model.crf.Table 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.EdgeFrom 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.Graph 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.ResultTerm 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.Term 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.common.WordNet 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的方法
-
- toString() -
类 com.hankcs.hanlp.seg.Viterbi.Path.Node 中的方法
-
- toString() -
类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
-
- totalFrequency -
类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
-
- totalFrequency -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态变量
- 已过时。
- totalFrequency -
类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
-
- totalFrequency -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- toWord() -
类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
- 转换为一个简单词
- TraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
- 繁简词典,提供简繁转换
- TraditionalChineseDictionary() -
类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 的构造方法
-
- TraditionalChineseDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 繁简词典路径
- TraditionalChineseTokenizer - com.hankcs.hanlp.tokenizer 中的 类
- 繁体中文分词器
- TraditionalChineseTokenizer() -
类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 的构造方法
-
- train() -
类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
- 观测结束,开始训练
- TRANS_ENGLISH -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- TRANS_JAPANESE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- TRANS_RUSSIAN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- transformMatrixDictionary -
类 com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary 中的静态变量
-
- transformMatrixDictionary -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
- 转移矩阵词典
- transformMatrixDictionary -
类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
- 转移矩阵词典
- transformMatrixDictionary -
类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
- 转移矩阵词典
- TransformMatrixDictionary<E extends Enum<E>> - com.hankcs.hanlp.dictionary 中的 类
- 转移矩阵词典
- TransformMatrixDictionary(Class<E>) -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 的构造方法
-
- transition(int, char) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- 转移状态
- transition(char) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- Follows an outgoing _transition of this node labeled with a given char.
- transition(String) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
- 沿着一个路径转移
Follows a _transition path starting from this node.
- transition(char[]) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
-
- transition(char[], int) -
类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
-
- transition(SimpleMDAGNode[], char) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Follows an outgoing _transition from this node.
- transition(SimpleMDAGNode[], String) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
- Follows a _transition path starting from this node.
- transition(SimpleMDAGNode[], char[]) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
-
- transition(SimpleMDAGNode[], char[], int) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
-
- transition(char[], int) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- transition(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 沿着路径转移状态
- transition(char[]) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 沿着节点转移状态
- transition(String, int) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 沿着路径转移状态
- transition(int, char) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
- 转移状态
- transitionCount -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
- 所有边的数量
- transitionWithRoot(int, char) -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
- c转移,如果是根节点则返回自己
- transititon_probability -
类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
- 转移概率
- translatedNameRecognize -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否识别音译人名
- TranslatedPersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
- 翻译人名词典,储存和识别翻译人名
- TranslatedPersonDictionary() -
类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 的构造方法
-
- TranslatedPersonDictionaryPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 音译人名词典
- TranslatedPersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
- 音译人名识别
- TranslatedPersonRecognition() -
类 com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition 的构造方法
-
- traverseMDAG(SimpleMDAGNode[], SimpleMDAGNode, String) -
类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的静态方法
- Follows a _transition path starting from the source node of a MDAG.
- TriaFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
- 一个二元的词串的频度
- Trie - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
- 基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf
- Trie(TrieConfig) -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 的构造方法
- 构造一棵trie树
- Trie() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 的构造方法
-
- trie -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
- trie -
类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
- 用于储存用户动态插入词条的二分trie树
- trie -
类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
- AC算法用到的Trie树
- trie -
类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
- AC算法用到的Trie树
- trie -
类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
- AC算法用到的Trie树
- Trie.IWalker - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 接口
-
- TRIE_EXT -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- trie树文件后缀名
- TrieConfig - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
- 配置
- TrieConfig() -
类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 的构造方法
-
- TT_ENGLISH -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- TT_JAPANESE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- TT_RUSSIAN -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- type -
类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
-
- type -
类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
- 这个条目的类型,同义词或同类词或封闭词
U
- UnEmptyStringSet - com.hankcs.hanlp.collection.set 中的 类
- 一个不接受空白的字符串set
- UnEmptyStringSet() -
类 com.hankcs.hanlp.collection.set.UnEmptyStringSet 的构造方法
-
- UniformPrior - com.hankcs.hanlp.model.maxent 中的 类
- 先验概率计算工具
- UniformPrior() -
类 com.hankcs.hanlp.model.maxent.UniformPrior 的构造方法
-
- unSerialize(String) -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的静态方法
-
- unSimplify() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 解压缩
- unSimplify() -
类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
-
- updateFrom(Vertex) -
类 com.hankcs.hanlp.seg.common.Vertex 中的方法
-
- updateFrom(Node) -
类 com.hankcs.hanlp.seg.Viterbi.Path.Node 中的方法
-
- updateNerConfig() -
类 com.hankcs.hanlp.seg.Config 中的方法
- 更新命名实体识别总开关
- useCustomDictionary -
类 com.hankcs.hanlp.seg.Config 中的变量
- 是否加载用户词典
V
- v -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
- 保存value
- v -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
-
- v -
类 com.hankcs.hanlp.model.crf.Table 中的变量
- 真实值,请不要直接读取
- valid(String) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
- 这个拼音是否合格
- valid(String[]) -
类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
- 这些拼音是否全部合格
- value -
类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
- 模式串对应的值
- value -
类 com.hankcs.hanlp.collection.sequence.SString 中的变量
-
- value -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
- 节点代表的值
- value -
类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
- key对应的value
- value -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的变量
- 十个值
- value -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的变量
- 单词的真实值,比如“程序”
- VALUE_EXT -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
- 值文件后缀名
- valueOf(char) -
类 com.hankcs.hanlp.collection.sequence.SString 中的静态方法
-
- valueOf(String) -
枚举 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.corpus.synonym.Synonym.Type 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.corpus.tag.Nature 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.corpus.tag.NR 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.corpus.tag.NS 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.corpus.tag.NT 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem.Type 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.nr.NRPattern 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.py.Head 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.py.Shengmu 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- valueOf(String) -
枚举 com.hankcs.hanlp.dictionary.py.Yunmu 中的静态方法
- 返回带有指定名称的该类型的枚举常量。
- values() -
类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
-
- values() -
枚举 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
- 按照频率从高到低排序的条目
- values() -
枚举 com.hankcs.hanlp.corpus.synonym.Synonym.Type 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.corpus.tag.Nature 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.corpus.tag.NR 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.corpus.tag.NS 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.corpus.tag.NT 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem.Type 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.nr.NRPattern 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.py.Head 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.py.Shengmu 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- values() -
枚举 com.hankcs.hanlp.dictionary.py.Yunmu 中的静态方法
- 按照声明该枚举类型的常量的顺序,返回
包含这些常量的数组。
- VectorDistance - com.hankcs.hanlp.algoritm 中的 类
- 词向量距离计算
- VectorDistance() -
类 com.hankcs.hanlp.algoritm.VectorDistance 的构造方法
-
- Vertex - com.hankcs.hanlp.seg.common 中的 类
- 顶点
- Vertex(String, String, CoreDictionary.Attribute) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
- 最复杂的构造函数
- Vertex(String, String, CoreDictionary.Attribute, int) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
-
- Vertex(String, CoreDictionary.Attribute) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
- 真实词与编译词相同时候的构造函数
- Vertex(String, CoreDictionary.Attribute, int) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
-
- Vertex(Map.Entry<String, CoreDictionary.Attribute>) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
- 通过一个键值对方便地构造节点
- Vertex(String) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
- 自动构造一个合理的顶点
- Vertex(char, CoreDictionary.Attribute) -
类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
-
- vertex -
类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的变量
- 当前位置
- vertexes -
类 com.hankcs.hanlp.seg.common.Graph 中的变量
- 顶点
- Viterbi - com.hankcs.hanlp.algoritm 中的 类
- 维特比算法
- Viterbi() -
类 com.hankcs.hanlp.algoritm.Viterbi 的构造方法
-
- viterbi() -
类 com.hankcs.hanlp.seg.Viterbi.Path.Graph 中的方法
-
- viterbi() -
类 com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph 中的方法
-
- viterbiCompute(List<EnumItem<NR>>) -
类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
- 维特比算法求解最优标签
- viterbiExCompute(List<EnumItem<NR>>) -
类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
- 维特比算法求解最优标签
- viterbiExCompute(List<EnumItem<NS>>) -
类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
- 维特比算法求解最优标签
- viterbiExCompute(List<EnumItem<NT>>) -
类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
- 维特比算法求解最优标签
- ViterbiSegment - com.hankcs.hanlp.seg.Viterbi 中的 类
- Viterbi分词器
也是最短路分词,最短路求解采用Viterbi算法 - ViterbiSegment() -
类 com.hankcs.hanlp.seg.Viterbi.ViterbiSegment 的构造方法
-
W
- walk(StringBuilder, Set<Map.Entry<String, V>>) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- walk(String, CorpusLoader.Handler) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- walk(String, CorpusLoader.HandlerThread[]) -
类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
-
- walkToLoad(ByteArray, _ValueArray<V>) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- walkToSave(DataOutputStream) -
类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
-
- weight -
类 com.hankcs.hanlp.seg.common.Edge 中的变量
- 花费
- weight -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 最短路径对应的权重
- weight -
类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
- 权重
- word -
类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的变量
- 有许多行,每行是一个单词
- Word - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
- 一个单词
- Word(String, String) -
类 com.hankcs.hanlp.corpus.document.sentence.word.Word 的构造方法
-
- word -
类 com.hankcs.hanlp.dependency.common.Node 中的变量
-
- word -
类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
-
- word -
类 com.hankcs.hanlp.seg.common.Term 中的变量
- 词语
- word -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 节点对应的词或等效词(如未##数)
- WORD_ID -
类 com.hankcs.hanlp.dictionary.nr.NRConstant 中的静态变量
- 本词典专注的词的ID
- WORD_MAXLENGTH -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- WORD_SEGMENTER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- WordBasedGenerativeModelSegment - com.hankcs.hanlp.seg 中的 类
- 基于词语NGram模型的分词器基类
- WordBasedGenerativeModelSegment() -
类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 的构造方法
-
- WordFactory - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
- 一个很方便的工厂类,能够自动生成不同类型的词语
- WordFactory() -
类 com.hankcs.hanlp.corpus.document.sentence.word.WordFactory 的构造方法
-
- wordID -
类 com.hankcs.hanlp.seg.common.Vertex 中的变量
- 等效词ID,也是Attribute的下标
- wordList -
类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的变量
-
- WordNatureDependencyModel - com.hankcs.hanlp.model.bigram 中的 类
-
- WordNatureDependencyModel() -
类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 的构造方法
-
- WordNatureDependencyParser - com.hankcs.hanlp.dependency 中的 类
- 一个简单的句法分析器
- WordNatureDependencyParser() -
类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 的构造方法
-
- WordNatureModelPath -
类 com.hankcs.hanlp.HanLP.Config 中的静态变量
- 词-词性-依存关系模型
- WordNatureWeightModelMaker - com.hankcs.hanlp.corpus.dependency.model 中的 类
- 生成模型打分器模型构建工具
- WordNatureWeightModelMaker() -
类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 的构造方法
-
- WordNatureWeightScorer - com.hankcs.hanlp.corpus.dependency.model 中的 类
- 生成模型打分器,衡量一个边的权值,仅仅利用〈词,词〉,数据稀疏则回退为〈词,词性〉、〈词性,词〉、〈词性,词性〉
- WordNatureWeightScorer() -
类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightScorer 的构造方法
-
- WordNet - com.hankcs.hanlp.seg.common 中的 类
-
- WordNet(String) -
类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
- 为一个句子生成空白词网
- WordNet(char[]) -
类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
-
- WordNet(char[], List<Vertex>) -
类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
-
- wrapTag(String) -
类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
- 用尖括号将标签包起来
- writeString(String, DataOutputStream) -
类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
- 简单好用的写String方式
- writeUnsignedInt(DataOutputStream, int) -
类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
- 无符号整型输出
- WT_CHINESE -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- WT_DELIMITER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
- WT_OTHER -
类 com.hankcs.hanlp.utility.Predefine 中的静态变量
-
X
- X -
类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态变量
- 姓
- X_WORD_ID -
类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
-
Y
- Yunmu - com.hankcs.hanlp.dictionary.py 中的 枚举
-
_
- _EmptyValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
-
- _EmptyValueArray() -
类 com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray 的构造方法
-
- _findSpecialString() -
类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
- 已过时。 没事就不要用了
- _getEquivalenceClassMDAGNodeHashMap() -
类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
- 调试用
- _ValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
- 对值数组的包装,可以方便地取下一个
- _ValueArray(V[]) -
类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 的构造方法
-
- _ValueArray() -
类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 的构造方法
- 仅仅给子类用,不要用
A B C D E F G H I J K L M N O P Q R S T U V W X Y _
Copyright © 2014–2015 码农场. All rights reserved.