A B C D E F G H I J K L M N O P Q R S T U V W X Y _

A

AbstractDependencyParser - com.hankcs.hanlp.dependency 中的 类
 
AbstractDependencyParser() - 类 com.hankcs.hanlp.dependency.AbstractDependencyParser 的构造方法
 
add(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
add(SString) - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
add(String) - 类 com.hankcs.hanlp.collection.set.UnEmptyStringSet 中的方法
 
add(String) - 类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
 
add(IWord) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
向词典中加入一个词语
add(String, String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
add(Item) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
插入条目
add(String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
add(String, V) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
向中加入单词
add(String) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
添加一个词语
add(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
 
add(String) - 类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
 
add(String, String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
往自定义词典中插入一个新词(非覆盖模式)
add(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
增加新词
add(String) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
加入停用词到停用词词典中
add(int, char[]...) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
add(int, Collection<char[]>) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
add(int, Vertex) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
添加顶点
add(int, List<AtomNode>) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
添加顶点,由原子分词顶点添加
addAll(Collection<? extends String>) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
addAll(List<Item>) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
插入全部条目
addAll(String) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
 
addAll(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
 
addAll(String[]) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
addAll(List<Term>) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
addAll(String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
addAll(List<String>) - 类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
 
addAll(List<Vertex>) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
全自动添加顶点
addAllKeyword(Collection<String>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
 
addAllNotCombine(List<Item>) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
插入新条目,不执行合并
addChild(BaseNode) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
添加子节点
addChild(BaseNode) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
addChild(BaseNode) - 类 com.hankcs.hanlp.collection.trie.bintrie.Node 中的方法
 
addEmit(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
添加一个匹配到的模式串(这个状态对应着这个模式串)
addEmit(Collection<String>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
添加一些匹配到的模式串
addEmit(int) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
添加一个匹配到的模式串(这个状态对应着这个模式串)
addEmit(Collection<Integer>) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
添加一些匹配到的模式串
addKeyword(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
 
addLabel(E) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
 
addLabel(E, Integer) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
 
addLabel(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
 
addLabel(String, Integer) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
添加一个标签和频次
addNotCombine(Item) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
插入条目,但是不合并,如果已有则忽略
addOutgoingTransition(char, boolean) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
新建一个转移目标
Creates an outgoing _transition labeled with a given char that has a new node as its target.
addOutgoingTransition(char, MDAGNode) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
建立一条边(起点是自己)
addPair(IWord, IWord) - 类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
 
addPair(String, String) - 类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
添加一个转移例子,会在内部完成统计
addPair(String, String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
添加一个共现
addSentence(String) - 接口 com.hankcs.hanlp.suggest.ISuggester 中的方法
 
addSentence(String) - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
 
addSentence(String) - 接口 com.hankcs.hanlp.suggest.scorer.IScorer 中的方法
输入一个候选句子
addSentence(String) - 类 com.hankcs.hanlp.suggest.Suggester 中的方法
 
addState(Character) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
 
addState(Character) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
addString(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
Adds a string to the MDAG.
addStrings(Collection<String>) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
Adds a Collection of Strings to the MDAG.
addTerm(String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
统计词频
addToDictionary(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
加入到词典中,允许子类自定义过滤等等,这样比较灵活
addToDictionary(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的方法
 
addToDictionary(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的方法
 
addToDictionary(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的方法
 
addToDictionary(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
 
addToOverlaps(Intervalable, List<Intervalable>, List<Intervalable>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
添加到重叠区间列表中
addTria(String, String, String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
AhoCorasickDoubleArrayTrie<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 类
基于双数组Trie树的AhoCorasick自动机
AhoCorasickDoubleArrayTrie() - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 的构造方法
 
AhoCorasickDoubleArrayTrie.Hit<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 类
一个命中结果
AhoCorasickDoubleArrayTrie.Hit(int, int, V) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 的构造方法
 
AhoCorasickDoubleArrayTrie.IHit<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 接口
命中一个模式串的处理方法
AhoCorasickDoubleArrayTrie.IHitFull<V> - com.hankcs.hanlp.collection.AhoCorasick 中的 接口
 
AhoCorasickDoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other 中的 类
使用AhoCorasickDoubleArrayTrie实现的最长分词器
需要用户调用setTrie()提供一个AhoCorasickDoubleArrayTrie
AhoCorasickDoubleArrayTrieSegment() - 类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 的构造方法
 
apply(List<Term>) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
对分词结果应用过滤
ArrayCompare - com.hankcs.hanlp.algoritm 中的 类
比较两个数组
ArrayCompare() - 类 com.hankcs.hanlp.algoritm.ArrayCompare 的构造方法
 
ArrayDistance - com.hankcs.hanlp.algoritm 中的 类
求两个集合中最相近的两个数
ArrayDistance() - 类 com.hankcs.hanlp.algoritm.ArrayDistance 的构造方法
 
ArrayTool - com.hankcs.hanlp.collection.trie.bintrie.util 中的 类
 
ArrayTool() - 类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 的构造方法
 
AtomNode - com.hankcs.hanlp.seg.NShort.Path 中的 类
原子分词节点
AtomNode(String, int) - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 的构造方法
 
AtomNode(char, int) - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 的构造方法
 
atomSegment(char[]) - 类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的静态方法
 
atomSegment(char[], int, int) - 类 com.hankcs.hanlp.seg.Segment 中的静态方法
原子分词
atomSegmentToTable(char[]) - 类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的静态方法
 
ATTRIBUTE - 类 com.hankcs.hanlp.dictionary.nr.NRConstant 中的静态变量
本词典专注的词的属性
ATTRIBUTE - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
 
attribute - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
词的属性,谨慎修改属性内部的数据,因为会影响到字典
如果要修改,应当new一个Attribute

B

b - 类 com.hankcs.hanlp.collection.sequence.SString 中的变量
开始位置,包含
B - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态变量
始##始
base - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
双数组之base
base - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
 
BaseChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
 
BaseChineseDictionary() - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 的构造方法
 
BaseChineseDictionary.Searcher - com.hankcs.hanlp.dictionary.ts 中的 类
最长分词
BaseChineseDictionary.Searcher(char[], DoubleArrayTrie<String>) - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 的构造方法
 
BaseChineseDictionary.Searcher(String, DoubleArrayTrie<String>) - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 的构造方法
 
BaseNode<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
节点,统一Trie树根和其他节点的基类
BaseNode() - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 的构造方法
 
BaseNode.Status - com.hankcs.hanlp.collection.trie.bintrie 中的 枚举
 
BaseNode.TrieEntry - com.hankcs.hanlp.collection.trie.bintrie 中的 类
 
BaseNode.TrieEntry(String, V) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry 的构造方法
 
BaseScorer<T extends ISentenceKey> - com.hankcs.hanlp.suggest.scorer 中的 类
基本打分器
BaseScorer() - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 的构造方法
 
BaseSearcher<V> - com.hankcs.hanlp.dictionary 中的 类
查询字典者
BaseSearcher(char[]) - 类 com.hankcs.hanlp.dictionary.BaseSearcher 的构造方法
 
BaseSearcher(String) - 类 com.hankcs.hanlp.dictionary.BaseSearcher 的构造方法
 
BasicTokenizer - com.hankcs.hanlp.tokenizer 中的 类
基础分词器,只做基本NGram分词,不识别命名实体,不使用用户词典
BasicTokenizer() - 类 com.hankcs.hanlp.tokenizer.BasicTokenizer 的构造方法
 
begin - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
模式串在母文本中的起始位置
begin - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
key的起点
BigramDependencyModel - com.hankcs.hanlp.model.bigram 中的 类
2-gram依存模型,根据两个词的词和词性猜测它们最可能的依存关系
BigramDependencyModel() - 类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 的构造方法
 
BiGramDictionary - com.hankcs.hanlp.dictionary 中的 类
已过时。 现在基于DoubleArrayTrie的BiGramDictionary已经由CoreBiGramTableDictionary替代,可以显著降低内存
BiGramDictionary() - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 的构造方法
已过时。  
BiGramDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
2元语法词典路径
BIN_EXT - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
二进制文件后缀
binarySearch(BaseNode[], BaseNode) - 类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 中的静态方法
二分查找
binarySearch(BaseNode[], char) - 类 com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool 中的静态方法
 
BinTrie<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
首字直接分配内存,之后二分动态数组的Trie树,能够平衡时间和空间
BinTrie() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 的构造方法
 
BiSegment(char[], int, WordNet, WordNet) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
二元语言模型分词
BM25 - com.hankcs.hanlp.summary 中的 类
搜索相关性评分算法
BM25(List<List<String>>) - 类 com.hankcs.hanlp.summary.BM25 的构造方法
 
boost - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的变量
权重
build(TreeMap<String, V>) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
由一个排序好的map创建
build(Keyset) - 类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 中的方法
构建
build(byte[][], int[]) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
构建
build(List<String>, int[]) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
 
build(TreeMap<String, V>) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
build(List<String>, List<V>) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
build(List<String>, V[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
build(Set<Map.Entry<String, V>>) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
构建DAT
build(TreeMap<String, V>) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
方便地构造一个双数组trie树
build(List<String>, int[], int[], int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
唯一的构建方法
build(TreeMap<String, V>) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
ByteArray - com.hankcs.hanlp.corpus.io 中的 类
对字节数组进行封装,提供方便的读取操作
ByteArray(byte[]) - 类 com.hankcs.hanlp.corpus.io.ByteArray 的构造方法
 
bytesHighFirstToChar(byte[], int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
字节数组转char,高位在前,适用于读取writeChar的数据
bytesHighFirstToDouble(byte[], int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
读取double,高位在前
bytesHighFirstToFloat(byte[], int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
读取float,高位在前
bytesHighFirstToInt(byte[], int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
字节数组和整型的转换,高位在前,适用于读取writeInt的数据
bytesHighFirstToLong(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
 
bytesToChar(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个2位字节数组转换为char字符。
bytesToDouble(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个8位字节数组转换为双精度浮点数。
bytesToFloat(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个4位字节数组转换为浮点数。
bytesToInt(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个4位字节数组转换为4整数。
bytesToInt(byte[], int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
字节数组和整型的转换
bytesToLong(byte[]) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个8位字节数组转换为长整数。
ByteUtil - com.hankcs.hanlp.utility 中的 类
对数字和字节进行转换。
ByteUtil() - 类 com.hankcs.hanlp.utility.ByteUtil 的构造方法
 

C

c - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
节点代表的字符
c - 类 com.hankcs.hanlp.dictionary.BaseSearcher 中的变量
待分词文本的char
calculateWeight(Vertex, Vertex) - 类 com.hankcs.hanlp.utility.MathTools 中的静态方法
从一个词到另一个词的词的花费
CanGetNext() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
是否仍然有下一个元素可供读取
CC_NUM - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CharacterBasedGenerativeModel - com.hankcs.hanlp.model.trigram 中的 类
基于字符的生成模型(其实就是一个TriGram文法模型,或称2阶隐马模型)
CharacterBasedGenerativeModel() - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 的构造方法
 
CharacterBasedGenerativeModelSegment - com.hankcs.hanlp.seg 中的 类
基于字构词的生成式模型分词器基类
CharacterBasedGenerativeModelSegment() - 类 com.hankcs.hanlp.seg.CharacterBasedGenerativeModelSegment 的构造方法
 
CharacterHelper - com.hankcs.hanlp.utility 中的 类
字符集识别辅助工具类
CharacterHelper() - 类 com.hankcs.hanlp.utility.CharacterHelper 的构造方法
 
charArray - 类 com.hankcs.hanlp.seg.common.WordNet 中的变量
原始句子对应的数组
CharArray - com.hankcs.hanlp.suggest.scorer.editdistance 中的 类
对字符数组的封装,可以代替String
CharArray(char[]) - 类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 的构造方法
 
charAt(int) - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
CharTable - com.hankcs.hanlp.dictionary.other 中的 类
字符正规化表
CharTable() - 类 com.hankcs.hanlp.dictionary.other.CharTable 的构造方法
 
CharTablePath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
字符正规化表(全角转半角,繁体转简体)
charToBytes(char) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个char字符转换位字节数组(2个字节),b[0]存储高位字符,大端
charTreeSet - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
字母表
CharType - com.hankcs.hanlp.dictionary.other 中的 类
字符类型
CharType() - 类 com.hankcs.hanlp.dictionary.other.CharType 的构造方法
 
charType(char) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
 
charType(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断字符类型
CharTypePath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
字符类型对应表
check - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
双数组值check
check - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
 
checkForOverlaps(Intervalable, IntervalNode.Direction) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
寻找重叠
checkForOverlapsToTheLeft(Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
往左边寻找重叠
checkForOverlapsToTheRight(Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
往右边寻找重叠
child - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
子节点
cint(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
把表示数字含义的字符串转你成整形
cleanBlankOrDigit(String) - 类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
清除数字和空格
clear() - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
clear() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
clear() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
清空词图
clear() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
清除所有元素
clearStoredHashCode() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Clears this node's stored hash value
clone() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
克隆一个状态
Creates an MDAGNode possessing the same accept state status and outgoing transitions as this node.
clone(MDAGNode, char) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
克隆一个状态
原来soleParentNode转移到本状态,现在转移到克隆后的状态 Creates an MDAGNode possessing the same accept state status ant _transition set (incoming & outgoing) as this node. outgoing transitions as this node.
close() - 类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
 
com.hankcs.hanlp - 软件包 com.hankcs.hanlp
 
com.hankcs.hanlp.algoritm - 软件包 com.hankcs.hanlp.algoritm
 
com.hankcs.hanlp.algoritm.ahocorasick.interval - 软件包 com.hankcs.hanlp.algoritm.ahocorasick.interval
 
com.hankcs.hanlp.algoritm.ahocorasick.trie - 软件包 com.hankcs.hanlp.algoritm.ahocorasick.trie
 
com.hankcs.hanlp.collection.AhoCorasick - 软件包 com.hankcs.hanlp.collection.AhoCorasick
 
com.hankcs.hanlp.collection.dartsclone - 软件包 com.hankcs.hanlp.collection.dartsclone
 
com.hankcs.hanlp.collection.dartsclone.details - 软件包 com.hankcs.hanlp.collection.dartsclone.details
 
com.hankcs.hanlp.collection.MDAG - 软件包 com.hankcs.hanlp.collection.MDAG
 
com.hankcs.hanlp.collection.sequence - 软件包 com.hankcs.hanlp.collection.sequence
 
com.hankcs.hanlp.collection.set - 软件包 com.hankcs.hanlp.collection.set
 
com.hankcs.hanlp.collection.trie - 软件包 com.hankcs.hanlp.collection.trie
 
com.hankcs.hanlp.collection.trie.bintrie - 软件包 com.hankcs.hanlp.collection.trie.bintrie
 
com.hankcs.hanlp.collection.trie.bintrie.util - 软件包 com.hankcs.hanlp.collection.trie.bintrie.util
 
com.hankcs.hanlp.corpus.dependency.CoNll - 软件包 com.hankcs.hanlp.corpus.dependency.CoNll
 
com.hankcs.hanlp.corpus.dependency.model - 软件包 com.hankcs.hanlp.corpus.dependency.model
 
com.hankcs.hanlp.corpus.dictionary - 软件包 com.hankcs.hanlp.corpus.dictionary
 
com.hankcs.hanlp.corpus.dictionary.item - 软件包 com.hankcs.hanlp.corpus.dictionary.item
 
com.hankcs.hanlp.corpus.document - 软件包 com.hankcs.hanlp.corpus.document
 
com.hankcs.hanlp.corpus.document.sentence - 软件包 com.hankcs.hanlp.corpus.document.sentence
 
com.hankcs.hanlp.corpus.document.sentence.word - 软件包 com.hankcs.hanlp.corpus.document.sentence.word
 
com.hankcs.hanlp.corpus.io - 软件包 com.hankcs.hanlp.corpus.io
 
com.hankcs.hanlp.corpus.nr - 软件包 com.hankcs.hanlp.corpus.nr
 
com.hankcs.hanlp.corpus.occurrence - 软件包 com.hankcs.hanlp.corpus.occurrence
 
com.hankcs.hanlp.corpus.synonym - 软件包 com.hankcs.hanlp.corpus.synonym
 
com.hankcs.hanlp.corpus.tag - 软件包 com.hankcs.hanlp.corpus.tag
 
com.hankcs.hanlp.corpus.util - 软件包 com.hankcs.hanlp.corpus.util
 
com.hankcs.hanlp.dependency - 软件包 com.hankcs.hanlp.dependency
 
com.hankcs.hanlp.dependency.common - 软件包 com.hankcs.hanlp.dependency.common
 
com.hankcs.hanlp.dictionary - 软件包 com.hankcs.hanlp.dictionary
 
com.hankcs.hanlp.dictionary.common - 软件包 com.hankcs.hanlp.dictionary.common
 
com.hankcs.hanlp.dictionary.nr - 软件包 com.hankcs.hanlp.dictionary.nr
 
com.hankcs.hanlp.dictionary.ns - 软件包 com.hankcs.hanlp.dictionary.ns
 
com.hankcs.hanlp.dictionary.nt - 软件包 com.hankcs.hanlp.dictionary.nt
 
com.hankcs.hanlp.dictionary.other - 软件包 com.hankcs.hanlp.dictionary.other
 
com.hankcs.hanlp.dictionary.py - 软件包 com.hankcs.hanlp.dictionary.py
 
com.hankcs.hanlp.dictionary.stopword - 软件包 com.hankcs.hanlp.dictionary.stopword
 
com.hankcs.hanlp.dictionary.ts - 软件包 com.hankcs.hanlp.dictionary.ts
 
com.hankcs.hanlp.model - 软件包 com.hankcs.hanlp.model
 
com.hankcs.hanlp.model.bigram - 软件包 com.hankcs.hanlp.model.bigram
 
com.hankcs.hanlp.model.crf - 软件包 com.hankcs.hanlp.model.crf
 
com.hankcs.hanlp.model.maxent - 软件包 com.hankcs.hanlp.model.maxent
 
com.hankcs.hanlp.model.trigram - 软件包 com.hankcs.hanlp.model.trigram
 
com.hankcs.hanlp.model.trigram.frequency - 软件包 com.hankcs.hanlp.model.trigram.frequency
 
com.hankcs.hanlp.phrase - 软件包 com.hankcs.hanlp.phrase
 
com.hankcs.hanlp.recognition.nr - 软件包 com.hankcs.hanlp.recognition.nr
 
com.hankcs.hanlp.recognition.ns - 软件包 com.hankcs.hanlp.recognition.ns
 
com.hankcs.hanlp.recognition.nt - 软件包 com.hankcs.hanlp.recognition.nt
 
com.hankcs.hanlp.seg - 软件包 com.hankcs.hanlp.seg
 
com.hankcs.hanlp.seg.common - 软件包 com.hankcs.hanlp.seg.common
 
com.hankcs.hanlp.seg.common.wrapper - 软件包 com.hankcs.hanlp.seg.common.wrapper
 
com.hankcs.hanlp.seg.CRF - 软件包 com.hankcs.hanlp.seg.CRF
 
com.hankcs.hanlp.seg.Dijkstra - 软件包 com.hankcs.hanlp.seg.Dijkstra
 
com.hankcs.hanlp.seg.Dijkstra.Path - 软件包 com.hankcs.hanlp.seg.Dijkstra.Path
 
com.hankcs.hanlp.seg.HMM - 软件包 com.hankcs.hanlp.seg.HMM
 
com.hankcs.hanlp.seg.NShort - 软件包 com.hankcs.hanlp.seg.NShort
 
com.hankcs.hanlp.seg.NShort.Path - 软件包 com.hankcs.hanlp.seg.NShort.Path
 
com.hankcs.hanlp.seg.Other - 软件包 com.hankcs.hanlp.seg.Other
 
com.hankcs.hanlp.seg.Viterbi - 软件包 com.hankcs.hanlp.seg.Viterbi
 
com.hankcs.hanlp.seg.Viterbi.Path - 软件包 com.hankcs.hanlp.seg.Viterbi.Path
 
com.hankcs.hanlp.suggest - 软件包 com.hankcs.hanlp.suggest
 
com.hankcs.hanlp.suggest.scorer - 软件包 com.hankcs.hanlp.suggest.scorer
 
com.hankcs.hanlp.suggest.scorer.editdistance - 软件包 com.hankcs.hanlp.suggest.scorer.editdistance
 
com.hankcs.hanlp.suggest.scorer.lexeme - 软件包 com.hankcs.hanlp.suggest.scorer.lexeme
 
com.hankcs.hanlp.suggest.scorer.pinyin - 软件包 com.hankcs.hanlp.suggest.scorer.pinyin
 
com.hankcs.hanlp.summary - 软件包 com.hankcs.hanlp.summary
 
com.hankcs.hanlp.tokenizer - 软件包 com.hankcs.hanlp.tokenizer
 
com.hankcs.hanlp.utility - 软件包 com.hankcs.hanlp.utility
 
combine(String, String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
合并两部词典
combine(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
合并多部词典
combine(SimpleItem) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
合并两个条目,两者的标签map会合并
combine(SimpleDictionary<V>) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
以我为主词典,合并一个副词典,我有的词条不会被副词典覆盖
combine(StringDictionary...) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
合并词典,第一个为主词典
combine(String...) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
 
combine(TFDictionary, int, boolean) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
 
combine(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的静态方法
 
combine() - 类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
 
combineByCustomDictionary(List<Vertex>) - 类 com.hankcs.hanlp.seg.Segment 中的静态方法
使用用户词典合并粗分结果
combineWhenNotInclude(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
合并,只补充除第一个词典外其他词典的新词
combineWithNormalization(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
对除第一个之外的词典执行标准化,并且合并
CommonAhoCorasickSegmentUtil - com.hankcs.hanlp.seg.Other 中的 类
一个通用的使用AhoCorasickDoubleArrayTrie实现的最长分词器
CommonAhoCorasickSegmentUtil() - 类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 的构造方法
 
CommonDictionary<V> - com.hankcs.hanlp.dictionary.common 中的 类
通用的词典,对应固定格式的词典,但是标签可以泛型化
CommonDictionary() - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 的构造方法
 
CommonDictionary.Searcher - com.hankcs.hanlp.dictionary.common 中的 类
前缀搜索,长短都可匹配
CommonDictionary.Searcher(char[]) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 的构造方法
 
CommonDictionary.Searcher(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 的构造方法
 
CommonDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
 
CommonDictionaryMaker(EasyDictionary) - 类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 的构造方法
 
commonPrefixSearch(String, int, int) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
前缀查询
commonPrefixSearch(String) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
commonPrefixSearch(byte[], int, int) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
Returns the keys that begins with the given key and its corresponding values.
commonPrefixSearch(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
commonPrefixSearch(String, int, int, int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
前缀查询
commonPrefixSearch(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
前缀查询
commonPrefixSearch(char[], int) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
前缀查询
commonPrefixSearchWithValue(char[], int) - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
前缀查询
commonPrefixSearchWithValue(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
前缀查询
commonPrefixSearchWithValue(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
前缀查询,包含值
commonPrefixSearchWithValue(char[], int) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
前缀查询,通过字符数组来表示字符串可以优化运行速度
commonPrefixSearchWithValue(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
已过时。 最好用优化版的
commonPrefixSearchWithValue(char[], int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
优化的前缀查询,可以复用字符数组
CommonStringDictionary - com.hankcs.hanlp.dictionary.common 中的 类
最简单的词典,每一行只有一个词,没别的
CommonStringDictionary() - 类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 的构造方法
 
CommonSuffixExtractor - com.hankcs.hanlp.corpus.dictionary 中的 类
公共后缀提取工具
CommonSuffixExtractor() - 类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 的构造方法
 
CommonSynonymDictionary - com.hankcs.hanlp.dictionary.common 中的 类
一个没有指定资源位置的通用同义词词典
CommonSynonymDictionary.SynonymItem - com.hankcs.hanlp.dictionary.common 中的 类
词典中的一个条目
CommonSynonymDictionary.SynonymItem(Synonym, List<Synonym>, CommonSynonymDictionary.SynonymItem.Type) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 的构造方法
 
CommonSynonymDictionary.SynonymItem(Synonym, List<Synonym>, char) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 的构造方法
 
CommonSynonymDictionary.SynonymItem.Type - com.hankcs.hanlp.dictionary.common 中的 枚举
 
CommonSynonymDictionaryEx - com.hankcs.hanlp.dictionary.common 中的 类
一个没有指定资源位置的通用同义词词典
CommonSynonymDictionaryEx.SynonymItem - com.hankcs.hanlp.dictionary.common 中的 类
词典中的一个条目
CommonSynonymDictionaryEx.SynonymItem(Synonym, Map<String, Synonym>) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 的构造方法
 
compare(Intervalable, Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorByPosition 中的方法
 
compare(Intervalable, Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorBySize 中的方法
 
compare(Long[], Long[]) - 类 com.hankcs.hanlp.algoritm.ArrayCompare 中的静态方法
比较数组A与B的大小关系
compareTo(Object) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
compareTo(SString) - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
compareTo(BaseNode) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
compareTo(char) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
重载,与字符的比较
compareTo(BaseNode<V>.TrieEntry) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry 中的方法
 
compareTo(TermFrequency) - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
 
compareTo(State) - 类 com.hankcs.hanlp.dependency.common.State 中的方法
 
compareTo(State) - 类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的方法
 
compareTo(QueueElement) - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的方法
 
compareTo(CharArray) - 类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 中的方法
 
compareTo(IdVector) - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的方法
 
compareTo(PinyinKey) - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
 
compile(String, String) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler 中的静态方法
编译,比如将词性为数词的转为##数##
compile(IWord) - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
编译单词
compile(Word) - 类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
将一个单词编译为等效字串
compile(IWord) - 类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
 
compiledWord - 类 com.hankcs.hanlp.dependency.common.Node 中的变量
 
compilePOS(Nature) - 类 com.hankcs.hanlp.dependency.common.POSUtil 中的静态方法
 
compileWithoutNS(List<IWord>) - 类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
在忽略ns的前提下预编译
compileWithoutNT(List<IWord>) - 类 com.hankcs.hanlp.corpus.util.Precompiler 中的静态方法
在忽略ns的前提下预编译
CompoundWord - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
复合词,由两个或以上的word构成
CompoundWord(List<Word>, String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 的构造方法
 
compute(Graph) - 类 com.hankcs.hanlp.algoritm.Dijkstra 中的静态方法
 
compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
 
compute(long[], long[]) - 类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
 
compute(int[], int[]) - 类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
 
compute(char[], char[]) - 类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
编辑距离
compute(char[], char[]) - 类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 中的静态方法
 
compute(String, String) - 类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 中的静态方法
 
compute(char[], char[]) - 类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 中的静态方法
 
compute(String, String) - 类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 中的静态方法
 
compute(long[], long[]) - 类 com.hankcs.hanlp.algoritm.VectorDistance 中的静态方法
 
compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.algoritm.VectorDistance 中的静态方法
 
compute(int[], int[], double[], double[][], double[][]) - 类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
求解HMM模型,所有概率请提前取对数
compute(List<Vertex>, TransformMatrixDictionary<Nature>) - 类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
特化版的求解HMM模型
compute(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
处理语料,准备词典
compute() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
输入数据完毕,执行计算
compute(List<Term>) - 类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的静态方法
 
compute(String) - 类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的静态方法
 
compute(List<Term>) - 类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的静态方法
 
compute(String) - 类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的静态方法
 
compute(List<Term>) - 类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的静态方法
 
compute(String) - 类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的静态方法
 
computeAverageDistance(Long[], Long[]) - 类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
 
computeEnum(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
标准版的Viterbi算法,查准率高,效率稍低
computeEnumSimply(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 com.hankcs.hanlp.algoritm.Viterbi 中的静态方法
仅仅利用了转移矩阵的“维特比”算法
computeLeftEntropy(PairFrequency) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
计算左熵
computeMinimumDistance(TreeSet<Long>, TreeSet<Long>) - 类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
 
computeMinimumDistance(Long[], Long[]) - 类 com.hankcs.hanlp.algoritm.ArrayDistance 中的静态方法
 
computeMutualInformation(String, String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
computeMutualInformation(PairFrequency) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
computeRightEntropy(PairFrequency) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
计算右熵
computeScore(LinkedList<double[]>, int) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
给一系列特征函数结合tag打分
computeScore(String) - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
 
computeScore(String) - 接口 com.hankcs.hanlp.suggest.scorer.IScorer 中的方法
计算分值
computeScoreList(Table, int) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
 
Config - com.hankcs.hanlp.seg 中的 类
分词器配置项
Config() - 类 com.hankcs.hanlp.seg.Config 的构造方法
 
config - 类 com.hankcs.hanlp.seg.Segment 中的变量
分词器配置
confirmNature(Nature) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
将属性的词性锁定为nature
confirmNature(Nature, boolean) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
将属性的词性锁定为nature,此重载会降低性能
CoNLLFixer - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
修正一些非10行的依存语料
CoNLLFixer() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 的构造方法
 
CoNllLine - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
CoNLL语料中的一行
CoNllLine(String...) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 的构造方法
 
CoNLLLoader - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
CoNLL格式依存语料加载
CoNLLLoader() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 的构造方法
 
CoNLLSentence - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
CoNLL中的一个句子
CoNLLSentence(List<CoNllLine>) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 的构造方法
构造一个句子
CoNLLSentence(CoNLLWord[]) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 的构造方法
 
CoNLLWord - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
 
CoNLLWord(int, String, String) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
 
CoNLLWord(int, String, String, String) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
 
CoNLLWord(CoNllLine) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
 
CoNLLWord(CoNllLine[], int) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 的构造方法
 
connect(int, int, double) - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
连接两个节点
contains(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
是否包含
Determines whether a String is present in the MDAG.
contains(Object) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
contains(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
 
contains(char) - 类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
 
contains(String) - 类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
 
contains(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
是否含有键
contains(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
是否包含词语
contains(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
词典中是否含有词语
contains(String) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
 
containsAll(Collection<?>) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
containsKey(Object) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
containsKey(String) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
是否包含key
containsKey(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
containsKey(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
containsKey(String) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
containsKey(String) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
是否包含key
containsKey(String, int) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
包含key,且key至少长length
containsKey(String) - 类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 中的静态方法
是否包含key
containsKey(String, int) - 类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 中的静态方法
时报包含key,且key至少长length
containsLabel(E) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
 
containsLabel(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
 
containsValue(Object) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
Context - com.hankcs.hanlp.model.maxent 中的 类
将参数与特征关联起来的类,用来储存最大熵的参数,也用来储存模型和经验分布
Context(int[], double[]) - 类 com.hankcs.hanlp.model.maxent.Context 的构造方法
构建一个新的上下文
convert(List<Term>, boolean) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
将分词结果转换为同义词列表
convert(List<Term>, boolean) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
将分词结果转换为同义词列表
CONVERT - 类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态变量
正规化使用的对应表
convert(char) - 类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
将一个字符正规化
convert(char[]) - 类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
 
convert(String) - 类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
 
convert(String) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
文本转拼音
convert(String, boolean) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
文本转拼音
convert(String[]) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
 
convert(String) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
 
convert(String, boolean) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
 
convert(String) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
 
convert(String, int) - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的静态方法
 
convert(List<Vertex>, boolean) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
将一条路径转为最终结果
convert(List<Vertex>) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
将一条路径转为最终结果
convert2Array(String, boolean) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
将拼音文本转化为完整的拼音,支持汉英混合的杂乱文本,注意如果混用拼音和输入法头的话,并不会有多高的准确率,声调也不会准的
convert2CompatibleList(List<List<Word>>) - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
将word列表转为兼容的IWord列表
convert2Document(File) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
convert2DocumentList(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
convert2Pair(String, boolean) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
将混合文本转为拼音
convert2SentenceList(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
convert2SimpleSentenceList(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
convert2Tone5(Pinyin) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
将拼音的音调统统转为5调或者最大的音调
convertFromToneNumber(String) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
 
convertFromToneNumber(String[]) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
 
convertId2String(long) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
convertId2StringWithIndex(long) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
convertIntToTwoChar(int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
 
convertList2Array(List<Pinyin>) - 类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
将列表转为数组
convertPinyinList2TonePinyinList(List<Pinyin>) - 类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
转换List pinyinList到List,其中的String为带声调符号形式
convertSingle(String) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
将单个音节转为拼音
convertString2Id(String) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
convertString2IdWithIndex(String, long) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
convertString2IdWithIndex(String, int) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
convertToneNumber2ToneMark(String) - 类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
Convert tone numbers to tone marks using Unicode

Algorithm for determining location of tone mark

A simple algorithm for determining the vowel on which the tone mark appears is as follows:

First, look for an "a" or an "e".

convertToPinyin(String) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
转为拼音
convertToPinyin(String, boolean) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
 
convertToPinyinArray(String) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
转为拼音
convertToPinyinFirstCharString(String, String, boolean) - 类 com.hankcs.hanlp.HanLP 中的静态方法
转化为拼音(首字母)
convertToPinyinList(String) - 类 com.hankcs.hanlp.HanLP 中的静态方法
转化为拼音
convertToPinyinString(String, String, boolean) - 类 com.hankcs.hanlp.HanLP 中的静态方法
转化为拼音
convertToSimplifiedChinese(String) - 类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 中的静态方法
 
convertToSimplifiedChinese(char[]) - 类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 中的静态方法
 
convertToSimplifiedChinese(String) - 类 com.hankcs.hanlp.HanLP 中的静态方法
简转繁
convertToTraditionalChinese(String) - 类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 中的静态方法
 
convertToTraditionalChinese(char[]) - 类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 中的静态方法
 
convertToTraditionalChinese(String) - 类 com.hankcs.hanlp.HanLP 中的静态方法
繁转简
convertTwoCharToInt(char, char) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
 
copy() - 类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 中的方法
 
copy() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
复制自己
CoreBiGramMixDictionary - com.hankcs.hanlp.dictionary 中的 类
核心词典的二元接续词典,混合采用词ID和词本身储存
CoreBiGramMixDictionary() - 类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 的构造方法
 
CoreBiGramTableDictionary - com.hankcs.hanlp.dictionary 中的 类
核心词典的二元接续词典,采用整型储存,高性能
CoreBiGramTableDictionary() - 类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 的构造方法
 
CoreDictionary - com.hankcs.hanlp.dictionary 中的 类
使用DoubleArrayTrie实现的核心词典
CoreDictionary() - 类 com.hankcs.hanlp.dictionary.CoreDictionary 的构造方法
 
CoreDictionary.Attribute - com.hankcs.hanlp.dictionary 中的 类
核心词典中的词属性
CoreDictionary.Attribute(int) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
 
CoreDictionary.Attribute(Nature[], int[]) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
 
CoreDictionary.Attribute(Nature, int) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
 
CoreDictionary.Attribute(Nature[], int[], int) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
 
CoreDictionary.Attribute(Nature) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 的构造方法
使用单个词性,默认词频1000构造
CoreDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
核心词典路径
CoreDictionaryTransformMatrixDictionary - com.hankcs.hanlp.dictionary 中的 类
核心词典词性转移矩阵
CoreDictionaryTransformMatrixDictionary() - 类 com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary 的构造方法
 
CoreDictionaryTransformMatrixDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
核心词典词性转移矩阵路径
CoreStopWordDictionary - com.hankcs.hanlp.dictionary.stopword 中的 类
核心停用词词典
CoreStopWordDictionary() - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 的构造方法
 
CoreStopWordDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
停用词词典路径
CoreSynonymDictionary - com.hankcs.hanlp.dictionary 中的 类
核心同义词词典
CoreSynonymDictionary() - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 的构造方法
 
CoreSynonymDictionaryDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
同义词词典路径
CoreSynonymDictionaryEx - com.hankcs.hanlp.dictionary 中的 类
核心同义词词典
CoreSynonymDictionaryEx() - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 的构造方法
 
CorpusLoader - com.hankcs.hanlp.corpus.document 中的 类
 
CorpusLoader() - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 的构造方法
 
CorpusLoader.Handler - com.hankcs.hanlp.corpus.document 中的 接口
 
CorpusLoader.HandlerThread - com.hankcs.hanlp.corpus.document 中的 类
多线程任务
CorpusLoader.HandlerThread(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 的构造方法
 
CorpusUtil - com.hankcs.hanlp.corpus.util 中的 类
 
CorpusUtil() - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 的构造方法
 
cost - 类 com.hankcs.hanlp.dependency.common.Edge 中的变量
 
cost - 类 com.hankcs.hanlp.dependency.common.State 中的变量
 
cost - 类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的变量
路径花费
count(String, String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
统计 keyword 在 srcText 中的出现次数
CPOSTAG - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
当前词语的词性(粗粒度)
CQueue - com.hankcs.hanlp.seg.NShort.Path 中的 类
一个维护了上次访问位置的优先级队列(最小堆)
CQueue() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 的构造方法
 
create(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的静态方法
 
create(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的静态方法
 
create(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的静态方法
 
create(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.document.Document 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的静态方法
通过参数构造一个单词
create(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.WordFactory 中的静态方法
根据参数字符串产生对应的词语
create(String) - 类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 中的静态方法
 
create(String, char, String) - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的静态方法
构造一个pf
create(String, char, String, String) - 类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的静态方法
构造一个三阶接续,正向
create(String, String, char, String) - 类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的静态方法
构造一个三阶接续,逆向
create(String) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的静态方法
通过类似 Bh06A32= 番茄 西红柿 的字符串构造一系列同义词
create(String[]) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的静态方法
 
create(InputStream) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的静态方法
 
create(InputStream) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的静态方法
 
create(String) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
从文件加载,同时缓存为二进制文件
create(ByteArray) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
从字节流快速加载
createByteArray(String) - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的静态方法
从文件读取一个字节数组
createUndefined(String) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的静态方法
创建一个@类型的词典之外的条目
CRFDependencyModelPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
CRF依存模型
CRFDependencyParser - com.hankcs.hanlp.dependency 中的 类
基于随机条件场的依存句法分析器
CRFDependencyParser() - 类 com.hankcs.hanlp.dependency.CRFDependencyParser 的构造方法
 
CRFModel - com.hankcs.hanlp.model.crf 中的 类
 
CRFModel() - 类 com.hankcs.hanlp.model.crf.CRFModel 的构造方法
 
CRFModel(ITrie<FeatureFunction>) - 类 com.hankcs.hanlp.model.crf.CRFModel 的构造方法
以指定的trie树结构储存内部特征函数
crfModel - 类 com.hankcs.hanlp.model.CRFSegmentModel 中的静态变量
 
CRFSegment - com.hankcs.hanlp.seg.CRF 中的 类
基于CRF的分词器
CRFSegment() - 类 com.hankcs.hanlp.seg.CRF.CRFSegment 的构造方法
 
CRFSegmentModel - com.hankcs.hanlp.model 中的 类
静态CRF分词模型
CRFSegmentModel(ITrie<FeatureFunction>) - 类 com.hankcs.hanlp.model.CRFSegmentModel 的构造方法
以指定的trie树结构储存内部特征函数
CRFSegmentModelPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
CRF分词模型
CT_CHINESE - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
中文字符
CT_CHINESE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_CHINESE - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
中文字符
CT_DELIMITER - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
分隔符"!
CT_DELIMITER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_DELIMITER - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
分隔符"!
CT_INDEX - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
序号
CT_INDEX - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_INDEX - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
序号
CT_LETTER - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
字母
CT_LETTER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_LETTER - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
字母
CT_NUM - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
数字
CT_NUM - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_NUM - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
数字
CT_OTHER - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
其他
CT_OTHER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_OTHER - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
其他
CT_SENTENCE_BEGIN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_SENTENCE_END - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_SINGLE - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态变量
单字节
CT_SINGLE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
CT_SINGLE - 类 com.hankcs.hanlp.utility.TextUtility 中的静态变量
单字节
CustomDictionary - com.hankcs.hanlp.dictionary 中的 类
用户自定义词典
CustomDictionary() - 类 com.hankcs.hanlp.dictionary.CustomDictionary 的构造方法
 
CustomDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
用户自定义词典路径

D

d - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的变量
 
DartMap<V> - com.hankcs.hanlp.collection.dartsclone 中的 类
双数组trie树map,更省内存,原本希望代替DoubleArrayTrie,后来发现效率不够
DartMap(List<String>, List<V>) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 的构造方法
 
dat - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
 
DEBUG - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
开发模式
decorateResultForIndexMode(List<Vertex>, WordNet) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
为了索引模式修饰结果
decrementTargetIncomingTransitionCounts() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
本状态的目标状态们的入度减一 Decrements (by 1) the incoming _transition counts of all of the nodes that are targets of outgoing transitions from this node.
delimiter - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
 
DEPREL - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
当前词语与中心词的依存关系
depth - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的变量
模式串的长度,也是这个状态的深度
depth - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的变量
模式串的长度,也是这个状态的深度
deQueue() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
从队列中取出前面的一个元素
determineMedian(List<Intervalable>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
计算中点
dfs(Trie.IWalker) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
 
dictionary - 类 com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary 中的静态变量
 
dictionary - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
人名词典
dictionary - 类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
地名词典
dictionary - 类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
机构名词典
DictionaryBasedSegment - com.hankcs.hanlp.seg 中的 类
基于词典的机械分词器基类
DictionaryBasedSegment() - 类 com.hankcs.hanlp.seg.DictionaryBasedSegment 的构造方法
 
DictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
一个通用的词典制作工具,词条格式:词 标签 频次
DictionaryMaker() - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 的构造方法
 
DictionaryMaker.Filter - com.hankcs.hanlp.corpus.dictionary 中的 接口
 
DictionaryUtil - com.hankcs.hanlp.corpus.util 中的 类
 
DictionaryUtil() - 类 com.hankcs.hanlp.corpus.util.DictionaryUtil 的构造方法
 
Dijkstra - com.hankcs.hanlp.algoritm 中的 类
最短路径
Dijkstra() - 类 com.hankcs.hanlp.algoritm.Dijkstra 的构造方法
 
DijkstraSegment - com.hankcs.hanlp.seg.Dijkstra 中的 类
最短路径分词
DijkstraSegment() - 类 com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment 的构造方法
 
distance(Synonym) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
语义距离
distance(String, String) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
语义距离
distance(CommonSynonymDictionary.SynonymItem) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的方法
语义距离
distance(String, String) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
语义距离
distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
语义距离
distance(String, String) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
判断两个单词之间的语义距离
distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的方法
 
distance(long[], long[]) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的方法
 
distance(CommonSynonymDictionary.SynonymItem, CommonSynonymDictionary.SynonymItem) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
语义距离
distance(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的方法
 
distance(long[], long[]) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的方法
 
Document - com.hankcs.hanlp.corpus.document 中的 类
 
Document(List<Sentence>) - 类 com.hankcs.hanlp.corpus.document.Document 的构造方法
 
DoubleArray - com.hankcs.hanlp.collection.dartsclone 中的 类
双数组DAWG
DoubleArray() - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 的构造方法
 
DoubleArrayBuilder - com.hankcs.hanlp.collection.dartsclone.details 中的 类
双数组构建者
DoubleArrayBuilder() - 类 com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder 的构造方法
 
DoubleArrayTrie<V> - com.hankcs.hanlp.collection.trie 中的 类
双数组Trie树
DoubleArrayTrie() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 的构造方法
 
DoubleArrayTrie.Searcher - com.hankcs.hanlp.collection.trie 中的 类
一个搜索工具(注意,当调用next()返回false后不应该继续调用next(),除非reset状态)
DoubleArrayTrie.Searcher(int, char[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 的构造方法
构造一个双数组搜索工具
DoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other 中的 类
使用DoubleArrayTrie实现的最长分词器
DoubleArrayTrieSegment() - 类 com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment 的构造方法
 
doubleToBytes(double) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个双精度浮点数转换位字节数组(8个字节),b[0]存储高位字符,大端
dSmoothingPara - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
平滑参数
dTemp - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
Smoothing 平滑因子
dumpEnum(String) - 类 com.hankcs.hanlp.dictionary.py.SYTDictionary 中的静态方法
导出声母表等等

E

e - 类 com.hankcs.hanlp.collection.sequence.SString 中的变量
结束位置,不包含
e(CoNLLSentence, CoNLLSentence) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
 
E - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态变量
末##末
EasyDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
一个通用的、满足特定格式的双数组词典
EasyDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 的构造方法
 
EasyDictionary.Attribute - com.hankcs.hanlp.corpus.dictionary 中的 类
通用词典中的词属性
EasyDictionary.Attribute(int) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
 
EasyDictionary.Attribute(Nature[], int[]) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
 
EasyDictionary.Attribute(Nature, int) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
 
EasyDictionary.Attribute(Nature) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 的构造方法
使用单个词性,默认词频1000构造
EasyDictionary.Searcher - com.hankcs.hanlp.corpus.dictionary 中的 类
 
EasyDictionary.Searcher(char[]) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 的构造方法
 
EasyDictionary.Searcher(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 的构造方法
 
ed(String, String) - 类 com.hankcs.hanlp.algoritm.EditDistance 中的静态方法
编辑距离
Edge - com.hankcs.hanlp.dependency.common 中的 类
一条边
Edge(int, int, String, float) - 类 com.hankcs.hanlp.dependency.common.Edge 的构造方法
 
edge - 类 com.hankcs.hanlp.dependency.common.State 中的变量
 
Edge - com.hankcs.hanlp.seg.common 中的 类
基础边,不允许构造
Edge(double, String) - 类 com.hankcs.hanlp.seg.common.Edge 的构造方法
 
EdgeFrom - com.hankcs.hanlp.seg.common 中的 类
记录了起点的边
EdgeFrom(int, double, String) - 类 com.hankcs.hanlp.seg.common.EdgeFrom 的构造方法
 
edgesTo - 类 com.hankcs.hanlp.seg.common.Graph 中的变量
边,到达下标i
EditDistance - com.hankcs.hanlp.algoritm 中的 类
基于语义距离的编辑距离实现
EditDistance() - 类 com.hankcs.hanlp.algoritm.EditDistance 的构造方法
 
EditDistanceScorer - com.hankcs.hanlp.suggest.scorer.editdistance 中的 类
编辑距离打分器
EditDistanceScorer() - 类 com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer 的构造方法
 
Emit - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
一个模式串匹配结果
Emit(int, int, String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 的构造方法
构造一个模式串匹配结果
emit() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
获取这个节点代表的模式串(们)
emit() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
获取这个节点代表的模式串(们)
enableAllNamedEntityRecognize(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
 
enableAllNamedEntityRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用所有的命名实体识别
enableCustomDictionary(boolean) - 类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
 
enableCustomDictionary(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用用户词典
enableDebug() - 类 com.hankcs.hanlp.HanLP.Config 中的静态方法
开启调试模式(会降低性能)
enableDebug(boolean) - 类 com.hankcs.hanlp.HanLP.Config 中的静态方法
开启调试模式(会降低性能)
enableIndexMode(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
设为索引模式
enableJapaneseNameRecognize(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
是否启用日本人名识别
enableJapaneseNameRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用日本人名识别
enableMultithreading(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启多线程
enableMultithreading(int) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启多线程
enableNameRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启人名识别
enableNumberQuantifierRecognize(boolean) - 类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的方法
 
enableNumberQuantifierRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用数词和数量词识别
即[二, 十, 一] => [二十一],[十, 九, 元] => [十九元]
enableOffset(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
是否启用偏移量计算(开启后Term.offset才会被计算)
enableOffset(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用偏移量计算(开启后Term.offset才会被计算)
enableOrganizationRecognize(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
开启机构名识别
enableOrganizationRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启机构名识别
enablePartOfSpeechTagging(boolean) - 类 com.hankcs.hanlp.seg.DictionaryBasedSegment 中的方法
开启数词和英文识别(与标准意义上的词性标注不同,只是借用这个配置方法,不是真的开启了词性标注。
enablePartOfSpeechTagging(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
开启词性标注
enablePartOfSpeechTagging(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启词性标注
enablePlaceRecognize(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
开启地名识别
enablePlaceRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
开启地名识别
enableTranslatedNameRecognize(boolean) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
是否启用音译人名识别
enableTranslatedNameRecognize(boolean) - 类 com.hankcs.hanlp.seg.Segment 中的方法
是否启用音译人名识别
end - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
模式串在母文本中的终止位置
endsWith(String) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
词语是否以该词典中的某个单词结尾
enQueue(QueueElement) - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
将QueueElement根据eWeight由小到大的顺序插入队列
entry - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
条目的key
entrySet() - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
entrySet() - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
entrySet() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
获取键值对集合
entrySet() - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
浏览所有词条
entrySet() - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
获取键值对集合
entrySet() - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
键值对
EnumItem<E extends Enum<E>> - com.hankcs.hanlp.corpus.dictionary.item 中的 类
对标签-频次的封装
EnumItem() - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
 
EnumItem(E, Integer) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
创建只有一个标签的条目
EnumItem(E...) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 的构造方法
创建一个条目,其标签频次都是1,各标签由参数指定
equals(Object) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
equals(Object) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
两个状态是否等价,只有状态转移函数完全一致才算相等
Evaluates the equality of this node with another object.
equals(Object) - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
equivalenceClassMDAGNodeHashMap - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
等价类集合,相当于论文中的register
eval(String[]) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
预测分布
eval(String[], double[]) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
预测分布
eval(int[], double[], EvalParameters) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的静态方法
预测
EvalParameters - com.hankcs.hanlp.model.maxent 中的 类
封装了模型用来计算概率的一些参数
EvalParameters(Context[], double, double, int) - 类 com.hankcs.hanlp.model.maxent.EvalParameters 的构造方法
创建一个参数,可被用于预测
EvalParameters(Context[], int) - 类 com.hankcs.hanlp.model.maxent.EvalParameters 的构造方法
 
Evaluator - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
测试工具
Evaluator() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 的构造方法
 
exactMatchSearch(String) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
精确匹配
exactMatchSearch(String) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
Returns the corresponding value if the key is found.
exactMatchSearch(byte[]) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
Returns the corresponding value if the key is found.
exactMatchSearch(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
精确匹配
exactMatchSearch(String, int, int, int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
exactMatchSearch(char[], int, int, int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
精确查询
exceptionToString(Exception) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
将异常转为字符串
exists(String) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
extract(String, int) - 类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 中的静态方法
一句话提取
extractKeyword(String, int) - 类 com.hankcs.hanlp.HanLP 中的静态方法
提取关键词
extractPhrase(String, int) - 类 com.hankcs.hanlp.HanLP 中的静态方法
提取短语
extractPhrase(String, int) - 接口 com.hankcs.hanlp.phrase.IPhraseExtractor 中的方法
提取短语
extractPhrase(String, int) - 类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 中的方法
 
extractSuffix(int, int, boolean) - 类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
提取公共后缀
extractSuffixByWords(int, int, boolean) - 类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
此方法认为后缀一定是整个的词语,所以length是以词语为单位的
extractSuffixExtended(int, int) - 类 com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor 中的方法
 
extractSummary(String, int) - 类 com.hankcs.hanlp.HanLP 中的静态方法
自动摘要

F

failure() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
获取failure状态
failure() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
获取failure状态
FamilyName - com.hankcs.hanlp.corpus.nr 中的 类
 
FamilyName() - 类 com.hankcs.hanlp.corpus.nr.FamilyName 的构造方法
 
FeatureFunction - com.hankcs.hanlp.model.crf 中的 类
特征函数,其实是tag.size个特征函数的集合
FeatureFunction(char[], int) - 类 com.hankcs.hanlp.model.crf.FeatureFunction 的构造方法
 
FeatureFunction() - 类 com.hankcs.hanlp.model.crf.FeatureFunction 的构造方法
 
FeatureTemplate - com.hankcs.hanlp.model.crf 中的 类
特征模板
FeatureTemplate() - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 的构造方法
 
fileList - 类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 中的变量
这个线程负责处理这些事情
FILTER - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态变量
核心停用词典的核心过滤器
Filter - com.hankcs.hanlp.dictionary.stopword 中的 接口
停用词词典过滤器
findOverlappingRanges(IntervalNode, Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的静态方法
是对IntervalNode.findOverlaps(Intervalable)的一个包装,防止NPE
findOverlaps(Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 中的方法
寻找与interval有重叠的区间
findOverlaps(Intervalable) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 中的方法
寻找重叠区间
first - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的变量
 
first - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
 
fix(String) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 中的静态方法
 
fixResultByRule(List<Vertex>) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
通过规则修正一些结果
floatToBytes(float) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个浮点数转换为字节数组(4个字节),b[0]存储高位字符,大端
FolderWalker - com.hankcs.hanlp.corpus.io 中的 类
遍历目录工具类
FolderWalker() - 类 com.hankcs.hanlp.corpus.io.FolderWalker 的构造方法
 
FragmentToken - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
 
FragmentToken(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 的构造方法
 
freq(String) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
freq(char[]...) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
freq(char...) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
frequency - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
词性对应的词频
frequency - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
词性对应的词频
from - 类 com.hankcs.hanlp.dependency.common.Edge 中的变量
 
from - 类 com.hankcs.hanlp.seg.common.EdgeFrom 中的变量
 
from - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
到该节点的最短路径的前驱节点
from - 类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的变量
节点前驱
from - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
边的起点

G

GenerateBiGraph(WordNet) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
生成二元词图
generateKey(String) - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
生成能够代表这个句子的键
generateKey(String) - 类 com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer 中的方法
 
generateKey(String) - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer 中的方法
 
generateKey(String) - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer 中的方法
 
generateParameter(Table, int) - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
 
generateSingleWordContext(CoNLLWord[], int, String) - 类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
 
generateUniContext(CoNLLWord[], int, int) - 类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
 
GenerateWord(List<Vertex>, WordNet) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
对粗分结果执行一些规则上的合并拆分等等,同时合成新词网
GenerateWordNet(WordNet) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的方法
生成一元词网
get(String) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
获取值
get(int) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
get(Object) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
get(String) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
get(Object) - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
get(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
get(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
get(char[]) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
get(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
精确查询
get(char[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
get(int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
get(char[]) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
get(String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
get(IWord) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
get(String) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
查询一个单词
get(String) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
查找是否有该后缀
get(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
查询一个单词
get(String) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
 
get(String) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
 
get(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
获取条目
get(int) - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
获取条目
get(String) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
 
get(String) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
 
get(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
查单词
get(String) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
 
get(char) - 类 com.hankcs.hanlp.dictionary.other.CharType 中的静态方法
获取字符的类型
get(String) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
 
get(String) - 类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 中的静态方法
 
get(String, String, String, String) - 类 com.hankcs.hanlp.model.bigram.BigramDependencyModel 中的静态方法
获取一个词和另一个词最可能的依存关系
get(String) - 类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
 
get(String, String) - 类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
 
get(int, int) - 类 com.hankcs.hanlp.model.crf.Table 中的方法
获取表中某一个元素
get(char[]...) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
get(char...) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
get(int) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
获取某一行的所有节点
get(int, int) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
获取某一行长度为length的节点
getAllStrings() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
取出所有key
Retrieves all the valid Strings that have been inserted in to the MDAG.
getAttribute() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
获取词的属性
getBase() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
获取base数组引用,不要修改base
getBestPath() - 类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
获取唯一一条最短路径,当然最短路径可能不只一条
getBiFrequency(String, String) - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
已过时。 获取共现频次
getBiFrequency(String) - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
已过时。 获取共现频次
getBiFrequency(String, String) - 类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
获取共现频次
getBiFrequency(int, int) - 类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
获取共现频次
getBytes() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
获取全部字节
getBytes(InputStream) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
getChar() - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
getChar() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
getCharCount(String, String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
得到字符集的字符在字符串中出现的次数
getCheck() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
获取check数组引用,不要修改check
getChild(char) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
获取子节点
getChild(char) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
getChild(char) - 类 com.hankcs.hanlp.collection.trie.bintrie.Node 中的方法
 
getComplexSentenceList() - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
getConstantInverse() - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
getCorrectionConstant() - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
getCorrectionParam() - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
getDA() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
 
getDepth() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
获取节点深度
getDepth() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
获取节点深度
getEdge(Node, Node) - 类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 中的静态方法
打分
getEdgeArray() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
获取边的列表,edge[i][j]表示id为i的词语与j存在一条依存关系为该值的边,否则为null
getEdgeListTo(int) - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
获取到达顶点to的边列表
getEdgesTo() - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
 
getEmit() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 中的方法
 
getEmit() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 中的方法
 
getEmit() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
 
getEnd() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
getEnd() - 接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
终点
getEntrySet() - 类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 中的方法
 
getFirst() - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
 
getFirst(int) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
获取某一行的第一个节点
GetFirst() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
读取第一个元素,但不执行DeQueue操作
getFirstChar() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取首字母
getFirstCharArray() - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
 
getFragment() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
 
getFrequency(E) - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
 
getFrequency(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
 
getFrequency(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
获取频次
getFrequency() - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
 
getFrequency(String, String) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
获取转移频次
getFrequency(E, E) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
获取转移频次
getHead() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取输入法头
getHeadString() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取输入法头
getId() - 接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
获取ID
getId() - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
 
getIdString() - 接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
获取字符类型的ID
getIdString() - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
 
getIncomingTransitionCount() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Retrieves this node's incoming _transition count
getIndex() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
getInputStream(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
智能获取InputStream,如果是资源文件则返回相应的InputStream
getKey() - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
 
getKeyword() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 中的方法
获取对应的模式串
getKeyword(String) - 类 com.hankcs.hanlp.summary.TextRankKeyword 中的方法
 
getKeywordList(String, int) - 类 com.hankcs.hanlp.summary.TextRankKeyword 中的静态方法
提取关键词
getLA() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
 
getLabel() - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
 
getLabel() - 接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
 
getLabel() - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
 
getLargestValueId() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
获取最大的值
getLength() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
 
getLetter() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Retrieves the character representing the _transition laben leading up to this node.
getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
获取语义标签
getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx 中的静态方法
获取语义标签
getLongestSuffixLength(String) - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 中的方法
获取最长的后缀
getMaxSynonymItemIdDistance() - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
获取最大id
getMostLikelyLabel() - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
 
getNature() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
获取该节点的词性,如果词性还未确定,则返回null
getNature() - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的方法
原子的词性
getNatureFrequency(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
已过时。 推荐使用Nature参数!
getNatureFrequency(Nature) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
获取词性的词频
getNatureFrequency(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
已过时。 推荐使用Nature参数!
getNatureFrequency(Nature) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
获取词性的词频
GetNext() - 类 com.hankcs.hanlp.seg.NShort.Path.CQueue 中的方法
读取上次读取后的下一个元素,不执行DeQueue操作
getNonzeroSize() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getNPaths(int) - 类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
从短到长获取至多 n 条路径
getNPaths() - 类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
获取前10条最短路径
getNumOutcomes() - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
getOffset() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
 
getOffset() - 类 com.hankcs.hanlp.dictionary.BaseSearcher 中的方法
获取当前偏移
getOffset() - 类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
获取当前偏移,如果想要知道next分出的词string的起始偏移,那么用 getOffset() - string.length 就行了。
getOutcomes() - 类 com.hankcs.hanlp.model.maxent.Context 中的方法
获取输出
getOutgoingTransitionCount() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Retrieves this node's outgoing _transition count.
getOutgoingTransitions() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Retrieves this node's outgoing transitions.
getOutgoingTransitionSetSize() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Retrieves the size of this node's outgoing _transition set.
getPairFrequency(String, String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
getParameters() - 类 com.hankcs.hanlp.model.maxent.Context 中的方法
获取参数
getParams() - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
getPaths(int) - 类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 中的方法
获取前index+1短的路径
getPhraseByLe() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
getPhraseByMi() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
getPhraseByRe() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
getPhraseByScore() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
getPinyin(int) - 类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 中的静态方法
 
getPinyinWithoutTone() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取纯字母的拼音
getPinyinWithToneMark() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取带音调的拼音
getRealWord() - 接口 com.hankcs.hanlp.corpus.synonym.ISynonym 中的方法
获取原本的词语
getRealWord() - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
 
getRealWord() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
获取真实词
getSearcher(String, int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getSearcher(char[], int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getSearcher(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
 
getSearcher(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
 
getSearcher(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
 
getSearcher(char[]) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
获取一个BinTrie的查询工具
getSearcher(char[]) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态方法
 
getSearcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
 
getSearcher(char[], DoubleArrayTrie<String>) - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
 
getSecond() - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
 
getShengmu() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取声母
getSimpleMDAGArray() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
获取简化后的状态Array
Returns the array of SimpleMDAGNodes collectively containing the data of this MDAG, or null if it hasn't been simplified yet.
getSimpleSentenceList() - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
获取简单的句子列表,其中复合词会被拆分为简单词
getSimpleSentenceList(boolean) - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
获取简单的句子列表
getSimpleSentenceList(Set<String>) - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
getSimpleWordList() - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
 
getSize() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getStart() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
getStart() - 接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
起点
getStates() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
 
getStates() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
getStatus() - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
获取节点的成词状态
getStringsEndingWith(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
后缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
getStringsStartingWith(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
前缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
getStringsWithSubstring(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
返回包含字串的key
Retrieves all the Strings in the MDAG that contain a given String.
getSuccess() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
获取goto表
getsum() - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
getTagId(String) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
获取某个tag的ID
getTerm() - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
 
getTermFrequency(String) - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
获取词频
getTermFrequency(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
获取词频
getTone() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取声调
getTopSentence(int) - 类 com.hankcs.hanlp.summary.TextRankSentence 中的方法
获取前几个关键句子
getTopSentenceList(String, int) - 类 com.hankcs.hanlp.summary.TextRankSentence 中的静态方法
一句话调用接口
getTotalFrequency() - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
获取全部频次
getTotalFrequency(E) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
获取e的总频次
getTotalFrequency() - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
获取所有标签的总频次
getTotalSize() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getTransitionPathNodes(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
获取一个字符串路径上经过的节点
Retrieves the nodes in the _transition path starting from this node corresponding to a given String .
getTransitions() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
 
getTransitions() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
getTransitionSetBeginIndex() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Retrieves the index in a simplified mdag data array that the SimpleMDAGNode representation of this node's outgoing _transition set begins at.
getTransitionSetBeginIndex() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Retrieves the index in this node's containing array that its _transition set begins at.
getTrie() - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
已过时。 谨慎操作,有可能废弃此接口
getTrie() - 类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
 
getUA() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
 
getUnitSize() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getUnsigned(byte) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
获取字节对应的无符号整型数
getValue() - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
 
getValue() - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
获取节点对应的值
getValue() - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
 
getValue() - 接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
 
getValue() - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
 
getValueArray(V[]) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
getValueArray(V[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
getValueArray(V[]) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
getValueAt(int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
获取index对应的值
getVertexes() - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
 
getVertexes() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
获取内部顶点表格,谨慎操作!
getWordArrayWithRoot() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
获取包含根节点在内的单词数组
getWordID(String) - 类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 中的静态方法
获取词语的ID
getWordID(String) - 类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态方法
获取词语的ID
getWordID(String) - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态方法
获取词语的ID
GetWordInfo(String) - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary 中的方法
 
getWordList() - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
获取单词序列
getYunmu() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的方法
获取韵母
Graph - com.hankcs.hanlp.seg.common 中的 类
 
Graph(Vertex[]) - 类 com.hankcs.hanlp.seg.common.Graph 的构造方法
将一个词网转为词图
Graph - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
 
Graph(List<Vertex>[]) - 类 com.hankcs.hanlp.seg.Viterbi.Path.Graph 的构造方法
 
guessNature() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
猜测最可能的词性,也就是这个节点的词性中出现频率最大的那一个词性

H

handle(Document) - 接口 com.hankcs.hanlp.corpus.document.CorpusLoader.Handler 中的方法
 
HanLP - com.hankcs.hanlp 中的 类
HanLP: Han Language Processing
汉语言处理包
常用接口工具类
HanLP.Config - com.hankcs.hanlp 中的 类
库的全局配置,既可以用代码修改,也可以通过hanlp.properties配置(按照 变量名=值 的形式)
HanLP.Config() - 类 com.hankcs.hanlp.HanLP.Config 的构造方法
 
hasChild(char) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
是否含有子节点
hashCode() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
hashCode() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Hashes this node using its accept state status and set of outgoing _transition paths.
hasMore() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
 
hasNature(Nature) - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
是否有某个词性
hasNature(Nature) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
 
hasNature(List<Term>, Nature) - 类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
句子中是否含有词性
hasNext() - 类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
 
hasOutgoingTransition(char) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Determines whether this node has an outgoing _transition with a given label.
hasTransitions() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Determines whether this node has any outgoing transitions.
haveSameTransitions(MDAGNode, MDAGNode) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的静态方法
是否含有相同的转移函数
HEAD - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
当前词语的中心词
Head - com.hankcs.hanlp.dictionary.py 中的 枚举
拼音输入法头
hit(int, int, V) - 接口 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHit 中的方法
命中一个模式串
hit(int, int, V, int) - 接口 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.IHitFull 中的方法
命中一个模式串
HMMSegment - com.hankcs.hanlp.seg.HMM 中的 类
基于2阶HMM(A Second-Order Hidden Markov Model, TriGram3阶文法模型)+ BMES序列标注的分词器
HMMSegment() - 类 com.hankcs.hanlp.seg.HMM.HMMSegment 的构造方法
 
HMMSegmentModelPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
HMM分词模型

I

ICacheAble - com.hankcs.hanlp.corpus.io 中的 接口
可写入或读取二进制
id - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的变量
第一个值化为id
ID - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
ID 当前词在句子中的序号,1开始.
id - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
 
id - 类 com.hankcs.hanlp.dependency.common.Node 中的变量
 
id - 类 com.hankcs.hanlp.dependency.common.State 中的变量
 
id2tag - 类 com.hankcs.hanlp.model.crf.CRFModel 中的变量
 
idArrayList - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的变量
 
IdVector - com.hankcs.hanlp.suggest.scorer.lexeme 中的 类
一个同义词有多个id,多个同义词用这个封装做key
IdVector(String) - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 的构造方法
 
IdVector(List<Long[]>) - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 的构造方法
 
IdVectorScorer - com.hankcs.hanlp.suggest.scorer.lexeme 中的 类
单词语义向量打分器
IdVectorScorer() - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer 的构造方法
 
increase(int) - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
频次增加若干
increase() - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 中的方法
频次加一
index - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
key的字典序坐标
index - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
在一维顶点数组中的下标,可以视作这个顶点的id
index - 类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的变量
节点在顶点数组中的下标
index - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
边的终点在顶点数组中的下标
indexMode - 类 com.hankcs.hanlp.seg.Config 中的变量
是否是索引分词(合理地最小分割)
IndexTokenizer - com.hankcs.hanlp.tokenizer 中的 类
索引分词器
IndexTokenizer() - 类 com.hankcs.hanlp.tokenizer.IndexTokenizer 的构造方法
 
INFINITE_VALUE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
innerList - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的变量
由这些词复合而来
insert(String, String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
往自定义词典中插入一个新词(覆盖模式)
insert(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
以覆盖模式增加新词
insert(int, Vertex, WordNet) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
添加顶点,同时检查此顶点是否悬孤,如果悬孤则自动补全
Integer2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
将整型转为拼音
Integer2PinyinConverter() - 类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 的构造方法
 
Interval - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
区间
Interval(int, int) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 的构造方法
构造一个区间
Intervalable - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 接口
区间接口
IntervalableComparatorByPosition - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
按起点比较区间
IntervalableComparatorByPosition() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorByPosition 的构造方法
 
IntervalableComparatorBySize - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
按照长度比较区间,如果长度相同,则比较起点
IntervalableComparatorBySize() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalableComparatorBySize 的构造方法
 
IntervalNode - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
线段树上面的节点,实际上是一些区间的集合,并且按中点维护了两个节点
IntervalNode(List<Intervalable>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalNode 的构造方法
构造一个节点
IntervalTree - com.hankcs.hanlp.algoritm.ahocorasick.interval 中的 类
线段树,用于检查区间重叠
IntervalTree(List<Intervalable>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 的构造方法
构造线段树
intToBytes(int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个整数转换位字节数组(4个字节),b[0]存储高位字符,大端
IOUtil - com.hankcs.hanlp.corpus.io 中的 类
一些常用的IO操作
IOUtil() - 类 com.hankcs.hanlp.corpus.io.IOUtil 的构造方法
 
IOUtil.LineIterator - com.hankcs.hanlp.corpus.io 中的 类
方便读取按行读取大文件
IOUtil.LineIterator(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 的构造方法
 
IPhraseExtractor - com.hankcs.hanlp.phrase 中的 接口
从一篇文章中自动识别出最可能的短语
isAcceptable() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
是否是终止状态
isAcceptNode() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Retrieves the accept state status of this node.
isAcceptNode() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Retrieves the accept state status of this node.
isAllChinese(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是中文
isAllChineseNum(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是中国数字
isAllDelimiter(byte[]) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是分隔符
isAllIndex(byte[]) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是序号
isAllLetter(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全为英文
isAllLetterOrNum(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全为英文或字母
isAllNonChinese(byte[]) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全部不是中文
isAllNum(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是数字
isAllowOverlaps() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的方法
是否允许重叠
isAllSingleByte(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
是否全是单字节
isArabicNumber(char) - 类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
 
ISaveAble - com.hankcs.hanlp.corpus.dictionary 中的 接口
 
isBlank(CharSequence) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断字符串是否为空(null和空格)
isBlankOrNull(String) - 类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
 
isChinese(char) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断某个字符是否为汉字
isCJKCharacter(char) - 类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
 
isConfluenceNode() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Determines if this node is a confluence node (defined as a node with two or more incoming transitions
IScorer - com.hankcs.hanlp.suggest.scorer 中的 接口
打分接口
isDBCCase(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断该字符串是否是半角字符
isDelimiter(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断是否是一个连字符(分隔符)
isEmpty() - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
isEmpty() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
isEnglishLetter(char) - 类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
 
ISentenceKey<T> - com.hankcs.hanlp.suggest.scorer 中的 接口
可以唯一代表一个句子的键,可以与其他句子区别开来
isFileExists(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
判断文件是否存在
isInAggregate(String, String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断一个字符串的所有字符是否在另一个字符串集合中
isMatch() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.FragmentToken 中的方法
 
isMatch() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 中的方法
 
isMatch() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
 
isResource(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
判断资源是否位于jar中
isRight() - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的方法
 
isSBCCase(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断该字符串是否是全角字符
isSpaceLetter(char) - 类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
 
ISuggester - com.hankcs.hanlp.suggest 中的 接口
 
isUnknownWord(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
 
isYearTime(String) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
判断字符串是否是年份
ISynonym - com.hankcs.hanlp.corpus.synonym 中的 接口
同义词接口
Item - com.hankcs.hanlp.corpus.dictionary.item 中的 类
词典中的一个条目,比如“希望 v 7685 vn 616”
Item(String, String) - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 的构造方法
 
Item(String) - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 的构造方法
 
iterator() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
ITrie<V> - com.hankcs.hanlp.collection.trie 中的 接口
trie树接口
IWord - com.hankcs.hanlp.corpus.document.sentence.word 中的 接口
词语接口

J

japaneseNameRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别日本人名
JapanesePersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
 
JapanesePersonDictionary() - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 的构造方法
 
JapanesePersonDictionary.Searcher - com.hankcs.hanlp.dictionary.nr 中的 类
最长分词
JapanesePersonDictionary.Searcher(char[], DoubleArrayTrie<Character>) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 的构造方法
 
JapanesePersonDictionary.Searcher(String, DoubleArrayTrie<Character>) - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 的构造方法
 
JapanesePersonDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
日本人名词典路径
JapanesePersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
日本人名识别
JapanesePersonRecognition() - 类 com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition 的构造方法
 

K

key - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的变量
该条目的索引,比如“啊”
keySet() - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
Keyset - com.hankcs.hanlp.collection.dartsclone.details 中的 类
key set,其实也包含值(每个key都有一个整型数)
Keyset(byte[][], int[]) - 类 com.hankcs.hanlp.collection.dartsclone.details.Keyset 的构造方法
构造一个KeySet
keySet() - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
keySet() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
键集合
keySet() - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
keySet() - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
键集合
keySet() - 类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 中的方法
 
KeywordExtractor - com.hankcs.hanlp.summary 中的 类
提取关键词的基类
KeywordExtractor() - 类 com.hankcs.hanlp.summary.KeywordExtractor 的构造方法
 

L

l - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
每个key的长度
label - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的变量
 
label - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的变量
单词的标签,比如“n”
label - 类 com.hankcs.hanlp.dependency.common.Edge 中的变量
 
label - 类 com.hankcs.hanlp.dependency.common.Node 中的变量
 
label - 类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
 
labelMap - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的变量
 
labelMap - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的变量
该条目的标签
labelSet() - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
le - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
左信息熵
learn(List<Word>) - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
让模型观测一个句子
LEMMA - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
当前词语(或标点)的原型或词干,在中文中,此列与FORM相同
length() - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
length - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
key的长度
length() - 类 com.hankcs.hanlp.seg.common.Term 中的方法
长度
LITTLE_FREQUENCY - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
load(ObjectInputStream, V[]) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
载入
load(ByteArray, V[]) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
载入
load(ByteArray) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
 
load(String, V[]) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
从磁盘加载二分数组树
load(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
只加载值,此时相当于一个set
load(ByteArray, _ValueArray) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
load(ByteArray, V[]) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
load(String, List<V>) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
从磁盘加载,需要额外提供值
load(String, V[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
从磁盘加载,需要额外提供值
load(ByteArray, V[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
load(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
载入双数组,但是不提供值,此时本trie相当于一个set
load(ByteArray, V[]) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
load(String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
从磁盘加载
load(String) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
 
load(String, String) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
加载词典
load(String) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 中的静态方法
加载词典
load(ByteArray) - 接口 com.hankcs.hanlp.corpus.io.ICacheAble 中的方法
 
load(String) - 类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
 
load(String) - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
已过时。  
load(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
 
load(String) - 类 com.hankcs.hanlp.dictionary.common.CommonStringDictionary 中的方法
 
load(InputStream) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary 中的方法
 
load(InputStream) - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx 中的方法
 
load(String, Nature, TreeMap<String, CoreDictionary.Attribute>) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
加载用户词典(追加)
load(String) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.model.crf.FeatureFunction 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
 
load(ByteArray) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
loadAsItemList(String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
读取所有条目
loadCorpus(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
loadSentenceList(String) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 中的静态方法
 
loadSentenceList(String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
loadTxt(String, CRFModel) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
 
loadTxt(String) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的静态方法
 
logger - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
日志组件
logPrior(double[]) - 类 com.hankcs.hanlp.model.maxent.UniformPrior 中的方法
获取先验概率
long2char(long) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
转换long型为char数组
long2String(long) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
转换long类型为string
LongestBinSegmentToy<V> - com.hankcs.hanlp.seg.Other 中的 类
最长分词玩具
LongestBinSegmentToy(BinTrie<V>) - 类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 的构造方法
 
LongestCommonSubsequence - com.hankcs.hanlp.algoritm 中的 类
 
LongestCommonSubsequence() - 类 com.hankcs.hanlp.algoritm.LongestCommonSubsequence 的构造方法
 
LongestCommonSubstring - com.hankcs.hanlp.algoritm 中的 类
求最长公共字串的长度
LongestCommonSubstring() - 类 com.hankcs.hanlp.algoritm.LongestCommonSubstring 的构造方法
 
longToBytes(long) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
将一个长整数转换位字节数组(8个字节),b[0]存储高位字符,大端

M

M - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态变量
M_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.nr.FamilyName 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态方法
 
main(String[]) - 类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。
main(String[]) - 类 com.hankcs.hanlp.summary.TextRankSentence 中的静态方法
 
makeEdge(Node[], int, int) - 类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 中的方法
 
makeEdge(Node[], int, int) - 类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 中的方法
 
makeEdge(Node[], int, int) - 类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 中的方法
 
makeModel(String, String) - 类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 中的静态方法
 
makeModel(String, String) - 类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
 
makeToneToTheSame(List<Pinyin>) - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态方法
将所有音调都转为1
MatchToken - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
匹配到的片段
MatchToken(String, Emit) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.MatchToken 的构造方法
 
MathTools - com.hankcs.hanlp.utility 中的 类
 
MathTools() - 类 com.hankcs.hanlp.utility.MathTools 的构造方法
 
matrix - 类 com.hankcs.hanlp.model.crf.CRFModel 中的变量
tag的转移矩阵
MAX_FREQUENCY - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_INDEX_LENGTH - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态变量
尾数的长度,表示原子词的index
MAX_POS_PER_WORD - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_SEGMENT_NUM - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_SENTENCE_LEN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_UNKNOWN_PER_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_WORDS - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 中的静态变量
同一行最多支持编码这么多个单词
MAX_WORDS - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MAX_WORDS_PER_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MaxEntDependencyModelMaker - com.hankcs.hanlp.corpus.dependency.model 中的 类
最大熵模型构建工具,训练暂时不使用自己的代码,借用opennlp训练。
MaxEntDependencyModelMaker() - 类 com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker 的构造方法
 
MaxEntDependencyParser - com.hankcs.hanlp.dependency 中的 类
最大熵句法分析器
MaxEntDependencyParser() - 类 com.hankcs.hanlp.dependency.MaxEntDependencyParser 的构造方法
 
MaxEntModel - com.hankcs.hanlp.model.maxent 中的 类
最大熵模型,采用双数组Trie树加速,值得拥有
MaxEntModel() - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 的构造方法
 
MaxEntModelPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
最大熵-依存关系模型
MDAG - com.hankcs.hanlp.collection.MDAG 中的 类
最小环形图
A minimalistic directed acyclical graph suitable for storing a set of Strings.
MDAG(File) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
从一个文件建立MDAG
Creates an MDAG from a newline delimited file containing the data of interest.
MDAG(Collection<String>) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
Creates an MDAG from a collection of Strings.
MDAG() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 的构造方法
空白图
mdagDataArray - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
调用simplify()后填充此空间
MDAGMap<V> - com.hankcs.hanlp.collection.MDAG 中的 类
最好不要把MDAG当map用,现在的实现在key后面放一个int,导致右语言全部不同,退化为bintrie
MDAGMap() - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 的构造方法
 
MDAGNode - com.hankcs.hanlp.collection.MDAG 中的 类
MDAG中的一个节点
The class which represents a node in a MDAG.
MDAGNode(boolean) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 的构造方法
建立一个节点
Constructs an MDAGNode.
MDAGSet - com.hankcs.hanlp.collection.MDAG 中的 类
基于MDAG(又称DAWG,Minimal Acyclic Finite-State Automata)的String Set
MDAGSet(File) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
 
MDAGSet(Collection<String>) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
 
MDAGSet() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 的构造方法
 
meet(String, State) - 接口 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie.IWalker 中的方法
遇到了一个节点
mergeContinuousNsIntoOne() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
将连续的ns节点合并为一个
mergeNumberQuantifier(List<Vertex>, WordNet, Config) - 类 com.hankcs.hanlp.seg.Segment 中的方法
合并数字
mi - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
互信息值
MIN_PROBABILITY - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MIN_PROBLEM - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
MinimumSpanningTreeParser - com.hankcs.hanlp.dependency 中的 类
 
MinimumSpanningTreeParser() - 类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 的构造方法
 
MutualInformationEntropyPhraseExtractor - com.hankcs.hanlp.phrase 中的 类
利用互信息和左右熵的短语提取器
MutualInformationEntropyPhraseExtractor() - 类 com.hankcs.hanlp.phrase.MutualInformationEntropyPhraseExtractor 的构造方法
 

N

NAME - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
等效字符串
NameDictionaryMaker - com.hankcs.hanlp.corpus.nr 中的 类
 
NameDictionaryMaker() - 类 com.hankcs.hanlp.corpus.nr.NameDictionaryMaker 的构造方法
 
nameRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别中国人名
nature - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
词性列表
Nature - com.hankcs.hanlp.corpus.tag 中的 枚举
词性
nature - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
词性列表
nature - 类 com.hankcs.hanlp.seg.common.Term 中的变量
词性
NatureDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
 
NatureDictionaryMaker() - 类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 的构造方法
 
ner - 类 com.hankcs.hanlp.seg.Config 中的变量
命名实体识别是否至少有一项被激活
newAddressInstance(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个地名实例
newB() - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
生成线程安全的起始节点
newE() - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
生成线程安全的终止节点
newJapanesePersonInstance(String, int) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个日本人名实例
newNumberInstance(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个数词实例
newOrganizationInstance(String, int) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个机构名实例
newPersonInstance(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个人名实例
newPersonInstance(String, int) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个人名实例
newPlaceInstance(String, int) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个地名实例
newPunctuationInstance(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个标点符号实例
newSegment() - 类 com.hankcs.hanlp.HanLP 中的静态方法
创建一个分词器
这是一个工厂方法
与直接new一个分词器相比,使用本方法的好处是,以后HanLP升级了,总能用上最合适的分词器
newTimeInstance(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个时间实例
newTranslatedPersonInstance(String, int) - 类 com.hankcs.hanlp.seg.common.Vertex 中的静态方法
创建一个音译人名实例
newValueArray() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
next() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的方法
取出下一个命中输出
next() - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher 中的方法
 
next() - 类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
 
next() - 类 com.hankcs.hanlp.dictionary.BaseSearcher 中的方法
分出下一个词
next() - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary.Searcher 中的方法
 
next() - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher 中的方法
 
next() - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 中的方法
 
next() - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher 中的方法
 
next() - 类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 中的方法
 
next - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
下一个,这是一个链表结构的最小堆
next() - 类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
 
nextByte() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个字节
nextChar() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个char,对应于writeChar
nextDouble() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
 
nextFloat() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
 
nextInt() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个int
nextState(Character) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
按照character转移,根节点转移失败会返回自己(永远不会返回null)
nextState(Character) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
按照character转移,根节点转移失败会返回自己(永远不会返回null)
nextStateIgnoreRootState(Character) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
按照character转移,任何节点转移失败会返回null
nextStateIgnoreRootState(Character) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
按照character转移,任何节点转移失败会返回null
nextString() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个String,注意这个String是双字节版的,在字符之前有一个整型表示长度
nextUnsignedShort() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个无符号短整型
nextUTF() - 类 com.hankcs.hanlp.corpus.io.ByteArray 中的方法
读取一个UTF字符串
nextValue() - 类 com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray 中的方法
 
nextValue() - 类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 中的方法
 
NGramDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
2-gram词典制作工具
NGramDictionaryMaker() - 类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 的构造方法
 
NLPTokenizer - com.hankcs.hanlp.tokenizer 中的 类
可供自然语言处理用的分词器
NLPTokenizer() - 类 com.hankcs.hanlp.tokenizer.NLPTokenizer 的构造方法
 
Node<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
深度大于等于2的子节点
Node(char, BaseNode.Status, V) - 类 com.hankcs.hanlp.collection.trie.bintrie.Node 的构造方法
 
Node() - 类 com.hankcs.hanlp.collection.trie.bintrie.Node 的构造方法
 
Node - com.hankcs.hanlp.dependency.common 中的 类
节点
Node(Term, int) - 类 com.hankcs.hanlp.dependency.common.Node 的构造方法
 
Node - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
 
Node(Vertex) - 类 com.hankcs.hanlp.seg.Viterbi.Path.Node 的构造方法
 
nonZero(double) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
防止频率为0发生除零错误
normalization(char[]) - 类 com.hankcs.hanlp.dictionary.other.CharTable 中的静态方法
正规化一些字符(原地正规化)
Normalization - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
是否执行字符正规化(繁体->简体,全角->半角,大写->小写),切换配置后必须删CustomDictionary.txt.bin缓存
normalizeFrequency(List<Item>) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的静态方法
调整频次,按排序后的次序给定频次
NotionalTokenizer - com.hankcs.hanlp.tokenizer 中的 类
实词分词器,自动移除停用词
NotionalTokenizer() - 类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 的构造方法
 
nPOS - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的变量
 
NR - com.hankcs.hanlp.corpus.tag 中的 枚举
人名标签
NR_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
NRConstant - com.hankcs.hanlp.dictionary.nr 中的 类
人名识别中常用的一些常量
NRConstant() - 类 com.hankcs.hanlp.dictionary.nr.NRConstant 的构造方法
 
NRCorpusLoader - com.hankcs.hanlp.corpus.nr 中的 类
对人名语料的解析,并且生成词典
NRCorpusLoader() - 类 com.hankcs.hanlp.corpus.nr.NRCorpusLoader 的构造方法
 
NRDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
一个好用的人名词典
NRDictionary() - 类 com.hankcs.hanlp.dictionary.nr.NRDictionary 的构造方法
 
NRDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
nr词典(词典+ngram转移+词性转移矩阵)制作工具
NRDictionaryMaker(EasyDictionary) - 类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 的构造方法
 
NRPattern - com.hankcs.hanlp.dictionary.nr 中的 枚举
人名识别模式串
NS - com.hankcs.hanlp.corpus.tag 中的 枚举
地名角色标签
NS_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
NSDictionary - com.hankcs.hanlp.dictionary.ns 中的 类
一个好用的地名词典
NSDictionary() - 类 com.hankcs.hanlp.dictionary.ns.NSDictionary 的构造方法
 
NSDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
 
NSDictionaryMaker(EasyDictionary) - 类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 的构造方法
 
NShortPath - com.hankcs.hanlp.seg.NShort.Path 中的 类
 
NShortPath(Graph, int) - 类 com.hankcs.hanlp.seg.NShort.Path.NShortPath 的构造方法
构造一个N最短路径计算器
NShortSegment - com.hankcs.hanlp.seg.NShort 中的 类
N最短分词器
NShortSegment() - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 的构造方法
 
NT - com.hankcs.hanlp.corpus.tag 中的 枚举
 
NT_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
NTDictionary - com.hankcs.hanlp.dictionary.nt 中的 类
一个好用的地名词典
NTDictionary() - 类 com.hankcs.hanlp.dictionary.nt.NTDictionary 的构造方法
 
NTDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
 
NTDictionaryMaker(EasyDictionary) - 类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 的构造方法
 
NULL - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的静态变量
空白节点,用于描述下标超出word数组的词语
NULL - 类 com.hankcs.hanlp.dependency.common.Node 中的静态变量
 
numberQuantifierRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别数字和量词
NX_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 

O

Occurrence - com.hankcs.hanlp.corpus.occurrence 中的 类
词共现统计,最多统计到三阶共现
Occurrence() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 的构造方法
 
offset - 类 com.hankcs.hanlp.dictionary.BaseSearcher 中的变量
指向当前处理字串的开始位置(前面的已经分词分完了)
offset - 类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
 
offset - 类 com.hankcs.hanlp.seg.common.Term 中的变量
在文本中的起始位置(需开启分词器的offset选项)
offset - 类 com.hankcs.hanlp.seg.Config 中的变量
是否计算偏移量
onGenerateEntry(String) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
由参数构造一个词条
onGenerateEntry(String) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
 
onGenerateEntry(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
 
onLoadTxtFinished() - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
 
onLoadValue(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
实现此方法来加载值
onLoadValue(String) - 类 com.hankcs.hanlp.dictionary.nr.NRDictionary 中的方法
 
onLoadValue(String) - 类 com.hankcs.hanlp.dictionary.ns.NSDictionary 中的方法
 
onLoadValue(String) - 类 com.hankcs.hanlp.dictionary.nt.NTDictionary 中的方法
 
onSave(Item) - 接口 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker.Filter 中的方法
是否保存这个条目
onSaveValue(V[], String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
 
onSaveValue(EnumItem<NR>[], String) - 类 com.hankcs.hanlp.dictionary.nr.NRDictionary 中的方法
 
onSaveValue(EnumItem<NS>[], String) - 类 com.hankcs.hanlp.dictionary.ns.NSDictionary 中的方法
 
onSaveValue(EnumItem<NT>[], String) - 类 com.hankcs.hanlp.dictionary.nt.NTDictionary 中的方法
 
open(InputStream) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
Read from a stream.
open(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
open(String) - 类 com.hankcs.hanlp.corpus.io.FolderWalker 中的静态方法
打开一个目录,获取全部的文件名
ordinaryMax - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
内部标签下标最大值不超过这个值,用于矩阵创建
OrganizationDictionary - com.hankcs.hanlp.dictionary.nt 中的 类
机构名识别用的词典,实际上是对两个词典的包装
OrganizationDictionary() - 类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 的构造方法
 
OrganizationDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
地名词典路径
OrganizationDictionaryTrPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
地名词典转移矩阵路径
OrganizationRecognition - com.hankcs.hanlp.recognition.nt 中的 类
地址识别
OrganizationRecognition() - 类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 的构造方法
 
organizationRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别机构
outcomeNames - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的变量
事件名
outcomes - 类 com.hankcs.hanlp.model.maxent.Context 中的变量
输出(标签)
output(int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
检查状态是否对应输出
overlapsWith(Interval) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
是否与另一个区间交叉(有一部分重叠)
overlapsWith(int) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
区间是否覆盖了这个点

P

Pair<T,U> - com.hankcs.hanlp.collection.dartsclone 中的 类
模拟C++中的pair,也兼容JavaFX中的Pair
Pair(T, U) - 类 com.hankcs.hanlp.collection.dartsclone.Pair 的构造方法
 
PairFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
一个二元的词串的频度
PairFrequency(String, Integer) - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 的构造方法
 
PairFrequency(String) - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 的构造方法
 
parameters - 类 com.hankcs.hanlp.model.maxent.Context 中的变量
参数
parse(List<Term>) - 类 com.hankcs.hanlp.dependency.AbstractDependencyParser 中的方法
 
parse(List<Term>) - 类 com.hankcs.hanlp.dependency.CRFDependencyParser 中的方法
 
parse(List<Term>) - 类 com.hankcs.hanlp.dependency.MinimumSpanningTreeParser 中的方法
 
parse(String) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的静态方法
一句话分词
parseDependency(String) - 类 com.hankcs.hanlp.HanLP 中的静态方法
依存文法分析
parsePath(int[]) - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
根据节点下标数组解释出对应的路径
parsePattern(List<NR>, List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态方法
模式匹配
parsePattern(List<NS>, List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态方法
模式匹配
parsePattern(List<NT>, List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态方法
模式匹配
parseResult(List<Vertex>) - 类 com.hankcs.hanlp.seg.common.Graph 中的静态方法
从一个路径中转换出空格隔开的结果
parseText(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
模式匹配
parseText(String) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
匹配母文本
parseText(String, AhoCorasickDoubleArrayTrie.IHit<V>) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHit<V>) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHitFull<V>) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
处理文本
parseText(char[], AhoCorasickDoubleArrayTrie.IHit<CoreDictionary.Attribute>) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
解析一段文本(目前采用了BinTrie+DAT的混合储存形式,此方法可以统一两个数据结构)
path - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态变量
已过时。  
path - 类 com.hankcs.hanlp.dictionary.CoreBiGramMixDictionary 中的静态变量
 
path - 类 com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary 中的静态变量
 
path - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
path - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
第一个是主词典,其他是副词典
PathNode - com.hankcs.hanlp.seg.NShort.Path 中的 类
路径上的节点
PathNode(int, int) - 类 com.hankcs.hanlp.seg.NShort.Path.PathNode 的构造方法
构造一个节点
PATTERN - 类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态变量
匹配&或全角状态字符或标点
PATTERN_FLOAT_NUMBER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
浮点数正则
PersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
人名识别用的词典,实际上是对两个词典的包装
PersonDictionary() - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 的构造方法
 
PersonDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
人名词典路径
PersonDictionaryTrPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
人名词典转移矩阵路径
PersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
人名识别
PersonRecognition() - 类 com.hankcs.hanlp.recognition.nr.PersonRecognition 的构造方法
 
Pinyin - com.hankcs.hanlp.dictionary.py 中的 枚举
拼音,组成部分=声母+韵母+声调12345
PinyinDictionary - com.hankcs.hanlp.dictionary.py 中的 类
 
PinyinDictionary() - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 的构造方法
 
PinyinDictionary.Searcher - com.hankcs.hanlp.dictionary.py 中的 类
 
PinyinDictionary.Searcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 的构造方法
 
PinyinDictionary.Searcher(String, DoubleArrayTrie<Pinyin[]>) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher 的构造方法
 
PinyinDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
拼音词典路径
PinyinKey - com.hankcs.hanlp.suggest.scorer.pinyin 中的 类
 
PinyinKey(String) - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 的构造方法
 
pinyins - 类 com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter 中的静态变量
 
pinyins - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态变量
 
PinyinScorer - com.hankcs.hanlp.suggest.scorer.pinyin 中的 类
拼音打分器
PinyinScorer() - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer 的构造方法
 
PinyinUtil - com.hankcs.hanlp.dictionary.py 中的 类
 
PinyinUtil() - 类 com.hankcs.hanlp.dictionary.py.PinyinUtil 的构造方法
 
PlaceDictionary - com.hankcs.hanlp.dictionary.ns 中的 类
地名识别用的词典,实际上是对两个词典的包装
PlaceDictionary() - 类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 的构造方法
 
PlaceDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
地名词典路径
PlaceDictionaryTrPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
地名词典转移矩阵路径
PlaceRecognition - com.hankcs.hanlp.recognition.ns 中的 类
地址识别
PlaceRecognition() - 类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 的构造方法
 
placeRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别地名
PlaceSuffixDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
做一个简单的封装
PlaceSuffixDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.PlaceSuffixDictionary 的构造方法
 
POSTAG - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的变量
当前词语的词性(细粒度)
PosTagCompiler - com.hankcs.hanlp.corpus.dependency.CoNll 中的 类
等效词编译器
PosTagCompiler() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler 的构造方法
 
POSTFIX_MUTIPLE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
POSTFIX_SINGLE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
POSUtil - com.hankcs.hanlp.dependency.common 中的 类
词性操作工具类
POSUtil() - 类 com.hankcs.hanlp.dependency.common.POSUtil 的构造方法
 
Precompiler - com.hankcs.hanlp.corpus.util 中的 类
预编译与反编译一些词语
Precompiler() - 类 com.hankcs.hanlp.corpus.util.Precompiler 的构造方法
 
Predefine - com.hankcs.hanlp.utility 中的 类
一些预定义的静态全局变量
Predefine() - 类 com.hankcs.hanlp.utility.Predefine 的构造方法
 
predict(String[]) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
预测分布
predict(Collection<String>) - 类 com.hankcs.hanlp.model.maxent.MaxEntModel 中的方法
预测分布
prefixSearch(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
前缀查询
printByTo() - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
 
Probability - com.hankcs.hanlp.model.trigram.frequency 中的 类
概率统计工具
Probability() - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 的构造方法
 
push(int, Vertex) - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
强行添加,替换已有的顶点
put(String, V) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
put(String, V) - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
put(String, V) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
插入一个词
put(char[], V) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
putAll(Map<? extends String, ? extends V>) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 

Q

QueueElement - com.hankcs.hanlp.seg.NShort.Path 中的 类
 
QueueElement(int, int, double) - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 的构造方法
构造一个边节点
quickAtomSegment(char[], int, int) - 类 com.hankcs.hanlp.seg.Segment 中的静态方法
快速原子分词,希望用这个方法替换掉原来缓慢的方法

R

re - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
右信息熵
readBytes(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
将整个文件读取为字节数组
readBytesFromResource(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
将资源中的一个资源读入byte数组
readCsv(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
readLine(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
readLineList(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
readLineListWithLessMemory(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
用省内存的方式读取大文件
readObjectFrom(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
反序列化对象
readTxt(String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
一次性读入纯文本
realWord - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
 
realWord - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
节点对应的真实词,绝对不含##
reassignOutgoingTransition(char, MDAGNode, MDAGNode) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
重新设置转移状态函数的目标 Reassigns the target node of one of this node's outgoing transitions.
Recognition(List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.recognition.nr.JapanesePersonRecognition 中的静态方法
执行识别
Recognition(List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
 
Recognition(List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition 中的静态方法
执行识别
Recognition(List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
 
Recognition(List<Vertex>, WordNet, WordNet) - 类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
 
regularize(char) - 类 com.hankcs.hanlp.utility.CharacterHelper 中的静态方法
进行字符规格化(全角转半角,大写转小写处理)
remainLongest() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
只保留最长匹配
remainLongest - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的变量
只保留最长匹配
remove(Object) - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
remove(Object) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
remove(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
删除一个词
remove(Map.Entry<String, V>) - 接口 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary.Filter 中的方法
 
remove(SimpleDictionary.Filter) - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
过滤部分词条
remove() - 类 com.hankcs.hanlp.corpus.io.IOUtil.LineIterator 中的方法
 
remove(String) - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态方法
删除单词
remove(String) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
从停用词词典中删除停用词
removeAll(Collection<?>) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
removeOutgoingTransition(char) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
移除一个转移目标
Removes a _transition labeled with a given char.
removeOverlaps(List<Intervalable>) - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.IntervalTree 中的方法
从区间列表中移除重叠的区间
removeOverlaps() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
 
removeString(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
Removes a String from the MDAG.
removeTone(Pinyin) - 类 com.hankcs.hanlp.dictionary.py.PinyinUtil 中的静态方法
 
replaceSpecialtyStr(String, String, String) - 类 com.hankcs.hanlp.corpus.util.StringUtils 中的静态方法
 
reset(BufferedReader) - 类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 中的方法
重置分词器
reset(String) - 类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
将分词器复原或置为准备工作的状态
ResultTerm<V> - com.hankcs.hanlp.seg.common 中的 类
一个通用的Term
ResultTerm(String, V, int) - 类 com.hankcs.hanlp.seg.common.ResultTerm 的构造方法
 
retainAll(Collection<?>) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
reverse() - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
将自己逆转过来返回
REVERSE_EXT - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
逆转后缀名
RIGHT - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的静态变量
两个词的正向连接符 中国 RIGHT 人民
roleTag(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
角色标注,如果子类要进行label的调整或增加新的首尾等等,可以在此进行
roleTag(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker 中的方法
 
roleTag(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker 中的方法
 
roleTag(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker 中的方法
 
roleTag(List<List<IWord>>) - 类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
 
roleTag(List<Vertex>) - 类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
 
roleTag(List<Vertex>, WordNet) - 类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
 
roleTag(List<Vertex>, WordNet) - 类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
 
ROOT - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的静态变量
根节点
run() - 类 com.hankcs.hanlp.corpus.document.CorpusLoader.HandlerThread 中的方法
 

S

samples() - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
持久化
save(ObjectOutputStream) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
持久化
save(OutputStream) - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
Saves the trie data into a stream.
save(DataOutputStream) - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
 
save(String) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
保存到二进制输出流
save(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
将base和check保存下来
save(ObjectOutputStream) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
save(DataOutputStream) - 接口 com.hankcs.hanlp.collection.trie.ITrie 中的方法
 
save(String) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的方法
保存词典
save(DataOutputStream) - 接口 com.hankcs.hanlp.corpus.io.ICacheAble 中的方法
写入
save(DataOutputStream) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.model.crf.FeatureFunction 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
 
save(DataOutputStream) - 类 com.hankcs.hanlp.model.trigram.frequency.Probability 中的方法
 
saveCollectionToTxt(Collection<T>, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
saveCorpus(List<Document>, String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
saveEntrySetToTxt(Set<Map.Entry<Object, Object>>, String, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
saveKeyTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
仅仅将值保存到文件
saveMapToTxt(Map<Object, Object>, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
saveMapToTxt(Map<Object, Object>, String, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
saveNGramToTxt(String) - 类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
保存NGram词典
saveObjectTo(Object, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
序列化对象
saveSentenceList(List<List<IWord>>, String) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
saveTransformMatrixToTxt(String) - 类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
保存转移矩阵
saveTxt(String, String) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
快速保存
saveTxt(String, StringBuilder) - 类 com.hankcs.hanlp.corpus.io.IOUtil 中的静态方法
 
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker 中的方法
 
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
saveTxtTo(String, DictionaryMaker.Filter) - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
允许保存之前对其做一些调整
saveTxtTo(String) - 接口 com.hankcs.hanlp.corpus.dictionary.ISaveAble 中的方法
将自己以文本文档的方式保存到磁盘
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker 中的方法
保存NGram词典和转移矩阵
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker 中的方法
 
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
 
saveTxtTo(String) - 类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
 
score - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
分数
second - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的变量
 
second - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的变量
 
seg(String) - 类 com.hankcs.hanlp.seg.Other.LongestBinSegmentToy 中的方法
 
seg(String) - 类 com.hankcs.hanlp.seg.Segment 中的方法
分词
seg(char[]) - 类 com.hankcs.hanlp.seg.Segment 中的方法
分词
seg2sentence(String) - 类 com.hankcs.hanlp.seg.Segment 中的方法
分词断句 输出句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
切分为句子形式
seg2sentence(String, Filter...) - 类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
切分为句子形式
seg2sentence(String) - 类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
切分为句子形式
segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
用最长分词算法匹配拼音
segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>, boolean) - 类 com.hankcs.hanlp.dictionary.py.PinyinDictionary 中的静态方法
 
segLongest(char[], DoubleArrayTrie<String>) - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
 
segLongest(char[], AhoCorasickDoubleArrayTrie<String>) - 类 com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary 中的静态方法
 
segment(String) - 类 com.hankcs.hanlp.HanLP 中的静态方法
分词
segment(char[], AhoCorasickDoubleArrayTrie<V>) - 类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 中的静态方法
最长分词,合并未知语素
Segment - com.hankcs.hanlp.seg 中的 类
分词器(分词服务)
是所有分词器的基类(Abstract)
分词器的分词方法是线程安全的,但配置方法则不保证
Segment() - 类 com.hankcs.hanlp.seg.Segment 的构造方法
构造一个分词器
SEGMENT - 类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
分词
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.BasicTokenizer 中的静态方法
分词
SEGMENT - 类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
 
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.IndexTokenizer 中的静态方法
分词
SEGMENT - 类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
 
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.NLPTokenizer 中的静态方法
分词
segment(String) - 类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
 
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.NotionalTokenizer 中的静态方法
分词
SEGMENT - 类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
 
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 中的静态方法
分词
SEGMENT - 类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
分词
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.StandardTokenizer 中的静态方法
分词
SEGMENT - 类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态变量
预置分词器
segment(String) - 类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
 
segment(char[]) - 类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 中的静态方法
分词
segmentReverseOrder(char[], AhoCorasickDoubleArrayTrie<V>) - 类 com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil 中的静态方法
逆向最长分词,合并未知语素
SegmentWrapper - com.hankcs.hanlp.seg.common.wrapper 中的 类
一个将BufferedReader wrap进来的类
SegmentWrapper(BufferedReader, Segment) - 类 com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper 的构造方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.CRF.CRFSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.HMM.HMMSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.NShort.NShortSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment 中的方法
 
segSentence(char[]) - 类 com.hankcs.hanlp.seg.Segment 中的方法
给一个句子分词
segSentence(char[]) - 类 com.hankcs.hanlp.seg.Viterbi.ViterbiSegment 中的方法
 
Sentence - com.hankcs.hanlp.corpus.document.sentence 中的 类
句子,指的是以。
Sentence(List<IWord>) - 类 com.hankcs.hanlp.corpus.document.sentence.Sentence 的构造方法
 
sentence - 类 com.hankcs.hanlp.seg.common.WordNet 中的变量
已过时。 应当使用数组,这样比较快
SENTENCE_BEGIN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
SENTENCE_END - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
sentenceList - 类 com.hankcs.hanlp.corpus.document.Document 中的变量
 
SentencesUtil - com.hankcs.hanlp.utility 中的 类
文本断句
SentencesUtil() - 类 com.hankcs.hanlp.utility.SentencesUtil 的构造方法
 
separator - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 中的变量
key value之间的分隔符
SEPERATOR_C_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
SEPERATOR_C_SUB_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
SEPERATOR_E_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
SEPERATOR_E_SUB_SENTENCE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
SEPERATOR_LINK - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
serializeTo(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
将自己序列化到
set(String, V) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
更新某个键对应的值
set(String, V) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
更新某个键对应的值
setAcceptStateStatus(boolean) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Sets this node's accept state status.
setAllowOverlaps(boolean) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 中的方法
设置是否允许重叠
setBoost(double) - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的方法
设置权重
setCorrectionParam(double) - 类 com.hankcs.hanlp.model.maxent.EvalParameters 中的方法
 
setFailure(State) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
设置failure状态
setFailure(State, int[]) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
设置failure状态
setIndex(int) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
setLabel(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
 
setLabel(String) - 接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
 
setLabel(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
 
setLabels(String[]) - 类 com.hankcs.hanlp.model.maxent.UniformPrior 中的方法
初始化
setLast(int, String) - 类 com.hankcs.hanlp.model.crf.Table 中的方法
 
setRealWord(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
 
setTransitionSetBeginIndex(int) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
转移状态在数组中的起始下标
Records the index that this node's _transition set starts at in an array containing this node's containing MDAG data (simplified MDAG).
setTransitionSetBeginIndex(int) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Records the index in this node's containing array that its _transition set begins at.
setTrie(AhoCorasickDoubleArrayTrie<CoreDictionary.Attribute>) - 类 com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment 中的方法
 
setValue(V[]) - 类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 中的方法
 
setValue(V) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
设置节点对应的值
setValue(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
 
setValue(String) - 接口 com.hankcs.hanlp.corpus.document.sentence.word.IWord 中的方法
 
setValue(String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
 
setWord(String) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
 
Shengmu - com.hankcs.hanlp.dictionary.py 中的 枚举
声母
shouldInclude(Term) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词,并且不在停用词表中
shouldInclude(Term) - 接口 com.hankcs.hanlp.dictionary.stopword.Filter 中的方法
是否应当将这个term纳入计算
shouldInclude(Term) - 类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 中的方法
 
shouldInclude(Term) - 类 com.hankcs.hanlp.summary.KeywordExtractor 中的方法
是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词
shouldRemove(Term) - 类 com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary 中的静态方法
是否应当去掉这个词
ShowTermNature - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
分词结果是否展示词性
sim(List<String>, int) - 类 com.hankcs.hanlp.summary.BM25 中的方法
 
simAll(List<String>) - 类 com.hankcs.hanlp.summary.BM25 中的方法
 
similarity(String, String) - 类 com.hankcs.hanlp.dictionary.CoreSynonymDictionary 中的静态方法
计算两个单词之间的相似度,0表示不相似,1表示完全相似
similarity(CharArray) - 类 com.hankcs.hanlp.suggest.scorer.editdistance.CharArray 中的方法
 
similarity(T) - 接口 com.hankcs.hanlp.suggest.scorer.ISentenceKey 中的方法
 
similarity(IdVector) - 类 com.hankcs.hanlp.suggest.scorer.lexeme.IdVector 中的方法
 
similarity(PinyinKey) - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
 
simpleAtomSegment(char[], int, int) - 类 com.hankcs.hanlp.seg.Segment 中的静态方法
简易原子分词,将所有字放到一起作为一个词
SimpleDictionary<V> - com.hankcs.hanlp.corpus.dictionary 中的 类
可以调整大小的词典
SimpleDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 的构造方法
 
SimpleDictionary.Filter<V> - com.hankcs.hanlp.corpus.dictionary 中的 接口
 
SimpleGraph - com.hankcs.hanlp.seg.Viterbi.Path 中的 类
 
SimpleGraph(LinkedList<Vertex>[]) - 类 com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph 的构造方法
 
SimpleItem - com.hankcs.hanlp.corpus.dictionary.item 中的 类
 
SimpleItem() - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 的构造方法
 
SimpleMDAGNode - com.hankcs.hanlp.collection.MDAG 中的 类
The class capable of representing a MDAG node, its _transition set, and one of its incoming transitions; objects of this class are used to represent a MDAG after its been simplified in order to save space.
SimpleMDAGNode(char, boolean, int) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 的构造方法
Constructs a SimpleMDAGNode.
SimpleMDAGNode() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 的构造方法
 
SimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
简体=繁体词典
SimplifiedChineseDictionary() - 类 com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary 的构造方法
 
simplifiedSourceNode - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
简化后的根节点(简化指的是用数组简化,而不是最小化,这个结构永远是最小化的)
simplify() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
固化自己
Creates a space-saving version of the MDAG in the form of an array.
simplify() - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
进一步降低内存,提高查询速度
副作用是下次插入速度会变慢
size() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
size() - 接口 com.hankcs.hanlp.algoritm.ahocorasick.interval.Intervalable 中的方法
长度
size - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
base 和 check 的大小
size() - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
大小,即包含多少个模式串
size() - 类 com.hankcs.hanlp.collection.dartsclone.DoubleArray 中的方法
大小
size() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
size() - 类 com.hankcs.hanlp.collection.trie.bintrie.BinTrie 中的方法
 
size - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
base 和 check 的大小
size() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
树叶子节点个数
size() - 类 com.hankcs.hanlp.corpus.dictionary.SimpleDictionary 中的方法
 
size() - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的方法
词典大小
size() - 类 com.hankcs.hanlp.model.crf.Table 中的方法
 
size() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
 
size() - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
拼音的个数
sort(String) - 类 com.hankcs.hanlp.dictionary.common.CommonDictionary 中的静态方法
排序这个词典
sortDictionary(String) - 类 com.hankcs.hanlp.corpus.util.DictionaryUtil 中的静态方法
给某个字典排序
sourceNode - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
根节点
speechTagging - 类 com.hankcs.hanlp.seg.Config 中的变量
词性标注
speechTagging(List<Vertex>) - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 中的静态方法
词性标注
SpeedTokenizer - com.hankcs.hanlp.tokenizer 中的 类
极速分词,基于Double Array Trie实现的词典分词,适用于“高吞吐量”“精度一般”的场合
SpeedTokenizer() - 类 com.hankcs.hanlp.tokenizer.SpeedTokenizer 的构造方法
 
spilt(List<IWord>) - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态方法
 
SString - com.hankcs.hanlp.collection.sequence 中的 类
(SimpleString)字符串,为了公用内存,避免值传递,优化运行效率而设置的String的替代品
SString(char[], int, int) - 类 com.hankcs.hanlp.collection.sequence.SString 的构造方法
建立一个字符串
SString(String) - 类 com.hankcs.hanlp.collection.sequence.SString 的构造方法
 
StandardTokenizer - com.hankcs.hanlp.tokenizer 中的 类
标准分词器
StandardTokenizer() - 类 com.hankcs.hanlp.tokenizer.StandardTokenizer 的构造方法
 
start_probability - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
初始概率
State - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
一个状态有如下几个功能

success; 成功转移到另一个状态 failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点 emits; 命中一个模式串

根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。

State() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 的构造方法
构造深度为0的节点
State(int) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 的构造方法
构造深度为depth的节点
State - com.hankcs.hanlp.collection.AhoCorasick 中的 类
一个状态有如下几个功能

success; 成功转移到另一个状态 failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点 emits; 命中一个模式串

根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。

State() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 的构造方法
构造深度为0的节点
State(int) - 类 com.hankcs.hanlp.collection.AhoCorasick.State 的构造方法
构造深度为depth的节点
State - com.hankcs.hanlp.dependency.common 中的 类
 
State(float, int, Edge) - 类 com.hankcs.hanlp.dependency.common.State 的构造方法
 
State - com.hankcs.hanlp.seg.Dijkstra.Path 中的 类
 
State(double, int) - 类 com.hankcs.hanlp.seg.Dijkstra.Path.State 的构造方法
 
states - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
隐状态
status - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
节点状态
StopWordDictionary - com.hankcs.hanlp.dictionary.stopword 中的 类
 
StopWordDictionary(File) - 类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
 
StopWordDictionary(Collection<String>) - 类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
 
StopWordDictionary() - 类 com.hankcs.hanlp.dictionary.stopword.StopWordDictionary 的构造方法
 
storage - 类 com.hankcs.hanlp.suggest.scorer.BaseScorer 中的变量
储存
String2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
汉字转拼音,提供拼音字符串转拼音,支持汉英混合的杂乱文本
String2PinyinConverter() - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 的构造方法
 
StringDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
满足 key=value 格式的词典,其中“=”可以自定义
StringDictionary(String) - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 的构造方法
 
StringDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionary 的构造方法
 
StringDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
方便的工厂类
StringDictionaryMaker() - 类 com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker 的构造方法
 
StringUtils - com.hankcs.hanlp.corpus.util 中的 类
 
StringUtils() - 类 com.hankcs.hanlp.corpus.util.StringUtils 的构造方法
 
subSequence(int, int) - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
SuffixDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
后缀树词典
SuffixDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.SuffixDictionary 的构造方法
 
suggest(String, int) - 接口 com.hankcs.hanlp.suggest.ISuggester 中的方法
根据一个输入的句子推荐相似的句子
suggest(String, int) - 类 com.hankcs.hanlp.suggest.Suggester 中的方法
 
Suggester - com.hankcs.hanlp.suggest 中的 类
文本推荐器
Suggester() - 类 com.hankcs.hanlp.suggest.Suggester 的构造方法
 
Suggester(List<BaseScorer>) - 类 com.hankcs.hanlp.suggest.Suggester 的构造方法
 
Suggester(BaseScorer...) - 类 com.hankcs.hanlp.suggest.Suggester 的构造方法
构造一个推荐器
sWord - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的变量
 
Synonym - com.hankcs.hanlp.corpus.synonym 中的 类
同义词
Synonym(String, String) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
已过时。 
Synonym(String, long) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
已过时。 
Synonym(String, long, Synonym.Type) - 类 com.hankcs.hanlp.corpus.synonym.Synonym 的构造方法
 
Synonym.Type - com.hankcs.hanlp.corpus.synonym 中的 枚举
 
SynonymHelper - com.hankcs.hanlp.corpus.synonym 中的 类
一个Util
SynonymHelper() - 类 com.hankcs.hanlp.corpus.synonym.SynonymHelper 的构造方法
 
synonymList - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
条目的value,是key的同义词列表
synonymMap - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 中的变量
条目的value,是key的同义词近义词列表
SYTDictionary - com.hankcs.hanlp.dictionary.py 中的 类
声母韵母音调词典
SYTDictionary() - 类 com.hankcs.hanlp.dictionary.py.SYTDictionary 的构造方法
 
SYTDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
声母韵母语调词典

T

T_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
Table - com.hankcs.hanlp.model.crf 中的 类
给一个实例生成一个元素表
Table() - 类 com.hankcs.hanlp.model.crf.Table 的构造方法
 
tag(Table) - 类 com.hankcs.hanlp.model.crf.CRFModel 中的方法
维特比后向算法标注
tag(Table) - 类 com.hankcs.hanlp.model.CRFSegmentModel 中的方法
 
tag(char[]) - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
序列标注
TAG_BIGIN - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_BIGIN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
句子的开始 begin
TAG_CLUSTER - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_CLUSTER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
字符串 x
TAG_END - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_END - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
结束 end
TAG_GROUP - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_GROUP - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
团体名词 nt
TAG_NUMBER - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_NUMBER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
数词 m
TAG_OTHER - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_OTHER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
其它
TAG_PEOPLE - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_PEOPLE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
人名 nr
TAG_PLACE - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_PLACE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
地址 ns
TAG_PROPER - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_PROPER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
专有名词 nx
TAG_QUANTIFIER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
数量词 mq (现在觉得应该和数词同等处理,比如一个人和一人都是合理的)
TAG_TIME - 类 com.hankcs.hanlp.corpus.util.CorpusUtil 中的静态变量
 
TAG_TIME - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
时间 t
Term - com.hankcs.hanlp.seg.common 中的 类
一个单词,用户可以直接访问此单词的全部属性
Term(String, Nature) - 类 com.hankcs.hanlp.seg.common.Term 的构造方法
构造一个单词
TermFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
词与词频的简单封装
TermFrequency(String, Integer) - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 的构造方法
 
TermFrequency(String) - 类 com.hankcs.hanlp.corpus.occurrence.TermFrequency 的构造方法
 
TermOccurrence - com.hankcs.hanlp.corpus.occurrence 中的 类
词频统计
TermOccurrence() - 类 com.hankcs.hanlp.corpus.occurrence.TermOccurrence 的构造方法
 
TextRankKeyword - com.hankcs.hanlp.summary 中的 类
基于TextRank算法的关键字提取,适用于单文档
TextRankKeyword() - 类 com.hankcs.hanlp.summary.TextRankKeyword 的构造方法
 
TextRankSentence - com.hankcs.hanlp.summary 中的 类
TextRank 自动摘要
TextRankSentence(List<List<String>>) - 类 com.hankcs.hanlp.summary.TextRankSentence 的构造方法
 
TextUtility - com.hankcs.hanlp.utility 中的 类
文本工具类
TextUtility() - 类 com.hankcs.hanlp.utility.TextUtility 的构造方法
 
TFDictionary - com.hankcs.hanlp.corpus.dictionary 中的 类
词频词典
TFDictionary(String) - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 的构造方法
 
TFDictionary() - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 的构造方法
 
third - 类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的变量
 
threadNumber - 类 com.hankcs.hanlp.seg.Config 中的变量
并行分词的线程数
TMDictionaryMaker - com.hankcs.hanlp.corpus.dictionary 中的 类
转移矩阵词典制作工具
TMDictionaryMaker() - 类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 的构造方法
 
to - 类 com.hankcs.hanlp.dependency.common.Edge 中的变量
 
toArray() - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
toArray(T[]) - 类 com.hankcs.hanlp.collection.MDAG.MDAGSet 中的方法
 
toCharArray() - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
toGraph() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
词网转词图
Token - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
一个片段
Token(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 的构造方法
 
tokenize(String) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 中的方法
一个最长分词器
tone2tone5 - 类 com.hankcs.hanlp.dictionary.py.String2PinyinConverter 中的静态变量
将音调统一换为轻声,下标为拼音的ordinal,值为音调5或最大值
TonePinyinString2PinyinConverter - com.hankcs.hanlp.dictionary.py 中的 类
将类似āiyā的词语转为拼音的转换器
TonePinyinString2PinyinConverter() - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 的构造方法
 
toSentenceList(String) - 类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
将文本切割为句子
toSentenceList(char[]) - 类 com.hankcs.hanlp.utility.SentencesUtil 中的静态方法
 
toString() - 类 com.hankcs.hanlp.algoritm.ahocorasick.interval.Interval 中的方法
 
toString() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Emit 中的方法
 
toString() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.State 中的方法
 
toString() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Token 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.AhoCorasick.State 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.dartsclone.Pair 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.sequence.SString 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
toString() - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.DictionaryMaker 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.item.EnumItem 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.item.Item 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.item.SimpleItem 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.document.Document 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.occurrence.Occurrence 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.occurrence.PairFrequency 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.occurrence.TriaFrequency 中的方法
 
toString() - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的方法
 
toString() - 类 com.hankcs.hanlp.dependency.common.Node 中的方法
 
toString() - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的方法
 
toString() - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem 中的方法
 
toString() - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的方法
 
toString() - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的方法
 
toString() - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的方法
 
toString() - 类 com.hankcs.hanlp.model.crf.FeatureTemplate 中的方法
 
toString() - 类 com.hankcs.hanlp.model.crf.Table 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.EdgeFrom 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.Graph 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.ResultTerm 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.Term 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.common.WordNet 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.NShort.Path.AtomNode 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.NShort.Path.PathNode 中的方法
 
toString() - 类 com.hankcs.hanlp.seg.Viterbi.Path.Node 中的方法
 
toString() - 类 com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey 中的方法
 
totalFrequency - 类 com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute 中的变量
 
totalFrequency - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态变量
已过时。  
totalFrequency - 类 com.hankcs.hanlp.dictionary.CoreDictionary.Attribute 中的变量
 
totalFrequency - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
toWord() - 类 com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord 中的方法
转换为一个简单词
TraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts 中的 类
繁简词典,提供简繁转换
TraditionalChineseDictionary() - 类 com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary 的构造方法
 
TraditionalChineseDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
繁简词典路径
TraditionalChineseTokenizer - com.hankcs.hanlp.tokenizer 中的 类
繁体中文分词器
TraditionalChineseTokenizer() - 类 com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer 的构造方法
 
train() - 类 com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel 中的方法
观测结束,开始训练
TRANS_ENGLISH - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
TRANS_JAPANESE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
TRANS_RUSSIAN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
transformMatrixDictionary - 类 com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary 中的静态变量
 
transformMatrixDictionary - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
转移矩阵词典
transformMatrixDictionary - 类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
转移矩阵词典
transformMatrixDictionary - 类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
转移矩阵词典
TransformMatrixDictionary<E extends Enum<E>> - com.hankcs.hanlp.dictionary 中的 类
转移矩阵词典
TransformMatrixDictionary(Class<E>) - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 的构造方法
 
transition(int, char) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
转移状态
transition(char) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
Follows an outgoing _transition of this node labeled with a given char.
transition(String) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
沿着一个路径转移
Follows a _transition path starting from this node.
transition(char[]) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
 
transition(char[], int) - 类 com.hankcs.hanlp.collection.MDAG.MDAGNode 中的方法
 
transition(SimpleMDAGNode[], char) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Follows an outgoing _transition from this node.
transition(SimpleMDAGNode[], String) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
Follows a _transition path starting from this node.
transition(SimpleMDAGNode[], char[]) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
 
transition(SimpleMDAGNode[], char[], int) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的方法
 
transition(char[], int) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
transition(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
沿着路径转移状态
transition(char[]) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
沿着节点转移状态
transition(String, int) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
沿着路径转移状态
transition(int, char) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的方法
转移状态
transitionCount - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的变量
所有边的数量
transitionWithRoot(int, char) - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的方法
c转移,如果是根节点则返回自己
transititon_probability - 类 com.hankcs.hanlp.dictionary.TransformMatrixDictionary 中的变量
转移概率
translatedNameRecognize - 类 com.hankcs.hanlp.seg.Config 中的变量
是否识别音译人名
TranslatedPersonDictionary - com.hankcs.hanlp.dictionary.nr 中的 类
翻译人名词典,储存和识别翻译人名
TranslatedPersonDictionary() - 类 com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary 的构造方法
 
TranslatedPersonDictionaryPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
音译人名词典
TranslatedPersonRecognition - com.hankcs.hanlp.recognition.nr 中的 类
音译人名识别
TranslatedPersonRecognition() - 类 com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition 的构造方法
 
traverseMDAG(SimpleMDAGNode[], SimpleMDAGNode, String) - 类 com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode 中的静态方法
Follows a _transition path starting from the source node of a MDAG.
TriaFrequency - com.hankcs.hanlp.corpus.occurrence 中的 类
一个二元的词串的频度
Trie - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf
Trie(TrieConfig) - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 的构造方法
构造一棵trie树
Trie() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.Trie 的构造方法
 
trie - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 
trie - 类 com.hankcs.hanlp.dictionary.CustomDictionary 中的静态变量
用于储存用户动态插入词条的二分trie树
trie - 类 com.hankcs.hanlp.dictionary.nr.PersonDictionary 中的静态变量
AC算法用到的Trie树
trie - 类 com.hankcs.hanlp.dictionary.ns.PlaceDictionary 中的静态变量
AC算法用到的Trie树
trie - 类 com.hankcs.hanlp.dictionary.nt.OrganizationDictionary 中的静态变量
AC算法用到的Trie树
Trie.IWalker - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 接口
 
TRIE_EXT - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
trie树文件后缀名
TrieConfig - com.hankcs.hanlp.algoritm.ahocorasick.trie 中的 类
配置
TrieConfig() - 类 com.hankcs.hanlp.algoritm.ahocorasick.trie.TrieConfig 的构造方法
 
TT_ENGLISH - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
TT_JAPANESE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
TT_RUSSIAN - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
type - 类 com.hankcs.hanlp.corpus.synonym.Synonym 中的变量
 
type - 类 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem 中的变量
这个条目的类型,同义词或同类词或封闭词

U

UnEmptyStringSet - com.hankcs.hanlp.collection.set 中的 类
一个不接受空白的字符串set
UnEmptyStringSet() - 类 com.hankcs.hanlp.collection.set.UnEmptyStringSet 的构造方法
 
UniformPrior - com.hankcs.hanlp.model.maxent 中的 类
先验概率计算工具
UniformPrior() - 类 com.hankcs.hanlp.model.maxent.UniformPrior 的构造方法
 
unSerialize(String) - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的静态方法
 
unSimplify() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
解压缩
unSimplify() - 类 com.hankcs.hanlp.collection.MDAG.MDAGMap 中的方法
 
updateFrom(Vertex) - 类 com.hankcs.hanlp.seg.common.Vertex 中的方法
 
updateFrom(Node) - 类 com.hankcs.hanlp.seg.Viterbi.Path.Node 中的方法
 
updateNerConfig() - 类 com.hankcs.hanlp.seg.Config 中的方法
更新命名实体识别总开关
useCustomDictionary - 类 com.hankcs.hanlp.seg.Config 中的变量
是否加载用户词典

V

v - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie 中的变量
保存value
v - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie 中的变量
 
v - 类 com.hankcs.hanlp.model.crf.Table 中的变量
真实值,请不要直接读取
valid(String) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
这个拼音是否合格
valid(String[]) - 类 com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter 中的静态方法
这些拼音是否全部合格
value - 类 com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit 中的变量
模式串对应的值
value - 类 com.hankcs.hanlp.collection.sequence.SString 中的变量
 
value - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的变量
节点代表的值
value - 类 com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher 中的变量
key对应的value
value - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine 中的变量
十个值
value - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 中的变量
单词的真实值,比如“程序”
VALUE_EXT - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
值文件后缀名
valueOf(char) - 类 com.hankcs.hanlp.collection.sequence.SString 中的静态方法
 
valueOf(String) - 枚举 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.corpus.synonym.Synonym.Type 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.corpus.tag.Nature 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.corpus.tag.NR 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.corpus.tag.NS 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.corpus.tag.NT 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem.Type 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.nr.NRPattern 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.py.Head 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.py.Shengmu 中的静态方法
返回带有指定名称的该类型的枚举常量。
valueOf(String) - 枚举 com.hankcs.hanlp.dictionary.py.Yunmu 中的静态方法
返回带有指定名称的该类型的枚举常量。
values() - 类 com.hankcs.hanlp.collection.dartsclone.DartMap 中的方法
 
values() - 枚举 com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 类 com.hankcs.hanlp.corpus.dictionary.TFDictionary 中的方法
按照频率从高到低排序的条目
values() - 枚举 com.hankcs.hanlp.corpus.synonym.Synonym.Type 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.corpus.tag.Nature 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.corpus.tag.NR 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.corpus.tag.NS 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.corpus.tag.NT 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem.Type 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.nr.NRPattern 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.py.Head 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.py.Pinyin 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.py.Shengmu 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
values() - 枚举 com.hankcs.hanlp.dictionary.py.Yunmu 中的静态方法
按照声明该枚举类型的常量的顺序,返回 包含这些常量的数组。
VectorDistance - com.hankcs.hanlp.algoritm 中的 类
词向量距离计算
VectorDistance() - 类 com.hankcs.hanlp.algoritm.VectorDistance 的构造方法
 
Vertex - com.hankcs.hanlp.seg.common 中的 类
顶点
Vertex(String, String, CoreDictionary.Attribute) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
最复杂的构造函数
Vertex(String, String, CoreDictionary.Attribute, int) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
 
Vertex(String, CoreDictionary.Attribute) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
真实词与编译词相同时候的构造函数
Vertex(String, CoreDictionary.Attribute, int) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
 
Vertex(Map.Entry<String, CoreDictionary.Attribute>) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
通过一个键值对方便地构造节点
Vertex(String) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
自动构造一个合理的顶点
Vertex(char, CoreDictionary.Attribute) - 类 com.hankcs.hanlp.seg.common.Vertex 的构造方法
 
vertex - 类 com.hankcs.hanlp.seg.Dijkstra.Path.State 中的变量
当前位置
vertexes - 类 com.hankcs.hanlp.seg.common.Graph 中的变量
顶点
Viterbi - com.hankcs.hanlp.algoritm 中的 类
维特比算法
Viterbi() - 类 com.hankcs.hanlp.algoritm.Viterbi 的构造方法
 
viterbi() - 类 com.hankcs.hanlp.seg.Viterbi.Path.Graph 中的方法
 
viterbi() - 类 com.hankcs.hanlp.seg.Viterbi.Path.SimpleGraph 中的方法
 
viterbiCompute(List<EnumItem<NR>>) - 类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
维特比算法求解最优标签
viterbiExCompute(List<EnumItem<NR>>) - 类 com.hankcs.hanlp.recognition.nr.PersonRecognition 中的静态方法
维特比算法求解最优标签
viterbiExCompute(List<EnumItem<NS>>) - 类 com.hankcs.hanlp.recognition.ns.PlaceRecognition 中的静态方法
维特比算法求解最优标签
viterbiExCompute(List<EnumItem<NT>>) - 类 com.hankcs.hanlp.recognition.nt.OrganizationRecognition 中的静态方法
维特比算法求解最优标签
ViterbiSegment - com.hankcs.hanlp.seg.Viterbi 中的 类
Viterbi分词器
也是最短路分词,最短路求解采用Viterbi算法
ViterbiSegment() - 类 com.hankcs.hanlp.seg.Viterbi.ViterbiSegment 的构造方法
 

W

walk(StringBuilder, Set<Map.Entry<String, V>>) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
walk(String, CorpusLoader.Handler) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
walk(String, CorpusLoader.HandlerThread[]) - 类 com.hankcs.hanlp.corpus.document.CorpusLoader 中的静态方法
 
walkToLoad(ByteArray, _ValueArray<V>) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
walkToSave(DataOutputStream) - 类 com.hankcs.hanlp.collection.trie.bintrie.BaseNode 中的方法
 
weight - 类 com.hankcs.hanlp.seg.common.Edge 中的变量
花费
weight - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
最短路径对应的权重
weight - 类 com.hankcs.hanlp.seg.NShort.Path.QueueElement 中的变量
权重
word - 类 com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence 中的变量
有许多行,每行是一个单词
Word - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
一个单词
Word(String, String) - 类 com.hankcs.hanlp.corpus.document.sentence.word.Word 的构造方法
 
word - 类 com.hankcs.hanlp.dependency.common.Node 中的变量
 
word - 类 com.hankcs.hanlp.seg.common.ResultTerm 中的变量
 
word - 类 com.hankcs.hanlp.seg.common.Term 中的变量
词语
word - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
节点对应的词或等效词(如未##数)
WORD_ID - 类 com.hankcs.hanlp.dictionary.nr.NRConstant 中的静态变量
本词典专注的词的ID
WORD_MAXLENGTH - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
WORD_SEGMENTER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
WordBasedGenerativeModelSegment - com.hankcs.hanlp.seg 中的 类
基于词语NGram模型的分词器基类
WordBasedGenerativeModelSegment() - 类 com.hankcs.hanlp.seg.WordBasedGenerativeModelSegment 的构造方法
 
WordFactory - com.hankcs.hanlp.corpus.document.sentence.word 中的 类
一个很方便的工厂类,能够自动生成不同类型的词语
WordFactory() - 类 com.hankcs.hanlp.corpus.document.sentence.word.WordFactory 的构造方法
 
wordID - 类 com.hankcs.hanlp.seg.common.Vertex 中的变量
等效词ID,也是Attribute的下标
wordList - 类 com.hankcs.hanlp.corpus.document.sentence.Sentence 中的变量
 
WordNatureDependencyModel - com.hankcs.hanlp.model.bigram 中的 类
 
WordNatureDependencyModel() - 类 com.hankcs.hanlp.model.bigram.WordNatureDependencyModel 的构造方法
 
WordNatureDependencyParser - com.hankcs.hanlp.dependency 中的 类
一个简单的句法分析器
WordNatureDependencyParser() - 类 com.hankcs.hanlp.dependency.WordNatureDependencyParser 的构造方法
 
WordNatureModelPath - 类 com.hankcs.hanlp.HanLP.Config 中的静态变量
词-词性-依存关系模型
WordNatureWeightModelMaker - com.hankcs.hanlp.corpus.dependency.model 中的 类
生成模型打分器模型构建工具
WordNatureWeightModelMaker() - 类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 的构造方法
 
WordNatureWeightScorer - com.hankcs.hanlp.corpus.dependency.model 中的 类
生成模型打分器,衡量一个边的权值,仅仅利用〈词,词〉,数据稀疏则回退为〈词,词性〉、〈词性,词〉、〈词性,词性〉
WordNatureWeightScorer() - 类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightScorer 的构造方法
 
WordNet - com.hankcs.hanlp.seg.common 中的 类
 
WordNet(String) - 类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
为一个句子生成空白词网
WordNet(char[]) - 类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
 
WordNet(char[], List<Vertex>) - 类 com.hankcs.hanlp.seg.common.WordNet 的构造方法
 
wrapTag(String) - 类 com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker 中的静态方法
用尖括号将标签包起来
writeString(String, DataOutputStream) - 类 com.hankcs.hanlp.utility.TextUtility 中的静态方法
简单好用的写String方式
writeUnsignedInt(DataOutputStream, int) - 类 com.hankcs.hanlp.utility.ByteUtil 中的静态方法
无符号整型输出
WT_CHINESE - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
WT_DELIMITER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 
WT_OTHER - 类 com.hankcs.hanlp.utility.Predefine 中的静态变量
 

X

X - 类 com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary 中的静态变量
X_WORD_ID - 类 com.hankcs.hanlp.dictionary.CoreDictionary 中的静态变量
 

Y

Yunmu - com.hankcs.hanlp.dictionary.py 中的 枚举
 

_

_EmptyValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
 
_EmptyValueArray() - 类 com.hankcs.hanlp.collection.trie.bintrie._EmptyValueArray 的构造方法
 
_findSpecialString() - 类 com.hankcs.hanlp.dictionary.BiGramDictionary 中的静态方法
已过时。 没事就不要用了
_getEquivalenceClassMDAGNodeHashMap() - 类 com.hankcs.hanlp.collection.MDAG.MDAG 中的方法
调试用
_ValueArray<V> - com.hankcs.hanlp.collection.trie.bintrie 中的 类
对值数组的包装,可以方便地取下一个
_ValueArray(V[]) - 类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 的构造方法
 
_ValueArray() - 类 com.hankcs.hanlp.collection.trie.bintrie._ValueArray 的构造方法
仅仅给子类用,不要用

A B C D E F G H I J K L M N O P Q R S T U V W X Y _

Copyright © 2014–2015 码农场. All rights reserved.