中文词性标注:结巴分词

词性代碼 現代漢语词性 词性名称 词性代碼的命名方式與補充說明 舉例
a 形容词 形容词 取英语形容词adjective的第1個字母。 大, 好, 新
ag 形容词 形语素 形容词性语素。形容词代碼為a,语素代碼g前面置以a。 奇, 私, 秀
ad 形容词 副形词 直接作狀语的形容词。形容词代碼a和副词代碼d並在一起。 完全, 突然, 直接
an 形容词 名形词 具有名词功能的形容词。形容词代碼a和名词代碼n並在一起。 安全, 困難, 矛盾
b 形容词 區別词 取漢字“別”的聲母。 主要, 副, 總
c 连词 连接词 取英语连词conjunction的第1個字母。 和, 而, 但
d 副词 副词 取adverb的第2個字母,因其第1個字母已用於形容词。 不, 也, 就
dg 副词 副语素 副词性语素。副词代碼為d,语素代碼g前面置以d。只有兩個。 俱, 輒
df * 动词 能願动词: 不要 专指不要 不要
e 叹词 叹词 取英语叹词exclamation的第1個字母。 嗯, 哎, 咦
eng * 外语 外语
f 动词 方位词(趨向动词) 取漢字“方”的聲母。 上, 中, 後
g (難以判斷) 语素 絕大多數语素都能作為合成词的“词根”,取漢字“根”的聲母。 浠, 僭, 涔
h 副词 前接成分 取英语head的第1個字母。只有兩個。 非, 超低
i 形容词 成语 取英语成语idiom的第1個字母。 一口气, 大吃一驚, 九曲迴腸
j 名词 间称略语 取漢字“间”的聲母。 法, 人大, 漢
k 代词 後接成分 只有四個。 們, 者, 型, 式
l (難以判斷) 慣用语 慣用语尚未成為成语,有點“臨時性”,取“臨”的聲母。 發言人, 是不是, 沒想到
m 數词 數词 取英语numeral的第3個字母,n,u已有他用。 年, 一, 月, 多
mg * 名词 干支 只有兩個。 巳, 寅
mq * 代词 指示代词 布丁註:不太確定。 這件, 這場, 一方面
n 名词 名词 取英语名词noun的第1個字母。 人, 時, 國家
ng 名词 名语素 名词性语素。名词代碼為n,语素代碼g前面置以n。 子, 身, 師, 眾
nr 名词 人名 名词代碼n和“人(ren)”的聲母並在一起。 连, 王, 楊
nrfg * 名词 完整人名 明確可以辨別為人名的词。 李自成, 張居正, 康熙
nrt * 名词 外國名词 布丁註:不太確定。 二人, 闖王, 崇禎
ns 名词 地名 名词代碼n和处所词代碼s並在一起。 臺灣, 美國, 日本
nt 名词 机构团体 “团”的聲母為t,名词代碼n和t並在一起。 國務院, 外交部
nz 名词 其他专名 “专”的聲母的第1個字母為z,名词代碼n和z並在一起。 百科, 和平, 英语
o 拟声词 拟声词 取英语拟声词onomatopoeia的第1個字母。 哈哈, 砰, 嗚, 嘿嘿
p 介词 介词 取英语介词prepositional的第1個字母。 在, 為, 對
q 量词 量词 取英语quantity的第1個字母。 道, 個, 家
r 代词 代词 取英语代词pronoun的第2個字母,因p已用於介词。 他, 我, 這
rg * 代词 只有一個。
rr * 代词 多數代词 只有三個。 其他人, 妳們, 偺們
rz * 代词 這位 只有一個。 這位
s 名词 处所词 (方位名词) 取英语space的第1個字母。 心中, 國內, 身上
t 副词 时间词 取英语time的第1個字母。 當, 現在, 當時
tg 名词 時语素 时间词性语素。时间词代碼為t,在语素的代碼g前面置以t。 現, 晚, 春
u 助词 助词 取英语助词auxiliary的第2個字母,因a已用於形容词。 等, 之, 來說
ud * 助词 結構助词: 得 只有一個。
uj * 助词 結構助词: 的 只有一個。
uv * 助词 結構助词: 地 只有一個。
ug * 助词 动態助词: 過 只有一個。
ul * 助词 动態助词: 了 只有一個。
uz * 助词 动態助词: 著 只有一個。
v 动词 动词 取英语动词verb的第一個字母。 是, 有, 說
vg 动词 动语素 动词性语素。动词代碼為v。在语素的代碼g前面置以V。 喝, 言, 怒
vd 动词 副动词 直接作狀语的动词。动词和副词的代碼並在一起。只有三個。 持續, 狡辯, 逆勢
vi * 动词 不及物动词(內动词) 只有四個。 等同於, 徜徉於, 沉溺於, 沉緬於
vn 动词 名动词 指具有名词功能的动词。动词和名词的代碼並在一起。 發展, 工作, 研究
vq * 动词 完成动词 只有四個。 去過, 去淨, 唸過, 捱過
w (标点符号) 标点符号 布丁註:結巴並沒有內建标点符号词性。
x (未知词) 非语素字 非语素字只是一個符號,字母x通常用於代表未知數、符號。 榪, 姆, 灞
y 助词 语气词(语气助词) 取漢字“语”的聲母。 呢, 吧, 嗎
z 形容词 状态词 取漢字“狀”的聲母的前一個字母。 涓, 優良, 最佳
zg * 副词 副状态词 布丁註:不太確定。 很, 此, 較

百度词性标注

词性缩略说明

词性 | 含义 | 词性 | 含义 | 词性 | 含义 | 词性 | 含义 —-|——|—–|—–|—–|——|—–—|—- n | 普通名词 | f | 方位名词 | s | 处所名词 | t | 时间名词 nr | 人名 | ns | 地名 | nt | 机构团体名 | nw | 作品名 nz | 其他专名 | v | 普通动词 | vd | 动副词 | vn | 名动词 a | 形容词 | ad | 副形词 | an | 名形词 | d | 副词 m | 数量词 | q | 量词 | r | 代词 | p | 介词 c | 连词 | u | 助词 | xc | 其他虚词 | w | 变电符号

专名识别缩略词含义

缩略词 | 含义 | 缩略词 | 含义 | 缩略词 | 含义 | 缩略词 | 含义 ——|—–|——-|——|——-|—–|——-|—– PER | 人名 | LOC | 地名 | ORG | 机构名 | TIME | 时间

英文词性标注:FastTag

词性代碼 主要词性分類 词性說明 例子
CC 连接词 连接词(Coord Conjuncn) and,but,or
CD 名词 數字(Cardinal number) one,two
DT 冠词 冠词(Determiner) the,some
EX 名词 存在词(Existential there) there
FW (外语) 外语(Foreign Word) mon dieu
IN 介系词 介词(Preposition) of,in,by
JJ 形容词 形容词(Adjective) big
JJR 形容词 形容词,比較級(Adj., comparative) bigger
JJS 形容词 形容词,最高級(Adj., superlative) biggest
LS 标点符号 列點標示(List item marker) 1,One
MD 动词 助动词(Modal) can,should
NN 名词 名词,單數或不可數(Noun, sing. or mass) dog
NNS 名词 名词,複數(Noun, plural) dogs
NNP 名词 专有名词,單數(Proper noun, sing.) Edinburgh
NNPS 名词 专有名词,複數(Proper noun, plural) Smiths
POS 介系词 名词所有格的完結(Possessive ending) Õs
PDT 形容词 前限定词(Predeterminer) all, both
PP$ 代名词 所有代名词(Possessive pronoun) my,oneÕs
PRP 代名词 人称代名词(Personal pronoun) I,you,she
RB 副词 助动词(Adverb) quickly
RBR 副词 助动词,比較級(Adverb, comparative) faster
RBS 副词 助动词,最高級(Adverb, superlative) fastest
RP 介系词 虛词(Particle) up,off
SYM 标点符号 符號(Symbol) +,%,&
TO 介系词 to to
UH 感叹词 感叹词(Interjection) oh, oops
URL 名词 網址(URL) http://blog.pulipuli.info/
VB 动词 动词,原型(verb, base form) eat
VBD 动词 动词,過去式(verb, past tense) ate
VBG 动词 动词,現在進行式(verb, gerund) eating
VBN 动词 动词,過去完成式(verb, past part) eaten
VBP 动词 动词,現在式(Verb, present) eat
VBZ 动词 动词,現在式第三人用(Verb, present) eats
WDT 名词 Wh開頭的限定词(Wh-determiner) which,that
WP 代名词 Wh代名词(Wh pronoun) who,what
WP$ 代名词 Wh所有格(Possessive-Wh) whose
WRB 副词 Wh助动词(Wh-adverb) how,where
, (标点符号) 逗點符號(Comma) ,
. (标点符号) 句子完結符號(Sent-final punct) . ! ?
: (标点符号) 句子中間符號(Mid-sent punct.) : ; Ñ
$ (标点符号) 金錢符號(Dollar sign) $

| (标点符号) | 英鎊符號(Pound sign) |

“ | (标点符号) | 括號(quote) | “ ( | (标点符号) | 左括弧(Left paren) | ( ) | (标点符号) | 右括弧(Right paren) | )


参考资料:
http://blog.pulipuli.info/2017/11/fasttag-identify-part-of-speech-in.html