中文词性标注:结巴分词
词性代碼 | 現代漢语词性 | 词性名称 | 词性代碼的命名方式與補充說明 | 舉例 |
---|---|---|---|---|
a | 形容词 | 形容词 | 取英语形容词adjective的第1個字母。 | 大, 好, 新 |
ag | 形容词 | 形语素 | 形容词性语素。形容词代碼為a,语素代碼g前面置以a。 | 奇, 私, 秀 |
ad | 形容词 | 副形词 | 直接作狀语的形容词。形容词代碼a和副词代碼d並在一起。 | 完全, 突然, 直接 |
an | 形容词 | 名形词 | 具有名词功能的形容词。形容词代碼a和名词代碼n並在一起。 | 安全, 困難, 矛盾 |
b | 形容词 | 區別词 | 取漢字“別”的聲母。 | 主要, 副, 總 |
c | 连词 | 连接词 | 取英语连词conjunction的第1個字母。 | 和, 而, 但 |
d | 副词 | 副词 | 取adverb的第2個字母,因其第1個字母已用於形容词。 | 不, 也, 就 |
dg | 副词 | 副语素 | 副词性语素。副词代碼為d,语素代碼g前面置以d。只有兩個。 | 俱, 輒 |
df * | 动词 | 能願动词: 不要 | 专指不要 | 不要 |
e | 叹词 | 叹词 | 取英语叹词exclamation的第1個字母。 | 嗯, 哎, 咦 |
eng * | 外语 | 外语 | ||
f | 动词 | 方位词(趨向动词) | 取漢字“方”的聲母。 | 上, 中, 後 |
g | (難以判斷) | 语素 | 絕大多數语素都能作為合成词的“词根”,取漢字“根”的聲母。 | 浠, 僭, 涔 |
h | 副词 | 前接成分 | 取英语head的第1個字母。只有兩個。 | 非, 超低 |
i | 形容词 | 成语 | 取英语成语idiom的第1個字母。 | 一口气, 大吃一驚, 九曲迴腸 |
j | 名词 | 间称略语 | 取漢字“间”的聲母。 | 法, 人大, 漢 |
k | 代词 | 後接成分 | 只有四個。 | 們, 者, 型, 式 |
l | (難以判斷) | 慣用语 | 慣用语尚未成為成语,有點“臨時性”,取“臨”的聲母。 | 發言人, 是不是, 沒想到 |
m | 數词 | 數词 | 取英语numeral的第3個字母,n,u已有他用。 | 年, 一, 月, 多 |
mg * | 名词 | 干支 | 只有兩個。 | 巳, 寅 |
mq * | 代词 | 指示代词 | 布丁註:不太確定。 | 這件, 這場, 一方面 |
n | 名词 | 名词 | 取英语名词noun的第1個字母。 | 人, 時, 國家 |
ng | 名词 | 名语素 | 名词性语素。名词代碼為n,语素代碼g前面置以n。 | 子, 身, 師, 眾 |
nr | 名词 | 人名 | 名词代碼n和“人(ren)”的聲母並在一起。 | 连, 王, 楊 |
nrfg * | 名词 | 完整人名 | 明確可以辨別為人名的词。 | 李自成, 張居正, 康熙 |
nrt * | 名词 | 外國名词 | 布丁註:不太確定。 | 二人, 闖王, 崇禎 |
ns | 名词 | 地名 | 名词代碼n和处所词代碼s並在一起。 | 臺灣, 美國, 日本 |
nt | 名词 | 机构团体 | “团”的聲母為t,名词代碼n和t並在一起。 | 國務院, 外交部 |
nz | 名词 | 其他专名 | “专”的聲母的第1個字母為z,名词代碼n和z並在一起。 | 百科, 和平, 英语 |
o | 拟声词 | 拟声词 | 取英语拟声词onomatopoeia的第1個字母。 | 哈哈, 砰, 嗚, 嘿嘿 |
p | 介词 | 介词 | 取英语介词prepositional的第1個字母。 | 在, 為, 對 |
q | 量词 | 量词 | 取英语quantity的第1個字母。 | 道, 個, 家 |
r | 代词 | 代词 | 取英语代词pronoun的第2個字母,因p已用於介词。 | 他, 我, 這 |
rg * | 代词 | 茲 | 只有一個。 | 茲 |
rr * | 代词 | 多數代词 | 只有三個。 | 其他人, 妳們, 偺們 |
rz * | 代词 | 這位 | 只有一個。 | 這位 |
s | 名词 | 处所词 (方位名词) | 取英语space的第1個字母。 | 心中, 國內, 身上 |
t | 副词 | 时间词 | 取英语time的第1個字母。 | 當, 現在, 當時 |
tg | 名词 | 時语素 | 时间词性语素。时间词代碼為t,在语素的代碼g前面置以t。 | 現, 晚, 春 |
u | 助词 | 助词 | 取英语助词auxiliary的第2個字母,因a已用於形容词。 | 等, 之, 來說 |
ud * | 助词 | 結構助词: 得 | 只有一個。 | 得 |
uj * | 助词 | 結構助词: 的 | 只有一個。 | 的 |
uv * | 助词 | 結構助词: 地 | 只有一個。 | 地 |
ug * | 助词 | 动態助词: 過 | 只有一個。 | 過 |
ul * | 助词 | 动態助词: 了 | 只有一個。 | 了 |
uz * | 助词 | 动態助词: 著 | 只有一個。 | 著 |
v | 动词 | 动词 | 取英语动词verb的第一個字母。 | 是, 有, 說 |
vg | 动词 | 动语素 | 动词性语素。动词代碼為v。在语素的代碼g前面置以V。 | 喝, 言, 怒 |
vd | 动词 | 副动词 | 直接作狀语的动词。动词和副词的代碼並在一起。只有三個。 | 持續, 狡辯, 逆勢 |
vi * | 动词 | 不及物动词(內动词) | 只有四個。 | 等同於, 徜徉於, 沉溺於, 沉緬於 |
vn | 动词 | 名动词 | 指具有名词功能的动词。动词和名词的代碼並在一起。 | 發展, 工作, 研究 |
vq * | 动词 | 完成动词 | 只有四個。 | 去過, 去淨, 唸過, 捱過 |
w | (标点符号) | 标点符号 | 布丁註:結巴並沒有內建标点符号词性。 | |
x | (未知词) | 非语素字 | 非语素字只是一個符號,字母x通常用於代表未知數、符號。 | 榪, 姆, 灞 |
y | 助词 | 语气词(语气助词) | 取漢字“语”的聲母。 | 呢, 吧, 嗎 |
z | 形容词 | 状态词 | 取漢字“狀”的聲母的前一個字母。 | 涓, 優良, 最佳 |
zg * | 副词 | 副状态词 | 布丁註:不太確定。 | 很, 此, 較 |
百度词性标注
词性缩略说明
词性 | 含义 | 词性 | 含义 | 词性 | 含义 | 词性 | 含义 —-|——|—–|—–|—–|——|—–—|—- n | 普通名词 | f | 方位名词 | s | 处所名词 | t | 时间名词 nr | 人名 | ns | 地名 | nt | 机构团体名 | nw | 作品名 nz | 其他专名 | v | 普通动词 | vd | 动副词 | vn | 名动词 a | 形容词 | ad | 副形词 | an | 名形词 | d | 副词 m | 数量词 | q | 量词 | r | 代词 | p | 介词 c | 连词 | u | 助词 | xc | 其他虚词 | w | 变电符号
专名识别缩略词含义
缩略词 | 含义 | 缩略词 | 含义 | 缩略词 | 含义 | 缩略词 | 含义 ——|—–|——-|——|——-|—–|——-|—– PER | 人名 | LOC | 地名 | ORG | 机构名 | TIME | 时间
英文词性标注:FastTag
词性代碼 | 主要词性分類 | 词性說明 | 例子 |
---|---|---|---|
CC | 连接词 | 连接词(Coord Conjuncn) | and,but,or |
CD | 名词 | 數字(Cardinal number) | one,two |
DT | 冠词 | 冠词(Determiner) | the,some |
EX | 名词 | 存在词(Existential there) | there |
FW | (外语) | 外语(Foreign Word) | mon dieu |
IN | 介系词 | 介词(Preposition) | of,in,by |
JJ | 形容词 | 形容词(Adjective) | big |
JJR | 形容词 | 形容词,比較級(Adj., comparative) | bigger |
JJS | 形容词 | 形容词,最高級(Adj., superlative) | biggest |
LS | 标点符号 | 列點標示(List item marker) | 1,One |
MD | 动词 | 助动词(Modal) | can,should |
NN | 名词 | 名词,單數或不可數(Noun, sing. or mass) | dog |
NNS | 名词 | 名词,複數(Noun, plural) | dogs |
NNP | 名词 | 专有名词,單數(Proper noun, sing.) | Edinburgh |
NNPS | 名词 | 专有名词,複數(Proper noun, plural) | Smiths |
POS | 介系词 | 名词所有格的完結(Possessive ending) | Õs |
PDT | 形容词 | 前限定词(Predeterminer) | all, both |
PP$ | 代名词 | 所有代名词(Possessive pronoun) | my,oneÕs |
PRP | 代名词 | 人称代名词(Personal pronoun) | I,you,she |
RB | 副词 | 助动词(Adverb) | quickly |
RBR | 副词 | 助动词,比較級(Adverb, comparative) | faster |
RBS | 副词 | 助动词,最高級(Adverb, superlative) | fastest |
RP | 介系词 | 虛词(Particle) | up,off |
SYM | 标点符号 | 符號(Symbol) | +,%,& |
TO | 介系词 | to | to |
UH | 感叹词 | 感叹词(Interjection) | oh, oops |
URL | 名词 | 網址(URL) | http://blog.pulipuli.info/ |
VB | 动词 | 动词,原型(verb, base form) | eat |
VBD | 动词 | 动词,過去式(verb, past tense) | ate |
VBG | 动词 | 动词,現在進行式(verb, gerund) | eating |
VBN | 动词 | 动词,過去完成式(verb, past part) | eaten |
VBP | 动词 | 动词,現在式(Verb, present) | eat |
VBZ | 动词 | 动词,現在式第三人用(Verb, present) | eats |
WDT | 名词 | Wh開頭的限定词(Wh-determiner) | which,that |
WP | 代名词 | Wh代名词(Wh pronoun) | who,what |
WP$ | 代名词 | Wh所有格(Possessive-Wh) | whose |
WRB | 副词 | Wh助动词(Wh-adverb) | how,where |
, | (标点符号) | 逗點符號(Comma) | , |
. | (标点符号) | 句子完結符號(Sent-final punct) | . ! ? |
: | (标点符号) | 句子中間符號(Mid-sent punct.) | : ; Ñ |
$ | (标点符号) | 金錢符號(Dollar sign) | $ |
| (标点符号) | 英鎊符號(Pound sign) |
“ | (标点符号) | 括號(quote) | “ ( | (标点符号) | 左括弧(Left paren) | ( ) | (标点符号) | 右括弧(Right paren) | )
参考资料:
http://blog.pulipuli.info/2017/11/fasttag-identify-part-of-speech-in.html