哈工大ltp词性列表
Tag Description Example
a adjective 美丽
b other noun-modifier 大型, 西式
c conjunction 和, 虽然
d adverb 很
e exclamation 哎
g morpheme 茨, 甥
h prefix 阿, 伪
i idiom 百花齐放
j abbreviation 公检法
k suffix 界, 率
m number 一, 第一
n general noun 苹果
nd direction noun 右侧
nh person name 杜甫, 汤姆
ni organization name 保险公司
nl location noun 城郊
ns geographical name 北京
nt temporal noun 近日, 明代
nz other proper noun 诺贝尔奖
o onomatopoeia 哗啦
p preposition 在, 把
q quantity 个
r pronoun 我们
u auxiliary 的, 地
v verb 跑, 学习
wp punctuation ,。!
ws foreign words CPU
x non-lexeme 萄, 翱
ICTCLAS 词性列表
POS = {
"n": { # 1. 名词 (1个一类,7个二类,5个三类)
"n": "名词",
"nr": "人名",
"nr1": "汉语姓氏",
"nr2": "汉语名字",
"nrj": "日语人名",
"nrf": "音译人名",
"ns": "地名",
"nsf": "音译地名",
"nt": "机构团体名",
"nz": "其它专名",
"nl": "名词性惯用语",
"ng": "名词性语素"
},
"t": { # 2. 时间词(1个一类,1个二类)
"t": "时间词",
"tg": "时间词性语素"
},
"s": { # 3. 处所词(1个一类)
"s": "处所词"
},
"f": { # 4. 方位词(1个一类)
"f": "方位词"
},
"v": { # 5. 动词(1个一类,9个二类)
"v": "动词",
"vd": "副动词",
"vn": "名动词",
"vshi": "动词“是”",
"vyou": "动词“有”",
"vf": "趋向动词",
"vx": "形式动词",
"vi": "不及物动词(内动词)",
"vl": "动词性惯用语",
"vg": "动词性语素"
},
"a": { # 6. 形容词(1个一类,4个二类)
"a": "形容词",
"ad": "副形词",
"an": "名形词",
"ag": "形容词性语素",
"al": "形容词性惯用语"
},
"b": { # 7. 区别词(1个一类,2个二类)
"b": "区别词",
"bl": "区别词性惯用语"
},
"z": { # 8. 状态词(1个一类)
"z": "状态词"
},
"r": { # 9. 代词(1个一类,4个二类,6个三类)
"r": "代词",
"rr": "人称代词",
"rz": "指示代词",
"rzt": "时间指示代词",
"rzs": "处所指示代词",
"rzv": "谓词性指示代词",
"ry": "疑问代词",
"ryt": "时间疑问代词",
"rys": "处所疑问代词",
"ryv": "谓词性疑问代词",
"rg": "代词性语素"
},
"m": { # 10. 数词(1个一类,1个二类)
"m": "数词",
"mq": "数量词"
},
"q": { # 11. 量词(1个一类,2个二类)
"q": "量词",
"qv": "动量词",
"qt": "时量词"
},
"d": { # 12. 副词(1个一类)
"d": "副词"
},
"p": { # 13. 介词(1个一类,2个二类)
"p": "介词",
"pba": "介词“把”",
"pbei": "介词“被”"
},
"c": { # 14. 连词(1个一类,1个二类)
"c": "连词",
"cc": "并列连词"
},
"u": { # 15. 助词(1个一类,15个二类)
"u": "助词",
"uzhe": "着",
"ule": "了 喽",
"uguo": "过",
"ude1": "的 底",
"ude2": "地",
"ude3": "得",
"usuo": "所",
"udeng": "等 等等 云云",
"uyy": "一样 一般 似的 般",
"udh": "的话",
"uls": "来讲 来说 而言 说来",
"uzhi": "之",
"ulian": "连 " # (“连小学生都会”)
},
"e": { # 16. 叹词(1个一类)
"e": "叹词"
},
"y": { # 17. 语气词(1个一类)
"y": "语气词(delete yg)"
},
"o": { # 18. 拟声词(1个一类)
"o": "拟声词"
},
"h": { # 19. 前缀(1个一类)
"h": "前缀"
},
"k": { # 20. 后缀(1个一类)
"k": "后缀"
},
"x": { # 21. 字符串(1个一类,2个二类)
"x": "字符串",
"xx": "非语素字",
"xu": "网址URL"
},
"w": { # 22. 标点符号(1个一类,16个二类)
"w": "标点符号",
"wkz": "左括号", # ( 〔 [ { 《 【 〖 〈 半角:( [ { <
"wky": "右括号", # ) 〕 ] } 》 】 〗 〉 半角: ) ] { >
"wyz": "全角左引号", # “ ‘ 『
"wyy": "全角右引号", # ” ’ 』
"wj": "全角句号", # 。
"ww": "问号", # 全角:? 半角:?
"wt": "叹号", # 全角:! 半角:!
"wd": "逗号", # 全角:, 半角:,
"wf": "分号", # 全角:; 半角: ;
"wn": "顿号", # 全角:、
"wm": "冒号", # 全角:: 半角: :
"ws": "省略号", # 全角:…… …
"wp": "破折号", # 全角:—— -- ——- 半角:--- ----
"wb": "百分号千分号", # 全角:% ‰ 半角:%
"wh": "单位符号" # 全角:¥ $ £ ° ℃ 半角:$
}
}
jieba的词性标注与ICTCLAS相近; 哈工大的pyltp使用哈工大的词性列表
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/9338.html