python utf-8/gbk/unicode 编码及解码


如果想知道python 的某个bytes类型是通过什么类型编码,可以先安装chardet 。

pip install chardet

python utf-8/gbk/unicode 编码及解码

 

 Python utf-8 编码及解码

str = "python编码"
# 转为utf-8 类型的bytes 字符串
str_utf8 = str.encode("utf-8")
print("转码结果:"+repr(str_utf8))
print(type(str_utf8))
print(chardet.detect(str_utf8))
print("解码结果:"+str_utf8.decode("utf-8"))

运行结果:

转码结果:b'python/xe7/xbc/x96/xe7/xa0/x81'
<class 'bytes'>
{'encoding': 'utf-8', 'confidence': 0.7525, 'language': ''}
解码结果:python编码
转码结果:b'python/xb1/xe0/xc2/xeb'

 

 Python gbk 编码及解码

# 转为gbk 类型的bytes 字符串
str_gbk = str.encode("gbk")
print("转码结果:"+repr(str_gbk))
print(type(str_gbk))
print(chardet.detect(str_gbk))
print("解码结果:"+str_gbk.decode("gbk"))

运行结果:

转码结果:b'python/xb1/xe0/xc2/xeb'
<class 'bytes'>
{'encoding': None, 'confidence': 0.0, 'language': None}
解码结果:python编码

 

 Python unicode 编码及解码

# 转为unicode 类型的bytes 字符串
str_unicode = str.encode("unicode-escape")
print("转码结果:"+repr(str_unicode))
print(type(str_unicode))
print(chardet.detect(str_unicode))
print("解码结果:"+str_unicode.decode("unicode-escape"))

运行结果:

转码结果:b'python//u7f16//u7801'
<class 'bytes'>
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}
解码结果:python编码

 

原创文章,作者:bd101bd101,如若转载,请注明出处:https://blog.ytso.com/273476.html

(0)
上一篇 2022年7月10日
下一篇 2022年7月10日

相关推荐

发表回复

登录后才能评论