如果是utf-8编码,那么一个中文字符占用三个字节,一个英文字符占用一个字节。如果是gbk编码,那么一个中文字符占用两个字节,一个英文字符占用一个字节。
如果是utf-8编码,那么一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
如果是gbk编码,那么一个中文包含繁体字等于两个字节,一个英文字符等于一个字节。
(推荐学习:Python入门教程)
我们可以用如下方法来判断:
中文和符号:
print(type('中文'.encode('utf-8'))) #输出为bytes类型 执行结果: <class 'bytes'> print(type('中文'.encode('gbk'))) 执行结果: <class 'bytes'>
print(len('中文'.encode('utf-8'))) #输出几个字节 执行结果: 6 print(len('中文'.encode('gbk'))) 执行结果: 4 print(len(',。'.encode('gbk'))) 执行结果: 4
英文字母和符号:
print(type('ab'.encode('utf-8'))) 执行结果: <class 'bytes'>
print(len('ab'.encode('utf-8'))) 执行结果: 2 print(len(',.'.encode('gbk'))) 执行结果: 2
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 找不到素材资源介绍文章里的示例图片?
- 模板不会安装或需要功能定制以及二次开发?
发表评论
还没有评论,快来抢沙发吧!