首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python包含中文字符串长度

python包含中文字符串长度

原创
作者头像
用户7718188
修改于 2021-11-03 05:10:26
修改于 2021-11-03 05:10:26
1.8K00
代码可运行
举报
文章被收录于专栏:高级工程司高级工程司
运行总次数:0
代码可运行

一个中文utf8编码后是占3个字符,所以求长度的函数可以这样写

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def str_len(str):
    try:
        row_l=len(str)
        utf8_l=len(str.encode('utf-8'))
        return (utf8_l-row_l)/2+row_l
    except:
        return None
    return None

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
浅谈Python如何处理字符串
本次内容是以以Python 2.7为例来进行讨论的,Python 3x与其类似。 1. Python文件编码 在文件头部一般声明为UTF-8: # encoding=utf8 有的也声明为GBK,多见于Windows系统上 2. 常用字符串操作 s = 'I love python ' rs = s[::-1] # 反转字符串,rs为:' nohtyp evol I' s[0] # 取s的第0个字符‘I' s[-2] # 去s的倒数第二个字符'n', (负索引,倒数) s[0:3] #去s的第0-3个字
昱良
2018/04/04
7770
Java String类型含普通字符以及中文字符,计算等价的中文字符串长度
        向Oracle数据库中一varchar2(64)类型字段中插入一条String类型数据,程序使用String.length()来进行数据的长度校验,如果数据是纯英文,没有问题,但是如果数据中包含中文,校验可以通过,但是在数据入库时经常会报数据超长。
bear_fish
2018/09/19
4.8K1
python--一文搞懂字符串的编解码
我们在使用python处理中文字符串时总会遇到一些问题,特别是一些老项目需要用到python2,中文显示乱码,文件读写异常等问题时常发生。
languageX
2023/05/04
1.7K0
php实现中文字符串截取无乱码的方法
首页要知道的: 1、中文字符在gbk编码下占2个字节,在utf-8编码下占3个字节
php007
2019/08/02
1.6K0
Python——搞定烦人的字符串编码
在学习Python之前,就听说过Python的版本圣战,最可怕的是有的写Py3的程序员觉得Py2是另一种语言....所以在刚开始学习的时候,我索性把Python3和Python2的文档都看了一遍。
Originalee
2018/08/30
8140
#10 Python字符串
通过上一节可知,Python6个序列的内置类型中,最常见的是列表和元组,但在Python中,最常用的数据类型却不是列表和元组,而是字符串。要想深入了解字符串,必须先掌握字符编码问题。因此本篇博文将讲解Python字符编码问题和Python字符串的具体方法!
py3study
2020/01/17
6670
Python:解决中文字符串问题
本人安装的是Python 2.7版本,由于编写程序的过程中会碰到中文字符串,但由于Python默认采用ASCII编码方式,所以对中文不支持。要解决此问题,必须设置当前编码方式为Unicode方式。
古时的风筝
2022/05/11
5270
Go 数据类型篇(三):字符串使用入门及底层字符类型编码详解
在 Go 语言中,字符串是一种基本类型,默认是通过 UTF-8 编码的字符序列,当字符为 ASCII 码时则占用 1 个字节,其它字符根据需要占用 2-4 个字节,比如中文编码通常需要 3 个字节。
学院君
2023/03/03
1.3K0
Go 数据类型篇(三):字符串使用入门及底层字符类型编码详解
15.Python字符串操作详解
Python允许使用负索引,-1表示最后一个字符,-2表示倒数第二个字符,以此类推:
全栈若城
2025/04/15
1810
有趣的面试题:Go语言字符串的字节长度和字符个数
其实这并不是一道面试题,是我在日常开发中遇到的一个问题,当时场景是这样的:后端要对前端传来的字符串做字符校验,产品的需求是限制为200字符,然后我在后端做校验时直接使用len(str) > 200来做判断,结果出现了bug,前端字符校验没有超过200字符,调用后端接口确一直是参数错误,改成使用len([]rune(str)) > 200成功解决了这个问题。具体原因我们在文中揭晓。
Golang梦工厂
2022/07/08
6350
有趣的面试题:Go语言字符串的字节长度和字符个数
详解Python字符串编码格式
最早的字符串编码是美国标准信息交换码ASCII,仅对10个数字、26个大写英文字母、26个小写英文字母及一些其他符号进行了编码。ASCII采用1个字节来对字符进行编码,最多只能表示256个符号。 随着信息技术的发展和信息交换的需要,各国的文字都需要进行编码,不同的应用领域和场合对字符串编码的要求也略有不同,于是又分别设计了多种不同的编码格式,常见的主要有UTF-8、UTF-16、UTF-32、GB2312、GBK、CP936、base64、CP437等等。UTF-8编码是国际通用的编码,以1个字节表示英语字
Python小屋屋主
2018/04/16
1.9K0
Python字符串常用方法_007
str() 和 repr() 函数虽然都可以将数字转换成字符串,但它们之间是有区别的:
留给昨天、
2024/11/08
1460
python字符串内建函数详解
字符串方法是从python1.6到2.0慢慢加进来的——它们也被加到了Jython中。
小小工匠
2021/08/16
5760
中文字符在MQL的处理
以前的计算机只支持英文字符的时候,全部字符加符号也不过一两百个,ascii解决不了的,扩展一下表就可以了。
PhoenixZheng
2021/06/23
4830
Python 中的字符串 — str
由于 Python 源代码也是一个文本文件,所以,当你的源代码中包含中文的时候,在保存源代码时,就需要务必指定保存为 UTF-­8 编码。当 Python 解释器读取源代码时,为了让它按 UTF-­8 编码读取,我们通常在文件开头写上这两行:
忆想不到的晖
2021/12/06
1.5K0
Go语言中字符串的计算方式
name[1]对应的值是h ,h对应的值是104,有同学要说了,这不就证明"Go语言中字符串第i项是第i个字符"吗? 莫着急,我们接着看下面的一个案例:
似水流年o
2021/12/27
1.1K0
输出这个字符串通过huffman编码后的长度。_Python字符串的45个方法超级详解
参考链接: Python字符串方法| 2(len,count,center,ljust,rjust,isalpha,isalnum,isspace和join)
用户7886150
2021/01/09
9260
python3 三种字符串(无前缀,前缀
首先要明确,虽然有三种前缀(无前缀,前缀u,前缀b),但是字符串的类型只有两种(str,bytes),实验如下:
py3study
2020/01/07
7240
Python字符串
Python 支持格式化字符串的输出 。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。 在 Python 中,字符串格式化使用与 C语言 中 printf 函数一样的语法,如果只使用简单的用法,就可以当成printf 去用,代码示例:
端碗吹水
2020/09/23
9600
Python字符串
Python:字符中文判断及编码识别
python在执行代码过程是不知道这个字符是什么意思的、是否是中文,而是把所有代码翻译成二进制也就是000111这种形式,机器可以看懂的语言。  也就是在计算机中所有的字符都是有数字来表示的。汉字也是有数字表示的,Unicdoe4E00~9FFF表示中文,所以如果一个字符的utf-8编码在这个区间内,就说明它是中文。
Freedom123
2024/03/29
3070
相关推荐
浅谈Python如何处理字符串
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档