(声明:文章所有的内容来自python官网的英文文档和python学习手册以及作者本人的理解,最终解释权归作者本人所有)
1
我们为什么要学习字符串的一些处理方法,因为这样对于将来我们做爬虫的时候有一定的帮助,我们从不同网站上爬取下来的数据格式都不一样,里面含有很多的空格和特殊字符,所以直接拿来使用肯定是不方便的,我们要利用字符串的方式对其做一些清理。
计算机里面是如何存储字符串的,最小的分配单元就是一个字节,一个字节存储的最大值是255,所以255以下的数字存储都是一个字节,如果是100的字符串,不管你的双引号里面是什么东西,一个东西占用一个字节。所以字符串100占用的是3个字节,与c语言不一样,C语言是四个字节,它后面多了一个“\0”。
cpu 读写的速度远远超过硬盘数据的传输速度,因为硬盘既要存储存储大量的东西,速度就上不去,所以就出现了内存,整合两者的特点,存储的数据远远大于cpu,而内存的数据传输速度远远高于硬盘。
字符串是不可变,同样是加法,python会判断执行加法两边的类型不一样,执行的效果也是不一样的,同时可以用占位符的方式去拼接一个字符串。
2
在这里讲一下python字符串的几种常用的处理方法:
s.find()
在一个大的文件当中找出某个字符串,如果有,则出现这个字符串首字母的下标。如果没有,则返回-1.
s.replace()
这个函数主要是作为替换字符串之用的,因为我们用爬虫从网上爬取数据之后,需要对其进行简单的清理,上面可能存在错误的单词,或者一些敏感词汇我们需要隐去。
s.split:
切割 按照空格
进行切割。
如果想按照换行符进行分割,我们可以调用splitlines()的切割
s.partition()也是一种切割,但是这种是根据括号中的字符串来分成三个等分,中间字符串左边的,中间字符串,中间字符串右边的。
3
s.isalpha:
判断这个字符串是否为纯字母,如果是,则为True,否则的话,则为False
isdigit():判断纯数字
isalnum():即是数字也是字母
这些一般用在后台对用户输入的数据进行判断,尤其是对密码的输入,我们需要对这些进行一个筛选。
Isspace 判断是否是纯空格
Startwith 判断以什么东西开头
Endwith 判断以什么东西结尾
在这里我们要实现一个函数,完成一个单独的功能,就是对真正的内容进行判断,以确保用户输入的不是伪装的病毒
4
Lower()让字符串的所有字母小写,upper()让字符串的所有字母大写
用户输入的情况不一样怎么判断大小写问题,为了防止用户输入的东西和你的期望不一样,我们可以用上面这种方法统统给你转换为小写或者大写,这样就可以做一次性if判断。
居中center() 靠左对齐ljust() 靠右对齐rjust()
这种方法是为了让我们的字符串输出排版比较美观,在括号里我们只需要输入总的字节数。
Strip()
是左边和右边包括反斜杠都可以去掉,只要是空格都可以去掉
Lstrip(去掉左边的空格反斜杠啥的)
Rstrip(去掉右边的空格反斜杠啥的)
如果这些字符串的方法没有满足你的胃口,你可以在python的交互模式下,用一个变量绑定一个字符串,然后变量名后面加.,按下tab键,就可以看到字符串的所有方法了。
小贴士:
学生在看视频的时候第一次听总是没有声音,可能是我们的电脑音频驱动坏了,可以先将旧的音频驱动卸载,然后安装上驱动人生一类软件,就会自行用它自带的驱动安装上就可以正常听到声音了。
领取专属 10元无门槛券
私享最新 技术干货