学的是b站的课程(千锋教育),跟老师写程序,不是自创的代码!
今天是学Python的第22天,学的内容是正则表达式,明天会出一篇详细实例介绍。电脑刚修好!开学了,时间不多,写得不多,见谅。
这里是部分,详细版在后面会出.
是一个特殊的字符序列,计算机科学中的一个概念,主要用来检索\替换那些符合某个模式的文本。在python中使用正则表达式,借助的是re模块,通过re模块可以实现正则表达式的绝大多数的功能。正则表达式在文本处理中扮演着至关重要的角色。它就像是一把神奇的钥匙,可以打开复杂文本数据中的秘密之门。它拥有自己独特的语法和处理引擎,虽然在效率上可能不如一些字符串自带的方法,但在功能的强大性上无可比拟。
1.灵活性\功能性\逻辑性非常强 2.可以使用极简单的方式达到字符串的复杂控制.
爬虫 验证手机号,身份证号,邮箱等 数据分析的数据清洗或整理
要求:封装一个功能,判断用户输入的手机号码是否合法.
普通方法
正则表达式方法
re.search(r"^1\d{10}$",checkPhone)
首先,^ 表示的是正则表达式的开始,\d表示0-9之间的数字,{10}表示重复10次,$表示正则表达式的结束,checkPhone表示被正则表达式检测的变量。结果是一个布尔类型,所以可以用if语句进行检测.
语法:匹配字符串是否以指定的正则内容开头,匹配成功返回对象,匹配失败返回None。
第一个参数:正则表达式; 第二个参数:要验证的字符; 第三个参数:可选参数,正则表达式的修饰符.
只能匹配数字开头的,同时也不能匹配到非数字后面的数字!
语法:匹配字符串中是否包含指定的内容,匹配成功返回对象,匹配失败返回None.
可以匹配非数字开头的,但不能匹配到非数字后面的数字!
语法:re.spilt(正则表达式,"要处理的数据")
语法:re.sub(正则表达式,替换后的内容,要替换的字符串)
语法:最常见的,定义chinese=“[\u4e00-\u9fa5]+]”
自我理解:在这文章只是对正则表达式的一篇简单的介绍入门而已,后面会写一篇文章来介绍不同的正则表达式的使用方法。正则表达式是一篇特别难的知识点,它的应用范围很广,而且它的代码只有在特定的环境中才会很好的被理解。
我们后面写爬虫的时候会继续讲解正则表达式,学好正则表达式对后面的爬虫的理解也很有帮助。
这是我今天学Python的自我想法和对其的理解,有不对的地方请同志们多多包涵,谢谢观看!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有