前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则表达式使用笔记

正则表达式使用笔记

作者头像
Dickensl
发布2022-06-14 13:48:31
2250
发布2022-06-14 13:48:31
举报
文章被收录于专栏:睿Talks

一、前言

正则表达式在做一些小工具的时候特别实用,但想掌握好并不是一件容易的事情。最近又专门花时间学习了下,顺手记录一些心得。

二、笔记

{ } [ ] / \ + * . $ ^ | ?

元字符

描述

.

句号匹配任意单个字符除了换行符.

[ ]

字符种类. 匹配方括号内的任意字符.

*

匹配>=0个重复的在*号之前的字符.

+

匹配>=1个重复的+号前的字符.

?

标记?之前的字符为可选.

{n,m}

匹配num个大括号之前的字符 (n <= num <= m).

(xyz)

字符集, 匹配与 xyz 完全相等的字符串.

|

或运算符,匹配符号前或后的字符.

\

转义字符,用于匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ |

^

从开始行开始匹配.

$

从末端开始匹配.

  • 贪婪 & 非贪婪

正则表达式默认采用贪婪匹配模式,在该模式下意味着会匹配尽可能长的子串。我们可以使用?来修饰以下字符*, +, ?, {},将贪婪匹配模式转化为非贪婪匹配模式:

/.*at/ => The fat cat sat on the mat /.*?at/ => The fat cat sat on the mat

  • 或运算

对单个字符的或运算,可以使用字符集: /[aeiou]/ => hello world 或者使用或运算符: /a|e|i|o|u/ => hello world 但如果是多个字符,只能使用或运算符: /apple|banana/ => i like apple and banana

  • 捕获组 & 非捕获组

捕获组: (x),非捕获组: (?:x)

捕获组可以被引用,引用的时候是实际匹配上的字符,而不是对应的正则。 (\w+)\s\1可以匹配hi hi,但不能匹配hi ho,因为这里的\1hi,而不是正则\w+

非捕获组主要用于多个字符的匹配,如/(?:foo){1,2}/匹配foo这个单词连续出现 1 到 2 次。如果写成/foo{1,2}/,则只会匹配最后一个o1 到 2 次,而不是整个单词。

  • 先行断言 & 后行断言

符号

描述

例子

?=

正先行断言-存在

/g(?=o)/ => go

?!

负先行断言-排除

/g(?!o)/ => ga

?<=

正后发断言-存在

/(?<=o)k/ => ok

?<!

负后发断言-排除

/(?<!o)k/ => gk

  • /g的坑
代码语言:javascript
复制
const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // false
reg.test("hi dickens"); // true

同一个正则,同一个字符串,为什么会有不同的结果???

当有/g参数时,下次运行test是会基于上一次的匹配位置再继续匹配后面的字符。

代码语言:javascript
复制
const reg = /hi/g;

reg.test("hi dickens"); // true
reg.test("hi dickens"); // 继续匹配后面的字符' dickens',找不到所以返回false
reg.test("hi dickens"); // 因为上一次匹配为 false,从新开始一次匹配,所以返回true

去掉\g参数或者每次重新生成一个正则就能解决这一问题。

三、总结

正则表达式博大精深,如果你遇到什么坑或者有什么使用心得欢迎留言,大家共同来丰富这篇文章。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、笔记
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档