正则表达式练习
发现了一个正则表达式的学习网站,效果 UI 还不错。我自己玩了一遍,难度挺低的,非常适合入门学习。
网址:https://regexlearn.com/zh-cn/learn
跳关方法:
localStorage.setItem('currentStep', JSON.stringify({value: 45}))
window.location.reload()
自己也做了一遍,记录下来。后续或许可以给别人讲,当做例子了。
1. 什么是「正则表达式」?
正则表达式是表示搜索模式的字符串,常缩写成 RegEx
或 RegExp
。它常用于查找和替换文本中的字词。此外,我们可以测试文本是否符合我们设置的规则。 例如,您只想查找文件名列表中,扩展名是 pdf
的文件,那您只需跟着输入 ^\\w+\\.pdf$
就可以找到。随着课程的进行,表达式的含义会变得更加清晰。
readme.md
document.pdf
image.png
music.mp4
manual.pdf
/^\w+\.pdf$/gm
2. 基本匹配
我们想要查找的字符或单词可以直接输入,就像搜索一样。例如,要找出文本中的 curious
一词,只需输入同样的内容。
“I have no special talents. I am only passionately curious.”
― Albert Einstein
/curious/gm
3. 点 .
:任何字符
.
允许匹配任何字符,包括特殊字符和空格。
abcABC123 .:!?
/./g
4. 字符集 [abc]
如果一个词中的字符可以是各种字符,我们就将所有的可选字符写进中括号 []
中。例如,为了查找文本中的所有单词,我们需要编写表达式,在 []
中相邻地输入字符 a
、e
、i
、o
、u
。
bar ber bir bor bur
/b[aeiou]r/g
5. 否定字符集 [^abc]
为了查找下方文本的所有单词(ber
和 bor
除外),请在 []
中的 ^
后面并排输入 e
和 o
。
bar ber bir bor bur
/[^eo]r/g
6. 字母范围 [a-z]
为了查找指定范围的字母,我们需要将起始字母和结束字母写进 []
中,中间用连字符 -
分隔。它区分大小写。请编写表达式,匹配 e
和 o
之间所有的小写字母,包括它们本身。
abcdefghijklmnopqrstuvwxyz
/[e-o]/g
7. 数字范围 [0-9]
为了查找指定范围的数字,我们需要在 []
中输入起始和结束数字,中间用连字符 -
分隔。请编写表达式,匹配 3
到 6
之间的所有数字,包括它们本身。
0123456789
/[3-6]/g
8. 练习
9. 练习:基本匹配
请编写表达式,匹配文本中的单词 of
。
“Every man takes the limits of his own field of vision for the limits of the world.”
― Arthur Schopenhauer
/of/g
10. 练习:匹配任意字符
请编写表达式,匹配文本中所有字母、数字、空格和特殊字符。表达式必须匹配任何字符。
az AZ 09 _- = !? ., :;
/./g
11. 练习:字符集
请编写表达式,匹配文本中所有仅首字母不同的单词。
beer deer feer
/[bdf]eer/g
12. 练习:否定字符集
请编写表达式,匹配除 beor
和 beur
以外的所有单词。要求使用否定字符集完成。
bear beor beer beur
/be[^ou]r/g
13. 练习:字母范围
请编写表达式,匹配 g
到 k
之间的所有字母,包括它们本身。
enBankCard
/[g-k]/g
14. 练习:数字范围
请编写表达式,匹配 2
到 7
之间的所有数字,包括它们本身。
0123456789
/[2-7]/g
15. 练习已完成
16. 重复
一些特殊字符用来指定一个字符在文本中重复的次数。它们分别是加号 +
、星号 *
和问号 ?
。
17. 星号 *
我们在字符后面加上 *
,表示一个字符完全不匹配或可以匹配多次。例如,表示字母 e
在下方文本中不出现,只出现一次或者并排出现多次。
br ber beer
/be*r/g
18. 加号 +
为了表示一个字符可以出现一次或多次,我们将 +
放在它后面。例如,表示 e
在下方文本中出现一次或多次。
br ber beer
/be+r/g
19. 问号 ?
为了表示一个字符是可选的,我们在它后面加一个 ?
。例如,表示下方文本中的字母 u
是可选的。
color, colour
/colou?r/g
20. 大括号 - 1
为了表示一个字符出现的确切次数,我们在该字符的末尾,将它出现的次数写进大括号 {}
中,如 {n}
。例如,表示下方文本中的字母 e
只能出现 2
次。
ber beer beeer beeeer
/be{2}r/g
21. 大括号 - 2
为了表示一个字符至少出现多少次,我们在该字符的末尾,将它至少应出现的次数写进大括号 {}
中,并在数字后面加上逗号 ,
,如 {n, }
。例如,表示下方文本中的字母 e
至少出现 3
次。
ber beer beeer beeeer
/be{3,}r/g
22. 大括号 - 3
为了表示一些字符出现的次数在某个数字范围内,我们在该字符的末尾,将它至少和至多出现的次数写进大括号 {}
中,中间用逗号 ,
分隔,如 {x,y}
。例如,匹配下方文本中,字母 e
出现 1
至 3
次的单词。
ber beer beeer beeeer
/be{1,3}r/g
23. 练习
24. 练习:星号 *
请编写表达式,用 *
匹配下方文本中,没有或存在多个字母 e
的单词。
dp dep deep
/de*p/g
25. 练习:加号 +
请编写表达式,用 +
匹配下方文本中,字母 e
出现一次或多次的单词。
dp dep deep
/de+p/g
26. 练习:问号 ?
请编写表达式,用 ?
表示字母 n
在文本中是可选的,使 a
和 an
都可以匹配到。
a, an
/an?/g
27. 练习:大括号 - 1
用 {}
编写表达式,匹配文本中的 4
位阿拉伯数字。
Release 10/9/2021
/\d{4}/g
28. 练习:大括号 - 2
用 {}
编写表达式,匹配文本中位数至少为 2
的阿拉伯数字。
Release 10/9/2021
/\d{2,}/g
29. 练习:大括号 - 3
用 {}
编写表达式,匹配文本中位数为 1
至 4
的阿拉伯数字。
Release 10/9/2021
/\d{1,4}/g
30. 练习完成
31. 括号 ( )
: 分组
我们可以对一个表达式进行分组,并用这些分组来引用或执行一些规则。为了给表达式分组,我们需要将文本包裹在 ()
中。现在,请尝试为下方文本中的 haa
构造分组。
ha-ha,haa-haa
/(haa)/g
32. 引用组
单词 ha
和 haa
分组如下。第一组用 \\1
来避免重复书写。这里的 1
表示分组的顺序。请在表达式的末尾键入 \\2
以引用第二组。
ha-ha,haa-haa
/(ha)-\1,(haa)-\2/g
33. 括号 (?: )
: 非捕获分组
您可以对表达式进行分组,并确保它不被引用捕获。例如,下面有两个分组,但我们用 \\1
引用的第一个组实际上是指向第二个组,因为第一个是未被捕获的分组。
ha-ha,haa-haa
/(?:ha)-ha,(haa)-\1/g
34. 竖线 |
竖线允许一个表达式包含多个不同的分支。所有分支用 |
分隔。和在字符层面上运作的字符集 [abc]
不同,分支在表达式层面上运作。例如,下面的表达式同时匹配 cat
和 Cat
。请在末尾添加另一个 |
,并输入 rat
以匹配所有单词。
cat Cat rat
/(C|c)at|rat/g
35. 转义字符 \\
在书写正则表达式时,我们会用到 { } [ ] / \\ + * . $^ | ?
这些特殊字符 。为了匹配这些特殊字符本身,我们需要通过 \\
将它们转义。例如,要匹配文本中的 .
和 *
,我们需要在它们前面添加一个 \\
。
(*) Asteriks.
/(\*|\.)/g
36. 插入符 ^
:\n匹配字符串的开始
我们用 [0-9]
查找数字,若仅查找行首的数字,请在表达式前面加上 ^
。
Basic Omellette Recipe
1. 3 eggs, beaten
2. 1 tsp sunflower oil
3. 1 tsp butter
/^[0-9]/gm
37. 美元符号 $
:\n匹配字符串的结束
让我们在 html
的后面添加 $
,来查找仅在行末出现的 html
。
https://domain.com/what-is-html.html
https://otherdomain.com/html-elements
https://website.com/html5-features.html
/html$/gm
38. 单词字符 \\w
: 字母、数字和下划线
表达式 \\w
用于查找字母、数字和下划线。让我们用表达式 \\w
来查找文本中的单词字符。
abcABC123 _.:!?
/\w/g
39. 非单词字符 \\W
\\W
匹配除字母、数字和下划线之外的字符。
abcABC123 _.:!?
/\W/g
40. 数字字符 \\d
\\d
仅用来匹配数字。
abcABC123 .:!?
/\d/g
41. 非数字字符 \\D
\\D
匹配除数字之外的字符。
abcABC123 .:!?
/\D/g
42. 空白符 \\s
\\s
仅匹配空白字符。
abcABC123.:!?
/\s/g
43. 非空白符 \\S
\\S
匹配除空白符之外的字符。
abcABC123 .:!?
/\S/g
44. 零宽断言
如果我们希望正在写的词语出现在另一个词语之前或之后,我们需要使用「零宽断言」。请前往下一步骤,学习如何使用「零宽断言」。
45. 正向先行断言: (?=)
例如,我们要匹配文本中的小时值。为了只匹配后面有 PM
的数值,我们需要在表达式后面使用正向先行断言 (?=)
,并在括号内的 =
后面添加 PM
。
Date: 4 Aug 3PM
/\d+(?=PM)/g
46. 负向先行断言: (?!)
例如,我们要在文本中匹配除小时值以外的数字。我们需要在表达式后面使用负向先行断言 (?!)
,并在括号内的 !
后面添加 PM
,从而只匹配没有 PM
的数值。
Date: 4 Aug 3PM
/\d+(?!PM)/g
47. 正向后行断言: (?<=)
例如,我们要匹配文本中的金额数。为了只匹配前面带有 $
的数字。我们要在表达式前面使用正向后行断言 (?<=)
,并在括号内的 =
后面添加 \\$
。
Product Code: 1064 Price: $5
/(?<=\$)\d+/g
48. 负向后行断言: (?<!)
例如,我们要在文本中匹配除价格外的数字。为了只匹配前面没有 $
的数字,我们要在表达式前用负向后行断言 (?<!)
,并在括号内的 !
后面添加 \\$
。
Product Code: 1064 Price: $5
/(?<!\$)\d+/g
49. 标志
标志改变表达式的输出。这就是标志也称为 修饰符
的原因。标志决定表达式是否将文本视作单独的行处理,是否区分大小写,或者是否查找所有匹配项。请继续下一步步骤以学习标志。
50. 全局标志
全局标志使表达式选中所有匹配项,如果不启用全局标志,那么表达式只会匹配第一个匹配项。现在,请启用全局标志,以便匹配所有匹配项。
domain.com, test.com, site.com
/\w+\.com/g
51. 多行标志
正则表达式将所有文本视作一行。但如果我们使用了多行标志,它就会单独处理每一行。这次,我们将根据每一行行末的规律来写出表达式,现在,请启用多行标志来查找所有匹配项。
domain.com
test.com
site.com
/\w+\.com$/gm
52. 忽略大小写标志
为了使我们编写的表达式不再大小写敏感,我们必须启用 不区分大小写
标志。
DOMAIN.COM
TEST.COM
SITE.COM
/\w+\.com$/gmi
53. 贪婪匹配
正则表达式默认执行贪婪匹配。这意味着匹配内容会尽可能长。请看下面的示例,它匹配任何以 r
结尾的字符串,以及前面带有该字符串的文本,但它不会在第一个 r
处停止匹配。
ber beer beeer beeeer
/.*r/
54. 懒惰匹配
与贪婪匹配不同,懒惰匹配在第一次匹配时停止。下面的例子中,在 *
之后添加 ?
,将查找以 r
结尾且前面带有任意字符的第一个匹配项。这意味着本次匹配将会在第一个字母 r
处停止。
ber beer beeer beeeer
/.*?r/
55. 恭喜,您已完成所有步骤!
您可以随时返回到前面的步骤,并且可以轻松浏览所有已通过的步骤。