正则表达式入门指南-示例详解一看就懂

前言

在传统操作字符串的过程中，我们可能通过for、indexOf、lastIndexOf、trim等来实现具体的功能。比如找出字符串中是否有 l ，"hello".indexOf("l") > -1，但是hello可能是大写HELLO，我们要实现不管大写还是小写时，那么我们需要再增加一串代码才能实现此功能。那么如果使用正则表达式的话，这将非常简单。/[lL]/.test("hello") 或者 /l/i.test("hello") 都可以。

当然正则表达式远不止于此，这只是一个非常简单的例子。

正则表达式主要用于匹配字符串，用它神奇的语法来实现字符串的搜索、替换、过滤、验证文本数据等操作。在不同编程语言及代码中，我们都能看到它的身影。

当然，不同编程语言的正则表达式语法大体是相通的，同时也有一些细微的差别，多多实践就行。

正则表达式包含普通字符和元字符两种类型，通俗一点的说，普通字符就是直接匹配文本中的字符，比如字母、数字、中文和标点符号等等。而元字符（特殊的字符或正则语法字符）则表示有特殊含义，比如 . 、 ^ 、 $ 、 * 、 + 、 ? 、、 [] 、 | 等。

下面让我们一步一步的走进正则表达式。

声明方式

Javascript的正则表达式的声明一般有两种方式。

1、字面量形式声明，使用两个斜杠来表示。

const reg = /exp/gim

2、字符串形式声明。

const reg = new RegExp('exp', 'gim');

g、i、m为可选参数，分别代表全局匹配、不区分大小写、多行匹配。可以根据实际情况添加使用。

基础用法

1、字符匹配

使用普通字符匹配文本。例如，找出world，替换为King，并且不区分大小写。

const content = 'Hello World!';
// 斜杠后面加 i 表示不区分大小写
const reg = /world/i;
const result = content.replace(reg, 'King');
console.log(result);
//输出： 'Hello King!'

使用 . 匹配任何单个字符。例如，把hello或hallo换成大写HELLO。

const content = 'Hello、hallo';

// 斜杠后面加 i  表示不区分大小写
const reg = /h.llo/i;
const result = content.replace(reg, 'HELLO');
console.log(result);
//输出： 'HELLO、hallo'


// 斜杠后面加 g 表示全局匹配，也就是匹配多次。
// 不加的话表示只匹配一次。
const reg_g = /h.llo/gi;
const result_g = content.replace(reg_g, 'HELLO');
console.log(result_g);
//输出：'HELLO、HELLO'

2、字符集

使用方括号来列出可能的字符。

例如，把所有 a、b、c删除，也就是匹配a或者b或者c。

const content = 'a1 b1 c1 a2 b2 c2 a3 c3';
const reg = /[abc]/g;
const result = content.replace(reg, '');
console.log(result);
//输出：'1 1 1 2 2 2 3 3'

例如，删除所有的小写字符字母。

const content = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ';
// [a-z]表示a-z所有26个字母，
// 相当于[abcdefghijklmnopqrstuvwxyz]的简写。
// 如果还需要删除大写字母，在斜杠后面添加 i 即可。
const reg = /[a-z]/g;
const result = content.replace(reg, '');
console.log(result);
//输出：'ABCDEFGHIJKLMNOPQRSTUVWXYZ'

例如，删除所有非字母的字符。

const content = 'abcd ABCD 123456 中文 ，';
// [^a-z]表示 非 26个字母之外的任何字符。
// 相当于[^abcdefghijklmnopqrstuvwxyz]的简写。
const reg = /[^a-z]/gi;
const result = content.replace(reg, '');
console.log(result);
//输出：'abcdABCD'

当然您可以根据实际情况，写出您需要的表达式。

比如：
所有数字： [d] 或者 [0-9] 。 d 是一种元字符类别，可以用于匹配任何数字字符，包括Unicode整数、全角数字等， [0-9] 只能匹配 ASCII 数字字符 0 到 9。可以根据实际情况选择哪一种。

任何单词字符： w 。 w 相当于 [a-zA-Z0-9_] ，也就是a-z、A-Z、0-9以及下划线_

所有汉字字符：[一-龥]。一和龥是 Unicode 码点，分别对应中文编码范围的起始和结束字符。当然，一些较为生僻的汉字，或者不同文化的汉字可能不在其中，一般情况下已经够用了。

所有已知的汉字：

[一-鿿㐀-䶿豈-﫿U00020000-U0002EBEF]

不要惊讶，这个字符范围包括 [一-鿿]、[㐀-䶿]、[豈-﫿] 以及 [U00020000-U0002EBEF]，覆盖了 CJK（中、日、韩）和 CJK 扩展区的所有汉字，并且也包含了一些较为罕见的汉字和方言汉字。这个范围应该已经可以完整匹配目前已知的汉字了。

根据实际情况选择即可。

3、量词

量词表示指定前面的字符或字符集出现的次数。

常见的量词包括：

“+”：出现一次或多次。
“*”：出现零次或多次。
“?”：出现零次或一次。
“{n}”：刚好出现 n 次。
“{n,}”：出现至少 n 次。
“{n,m}”：出现 n 到 m 次之间。

例如：

匹配多个 l 。 [l]+ 等价于 [l]{1,} 。

[l]{1,}

4、描点

锚点用于匹配文本的位置，而不是字符本身。

常见的锚点包括：

“^”：匹配文本的开头。
“$”：匹配文本的结尾。
“b”：匹配单词边界。
“B”：匹配非单词边界。

例如： /^hello/ ，匹配以hello开头的字符串。 /hello$/ ,匹配以hello结尾的字符串。

/hello/g

/^hello/

高级用法

1、分组

分组可以将正则表达式中的模式组合在一起。

括号 “()” 用于创建组。创建的组可以用于重复、替换等操作。

比如：获取字符串 prvt_site-123 中的 prvt_site 与 123 。

2、向后引用

向后引用允许你在正则表达式中引用先前创建的组。

可以使用反斜杠 “ ”（其中 n 是组号）来引用组。

比如：查找简单的闭合HTML标签。提取标签名及标签内的文本。

3、前瞻和后顾：

前瞻和后顾允许你查找只在特定模式前面或后面的文本。

语法为 “?=”（正向前瞻）、“?!”（负向前瞻）、“?<=”（正向后顾）和 “?”（负向后顾）。

例如：获取收入万元以上的用户。

例如：获取非数字版本操作系统前面的windows。

例如：获取所有windows的版本号。

例如：获取所有非windows后面的版本号

4、正则表达式模式修饰符

修饰符用于更改正则表达式的默认行为。

常见的修饰符包括：

“i”：忽略大小写。
“g”：全局匹配。
“m”：多行匹配。

上面示例中，您可能已经了解了修饰符的用法，自己动手试试吧！

人人为我，我为人人，欢迎您的浏览，我们一起加油吧。

展开阅读全文

页面更新：2024-03-18

标签：量词斜杠汉字大小写示例字符串语法详解字母字符入门文本数字指南

1 2 3 4 5

正则表达式入门指南-示例详解一看就懂

前言

声明方式

基础用法

高级用法

（待和解）梅先生投诉闲鱼购物平台

OPPO A1活力版正式开售大电池大内存售价1799元

美国有人对大疆下黑手了，事情很不简单

只有愚蠢的人才会相信这些错误观点

多壁碳纳米管，在3D打印中，怎样构筑纸基双层结构光致动器？

你平常遇到的电商客服、快餐店服务员，可能是他们……

“人工智能会取代学霸，而不是学渣”

建立一个主体样式第二部分

朋友圈疯传……支付宝紧急辟谣

不顾安危冲进火海救人，广西一快递小哥获评“最美快递员”！

焦点资讯：碳酸锂价格重返30万元产业链订单快速增多

历经3次创业摔打，我总结了6句话，送给正在和打算创业的你

入迷股市，满仓长安汽车，我就这样一直亏一直亏！

降速的元气森林，如何“自救”

投保人：交完20年保险为什么不能拿回我的保费？

数字化发展大会2023（中国·南京）成功举办

三大运营商5G渗透率不断提高数字经济擦亮业绩底色

第六届数字中国建设峰会成果展览会云南省项目成果展示

2023全民数字素养与技能提升月青少年素养数字提升沙

“回家！”《参考消息》数字报走进江西高校

贵州长江汽车：数字赋能打造一流新能源商用车品牌

520一个浪漫的数字，有没有一句是你喜欢的呢

倒计时6天！“炫”起来！数字文化馆点亮美好生活

数字人民币都来了，“互联网彩票”还会远吗？

数字经济时代，平台企业如何激发千亿消费增长？