JavaScript学习笔记(十一)——正则表达式


正则表达式

什么是正则表达式?

正则表达式RegExp(Regular Expression):匹配 特殊字符或有特殊搭配原则的字符 的最佳选择,也就是说他是属于字符串的相关操作。

首先我们要知道:

  • 转义字符/,在反斜杠/后边放的紧挨着得字符被强制转化成文本

    eg:
        /"   实现在双引号里再放双引号
        /r   行结束符,即回车
        /t   制表符,键盘得tab键
  • 多行字符串

    eg: 
        /    还可以转义回车(换行)符号,实现js语法上的多行字符串
  • 换行的转义字符

    eg: 
        /n   实现换行

1、 语法规则

1、三个属性i,g,m

修饰符 功能描述
i 不区分大小写的匹配
g 全局匹配(查找所有匹配的,而不是在匹配第一个之后就结束)
m 多行匹配

例子说明:

i:不区分大小写的匹配

var  reg=/abce/i;
var  str="ABCEd";
var re = reg.test(str);
console.log(re);   //true

g:全局匹配(查找所有匹配的,而不是在匹配第一个之后就结束)

var reg=/ab/;
var str="ababababab";
str.match(reg);//["ab"],只查找到第一个匹配值便返回
reg=/ab/g;
str.match(reg);//["ab","ab","ab","ab","ab"],全局查找,把所有匹配值均返回

m:多行匹配

var reg = /a/;
str = "abcde/na";
var re1=str.match(reg); 
console.log(re1); //["a"],还没有多行匹配属性
​
reg = /^a/gm; //全局多行匹配
var re2 = str.match(reg);
console.log(re2); //["a","a"]

2、创建方式

正则表达式有两种创建方式:

直接量和构造方法RegExp( )

  1. 直接量

    本身是一个对象,是一种规则

    • 在两个斜杠中间写规则。

      var  reg=/abc/;
      var  str="abcd";
      reg.test(str)  ;    //test,检查在字符串str中有没有符合reg规则得字符
    • 在正则表达式得双斜杠后边还可以加字母i、g、m,表达其属性。

      var  reg=/abce/i;
      var  str="ABCEd";
      reg.test(str)  ; //true
  2. 构造方法RegExp( )

    • 使用new操作符,new RegExp();

      var reg=new RegExp("abc");
      var str="abcd";
      reg.test(str);
    • 在new RegExp(“abc”)函数里边也可以添加属性i、g、m

      var reg=new RegExp("abc","im");//在括号后面用,隔开并且用引号引起来
      var str="abcd";
      reg.test(str);  //true

      若去除new操作符,将已经存在的正则表达式用来给函数RegExp()传参,只是传递引用,不能构建新的正则表达式,极少的用法。

      //reg与reg1只是对同一个正则表达式的引用
      //eg:
      var reg=/abce/m;
      var reg1=RegExp(reg);
      reg.abc=3;
      console.log(reg1.abc);//3

3、 方括号

方括号用于查找某个范围内的字符:

表达式 描述
[abc] 查找反括号之间的任意字符
[0-9] 查找任何从0到9的数字
(x|y) 查找任何以|分割的选项
^ 插入符^放到[]里边表示”非”的意思
| 在括号里加入”|”表示或的意思,“|”两边放匹配规则

简单理解就是:一个中括号代表一位,中括号里边的内容代表的是这一位可以取值的范围

var reg=/[ab][cd][d]/g;  //全局匹配三位数,第一位取值范围为ab,第二位取值范围为cd之间任意一个,第三位为d。
var str="abcd";
str.match(reg); //['bcd']

再来看个例子:

var reg=/[0-9A-Za-z][cd][d]/g;//相当于var reg=/[0-9A-z][cd][d]/g
var str="ab1cd"; 
str.match(reg);//['1cd']  匹配三位数,第一位范围为0到9的数字或者大小写字母,第二位范围为cd中任意一个,第三位为d 。
  • 插入符 ^ 放到[]里边表示”非”的意思

例子:

var reg=/[^a][^b]/g;//插入符^放到[]里边表示"非"的意思
var str="ab1cd";
str.match(reg);  //['b1', 'cd']
  • 括号里可以加入”|”表示”或”的意思,”|”操作符两边放匹配规则

    var reg=/(abc|bcd)/g;
    var str="abc";
    str.match(reg);//["abc"];//该规则既能匹配出字符串"abc"
​
    str="bcd";
    str.match(reg);//["bcd"];//该规则又能匹配出字符串"bcd"
    reg=/(abc|bcd)[0-9]/g;  //匹配规则可以任意组合
    str="bcd2";
    str.match(reg); //['bcd2']

4、三种检测匹配方法

检测字符串中符合正则表达式规则常用的三方法test( )、exec( )和match( )。

  1. test( ):

    语法:正则表达式规则.test(字符串); 返回值为布尔值:true / false

    var  reg=/abce/i;
    var  str="ABCEd";
    reg.test(str)  ;
  2. match( )

    语法:字符串.match(正则表达式规则); 以数组形式返回匹配的值

    var  reg=/[1234567890][1234567890][1234567890]/g;
    var  str="12309u98723zpoixcuypiouqwer";
    str.match(reg);  //['123', '987']
  3. exec( ):

    语法:正则表达式规则.exec(字符串); 以数组的形式返回匹配的值

    var reg = /[1234567890][1234567890][1234567890]/g;
    var str = "12309u98723zpoixcuypiouqwer";
    console.log(reg.exec(str));  //['123']

此外还有方法可以实现字符串匹配:

方法 描述
search 检索与正则表达式相匹配的值,返回匹配字符串的位置
match 找到一个或多个正则表达式的匹配
replace 替换与正则表达式匹配的字串
split 把字符串分割为字符串数组

5、元字符

元字符是拥有特殊含义的字符,元字符也可以组合放进中括号里去使用,一个元字符代表一位(/d|/D)

元字符 描述
/w –word 查找单词字符(字母+数字+下划线)
/W 查找非单词字符==[^/w]
/d –data 查找数字
/D 查找非数字字符
/s –space 查找空白字符
/S 查找非空白字符
/b –border 匹配单词边界 “today is friday”
/B 匹配非单词边界
/t 查找制表符
/r 回车符
/n 查找换行符
/f 查找换页符
/v 查找垂直制表符
/uXXXX 查找以十六进制规定的Unicode字符 借助“Unicode在线编码转换器
. –必记 (点号)查找单个字符,除了换行和行结束符
  • unicode编码,/uXXXXXX,一般为6位16进制码

不需要记住哪个字符对应是哪个Unicode编码,要用到的时候可借助“Unicode在线编码转换器”

JavaScript学习笔记(十一)——正则表达式

  • “/s”—->匹配空白字符 空白字符包括:空格符[ ]、制表符/t、回车符/r、换行符/n、垂直换行符/v、换页符/f

  • “/b”—->匹配单词边界(border)

        var reg=//bcde/g;//单词边界前边是cde字符串
        var str="abc cde fgh";
        str.match(reg);  //['cde']
  • “/t”—->匹配制表符

    //eg:
        var reg=//tc/g;
        var str="ab     cde";//c字母前有一个tab键
        str.match(reg);//  null,无法匹配视觉效果上的一个tab
    ​
        str="ab/tcde";  
        str.match(reg);//[" c"]
        //即"/t"只能匹配字符"/t",控制台对/t的打印以转义序列制表符"/t"的方式打印
        //所以最后结果是[" c"]
        
    ​
        //其他"/n"、"/f"、"/v"类似于"/t"的使用
        //"."---->[^/r/n],匹配"非"行结束符和换行符

6、量词

量词,代表数量的词(下面表达式的n代表的是一个匹配规则,n后边符号的符号定义量词规则)。

量词 描述
n+ 匹配任何包含至少一个n的字符串
n* 匹配任何包含零个或多个n的字符串
n? 匹配任何包含零个或一个n的字符串
n{X} 匹配包含X 个n 的序列的字符串 十个单词://w{10}/
n{X,Y} 匹配任何包含X 个至Y 个n 的序列的字符串 //w{6,16}/
n{X,} 匹配包含至少X 个n 的序列的字符串
n$ 匹配任何结尾为n 的字符串
^n 匹配任何开头为n 的字符串
S(?=n) 匹配任何其后紧接指定字符串n 的字符串S abc(?=d):abc后面紧接d
S(?!n) 匹配任何其后没有紧接指定字符串n 的字符串S abc(?!d)
  • S(?=n):匹配任何其后紧接指定字符串n 的字符串S

var reg = /abc(?=d)/g;
var str = "abcdecde   abcd"; 
console.log(str.match(reg)); //['abc', 'abc']
  • S(?!n):匹配任何其后没有紧接指定字符串n 的字符串S

var reg = /abc(?!d)/g;
var str = "abcdecde   abcd"; 
console.log(str.match(reg)); //null  没有找到

7、正则实例属性

1、ignoreCase 是否设置了i

2、global 是否设置了g

3、multiline 是否设置了m

4、source 字面量形式对应的字符串

5、lastIndex 开始搜索下一个匹配项的字符位置,默认0

var reg=/^/d[/s/S]*/d$/g;
reg.ignoreCase;//false,检测是否含有i 属性
​
reg.global;//true,检测是否含有g 属性
​
reg.multiline;//false,检测是否含有m 属性
​
reg.source;//"^/d[/s/S]*/d$",匹配内容体

补充:”/num” 反向引用,指的是要引用的第num个括号里的表达式值

var str="aaaa";
var reg=/(/w)/1/g;//括号"()"后边的"/1"为反向引用第一个括号的值
reg=/(/w)/1/1/1/g;//3个"/1"代表后边还要引用第一个括号里的值3次

8、贪婪匹配与非贪婪匹配

  • 贪婪匹配即照着“量词”规则中要求的更多个的情况去做匹配

    var str="aaaaa";
    var reg=/a+/g;
    str.match(reg);//["aaaaa"]
  • 非贪婪匹配,在“量词”规则后边多加一个问号”?”

    var str="aaaaa";
    var reg=/a+?/g;
    str.match(reg);//["a","a","a","a","a"]
​
    var str="aaaaa";
    var reg=/a??/g;//第一个问号代表0~1个,第二个问号代表能取0就不取1去做匹配
    str.match(reg);//["","","","","",""]
​
    //实用:匹配用双大括号括起来的字符
    var l=//{/{(.+)/}/}/g;
    var r=//{/{(.+?)/}/}/g;
    var str=`{{name}}--{{msg}}`
    
    str.match(l);//["{{name}}--{{msg}}"]
    str.match(r);//["{{name}}", "{{msg}}"]

学习了正则表达式后,我们可以很容易就实现以下功能的描述:

  1. 是否带有小数

    var objRegExp= /^/d+/./d+$/;
    ​
  2. 校验是否中文名称组成

    var reg=/^[/u4E00-/u9FA5]{2,4}$/;
  3. 校验是否全由8位数字组成

    var reg=/^[0-9]{8}$/;
  4. 校验电话码格式

    var reg= /^((0/d{2,3}-/d{7,8})|(1[35847]/d{9}))$/;
  5. 校验邮件地址是否合法

    9391493618639@qq.com

    var reg=/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(/.[a-zA-Z0-9_-])+/;
  6.  

原创文章,作者:254126420,如若转载,请注明出处:https://blog.ytso.com/tech/webdev/272653.html

(0)
上一篇 2022年7月9日 08:31
下一篇 2022年7月9日 08:31

相关推荐

发表回复

登录后才能评论