在ASP中用“正则表达式对象”来校验数据的合法性

2018-09-06 11:58

阅读:314

  在使用ASP来进行后端的数据合法性校验的时候,有些人为满足不同环境下面的数据校验,编写了很多的函数来实现,比如,我们想要校验用户输入的URL 地址是否合法,是可以自己编写一段代码来逐个逐个字符的分析用户输入的信息,要分析的信息量小了,那还比较好办,若是分析的条件千变万化,那可就惨了,不但要编写很长很繁琐的代码,而且运行的效率极其低下,有没有好的解决办法呢?有,那就是VBScritp5.0提供的“正则表达式”对象,只要你的服务器安装了IE5.x,就会带VBScript5.0。其实,“正则表达式”原本是Unix下面的专利,尤其是在Perl语言中使用的最为广泛,正是由于“正则表达式”的强大功能,才使得微软慢慢将正则表达式对象移植到了视窗系统上面,利用

“正则表达式”对象,我们就可以非常方便的对各种数据进行合法性的校验了。

首先,让我们来了解一下究竟什么是VBScript的“正则表达式”对象,我们先来看一段程序:

Function CheckExp(patrn, strng)

Dim regEx, Match 建立变量。

Set regEx = New RegExp 建立正则表达式。

regEx.Pattern = patrn 设置模式。

regEx.IgnoreCase = true 设置是否区分字符大小写。

regEx.Global = True 设置全局可用性。

Matches = regEx.test(strng) 执行搜索。

CheckExp = matches

End Function

在这段程序程序中,我们看到可以使用“New RegExp”来得到一个正则表达式对象,然后对这个对象进行正则匹配模板的赋值,也就是告诉正则表达式对象,你想要匹配一个什么样子的模板,然后使用方法Test来检测待处理的数据究竟和我们给出的模版是否相匹配,如果不匹配,那就表明待处理的数据不是合法的数据,从而也就实现了数据合法性的校验,我们可以看出,使用一个设计合理的匹配模板,我们可以轻松的校验一批格式类似的数据信息。

当然,VBScript5.0中的“正则表达式”对象还有很多的其他的方法和属性,比如方法Replace(),利用他我们就可以很快的实现现在网上很时髦的UBB风格的论坛以及BBS,这不在我们讨论范围之内,以后再加以论述,我们现在就看看在数据校验方面正则表达式对象常用的方法和属性:



常用方法: Execute 方法

描述:对指定的字符串执行正则表达式搜索。

语法:object.Execute(string)Execute 方法的语法包括以下几个部分:

object:必需的。总是一个 RegExp 对象的名称。

string:必需的。要在其上执行正则表达式的文本字符串。

说明:正则表达式搜索的设计模式是通过 RegExp 对象的 Pattern 来设置的。Execute 方法返回一个

Matches 集合,其中包含了在 string 中找到的每一个匹配的 Match 对象。如果未找到匹配,Execute 将返回空的 Matches 集合。

Test方法

描述:对指定的字符串执行一个正则表达式搜索,并返回一个 Boolean 值指示是否找到匹配的模式。

语法:object.Test(string)

Test 方法的语法包括以下几个部分:

object:必需的。总是一个 RegExp 对象的名称。

string:必需的。要执行正则表达式搜索的文本字符串。



说明:正则表达式搜索的实际模式是通过RegExp对象的Pattern属性来设置的。RegExp.Global属性对Test方法没有影响。如果找到了匹配的模式,Test方法返回True;否则返回False。



常用属性: Global属性

描述:设置或返回一个 Boolean 值,该值指明在整个搜索字符串时模式是全部匹配还是只匹配第一个。

语法:object.Global [= True False ]

object 参数总是 RegExp 对象。如果搜索应用于整个字符串,Global 属性的值为 True,否则其值为 False。默认的设置为 True。

IgnoreCase属性

描述:设置或返回一个Boolean值,指明模式搜索是否区分大小写。

语法:object.IgnoreCase [= True False ]

object 参数总是一个 RegExp 对象。如果搜索是区分大小写的,则 IgnoreCase 属性为 False;否则为 True。缺省值为 True。

Pattern属性

描述:设置或返回被搜索的正则表达式模式。 这是一个最重要的属性,我们主要是设置这个属性来实现数据校验的。

语法:object.Pattern [= searchstring]

Pattern 属性的语法包含以下几个部分:

object:必需的。总是一个 RegExp 对象变量。

searchstring:可选的。被搜索的正则字符串表达式。它可能包含设置部分表格中的各种正则表达式字符。

设置:在书写正则表达式的模式时使用了特殊的字符和序列。下表描述了可以使用的字符和序列,并给出了实例。



字符描述: :将下一个字符标记为特殊字符或字面值。例如n与字符n匹配。n与换行符匹配。序列与匹配,(与(匹配。

^ :匹配输入的开始位置。

$ :匹配输入的结尾。

* :匹配前一个字符零次或几次。例如,zo*可以匹配z、zoo。

+ :匹配前一个字符一次或多次。例如,zo+可以匹配zoo,但不匹配z。

? :匹配前一个字符零次或一次。例如,a?ve?可以匹配never中的ve。

.:匹配换行符以外的任何字符。

(pattern) 与模式匹配并记住匹配。匹配的子字符串可以从作为结果的 Matches 集合中使用 Item [0]...[n]取得。如果要匹配括号字符(和 ),可使用( 或 )。

xy:匹配 x 或 y。例如 zfood 可匹配 z 或 food。(zf)ood 匹配 zoo 或 food。

{n}:n 为非负的整数。匹配恰好n次。例如,o{2} 不能与 Bob 中的 o 匹配,但是可以与foooood中的前两个o匹配。

{n,} :n 为非负的整数。匹配至少n次。例如,o{2,}不匹配Bob中的o,但是匹配foooood中所有的o。o{1,}等价于o+。o{0,}等价于o*。

{n,m} :m 和 n 为非负的整数。匹配至少 n 次,至多 m 次。例如,o{1,3} 匹配 fooooood中前三个o。o{0,1}等价于o?。

[xyz] :一个字符集。与括号中字符的其中之一匹配。例如,[abc] 匹配plain中的a。

[^xyz] :一个否定的字符集。匹配不在此括号中的任何字符。例如,[^abc] 可以匹配plain中的p.

[a-z] :表示某个范围内的字符。与指定区间内的任何字符匹配。例如,[a-z]匹配a与z之间的任何一个小写字母字符。

[^m-z] :否定的字符区间。与不在指定区间内的字符匹配。例如,[m-z]与不在m到z之间的任何字符匹配。

b :与单词的边界匹配,即单词与空格之间的位置。例如,erb 与never中的er匹配,但是不匹配verb中的er。

B :与非单词边界匹配。ea*rB与never early中的ear匹配。

d :与一个数字字符匹配。等价于[0-9]。

D :与非数字的字符匹配。等价于[^0-9]。

f :与分页符匹配。

n :与换行符字符匹配。

r :与回车字符匹配。

s :与任何白字符匹配,包括空格、制表符、分页符等。等价于[ fnrtv]。

S :与任何非空白的字符匹配。等价于[^ fnrtv]。

t :与制表符匹配。

v :与垂直制表符匹配。

w :与任何单词字符匹配,包括下划线。等价于[A-Za-z0-9_]。

W :与任何非单词字符匹配。等价于[^A-Za-z0-9_]。

num :匹配 num个,其中 num 为一个正整数。引用回到记住的匹配。例如,(.)1匹配两个连续的相同的字符。

n:匹配 n,其中n 是一个八进制换码值。八进制换码值必须是 1, 2 或 3 个数字长。

例如,11 和 11 都与一个制表符匹配。011等价于01 与 1。八进制换码值不得超过 256。否则,只有前两个字符被视为表达式的一部分。允许在正则表达式中使用ASCII码。

xn:匹配n,其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。例如,x41匹配A。x041等价于x04 和 1。允许在正则表达式中使用 ASCII 码。

好了,常用的方法和属性就是这些了,上面的语法介绍的已经很详细了,我们就没有必要在罗嗦了,接下来我们来看看在具体的例子里面如何使用这些方法和属性来校验数据的合法性,我们还是举个例子吧,比如,我们想要对用户输入的电子邮件进行校验,那么,什么样的数据才算是一个合法的电子邮件呢?我可以这样输入:当然我也会这样输入:但是这样的输入就是非法的:者cn,等等,所以我们得出一个合法的电子邮件地址至少应当满足以下几个条件:

1. 必须包含一个并且只有一个符号“@”

2. 必须包含至少一个至多三个符号“.”

3. 第一个字符不得是“@”或者“.”

4. 不允许出现“@.”或者.@

5. 结尾不得是字符“@”或者“.”

所以根据以上的原则和上面表中的语法,我们很容易的就可以得到需要的模板如下:(w)+[@]{1}(w)+[.]{1,3}(w)+

接下来我们仔细分析一下这个模板,首先“w”表示邮件的开始字符只能是包含下划线的单词字符,这样,满足了第三个条件;“[@]{1}”表示在电子邮件中应当匹配并且只能匹配一次字符“@”,满足了条件一;同样的“[.]{1,3}”表示在电子邮件中至少匹配1个至多匹配3个字符“.” ,满足了第二个条件;模板最后的“(w)+”表示结尾的字符只能是包含下划线在内的单词字符,满足了条件五;模板中间的“(w)+”满足了条件四。

然后,我们就直接调用刚才的那个函数CheckExp((w)+[@]{1}(w)+[.]{1}(w)+,待校验的字符串)就好了,如果返回True就表示数据是合法的,否则就是不正确的,怎么样,简单吧。我们还可以写出来校验身份证


评论


亲,登录后才可以留言!