首页 > 美文鉴赏

Oracle中的正则表达式（及函数）详解

更新时间:2023-06-19 10:34:04 阅读：评论：0

1、概述

相信⼤家对正则表达式都不陌⽣，从linux下的命令到Java等编程语⾔，正则表达式⽆处不在，虽然我们实际使⽤的时候也并不⼀定太多，但是当我们要处理字符串时，它确实是⼀个强⼤的⼯具。

上⼀篇⽂章（Oracle中的字符串类型及相关函数详解）中，已经介绍了⼀些串相关的函数，也列出了⽤于正则表达式的函数，本⽂就正式介绍他们。

本⽂基于Oracle 12c ，可能部分内容在较⽼的版本中不适⽤。

运算符

在介绍函数前，这⾥先说明⼀下Oracle中正则表达式运算符及其描述。

如果不知道他们有什么⽤，或者也不知道描述说的是什么，没关系，可以先看后⾯的介绍，就知道他们的含义了。

合理的使⽤这些运算符，配合正则表达式相关的函数，不但可以让字符串处理变得更加⾼效，还能⼤⼤的减少代码量。

2、相关函数

统⼀说明：

函数中pattern为正则表达式，最多可以包含512个字节。

下⾯的介绍中，是不同的函数，如若参数描述字符串相同，即他们的意思也是相同的（如regexp_substr函数和regexp_instr函数中

的position意思都是表⽰开始搜索的位置），为了内容紧凑，只在那个参数第⼀次出现的地⽅作介绍。

参数带char的表⽰简单的串类型，带string的可以包含⼤对象串类型（如clob）。

惯例，“[]”表⽰可选参数。

2.1、REGEXP_SUBSTR卜居

我不够爱你REGEXP_SUBSTR函数使⽤正则表达式来指定返回串的起点和终点。

语法：

regexp_substr(source_string,pattern[,position[,occurrence[,match_parameter]]])

source_string：源串，可以是常量，也可以是某个值类型为串的列。

position：从源串开始搜索的位置。默认为1。

occurrence：指定源串中的第⼏次出现。默认值1.

match_parameter：⽂本量，进⼀步订制搜索，取值如下：

‘i’ ⽤于不区分⼤⼩写的匹配。

‘c’ ⽤于区分⼤⼩写的匹配。

‘n’ 允许将句点“.”作为通配符来匹配换⾏符。如果省略改参数，句点将不匹配换⾏符。

‘m’ 将源串视为多⾏。即将“^”和“$”分别看做源串中任意位置任意⾏的开始和结束，⽽不是看作整个源串的开始或结束。如果省略该参数，源串将被看作⼀⾏来处理。

如果取值不属于上述中的某个，将会报错。如果指定了多个互相⽭盾的值，将使⽤最后⼀个值。如’ic’会被当做’c’处理。

省略该参数时：默认区分⼤⼩写、句点不匹配换⾏符、源串被看作⼀⾏。

例1：

lect regexp_substr('MY INFO: Anxpp,22，and boy','my',1,1,'i') from urs;

将返回MY，如果将match_parameter改为’c’将不返回任何内容（null）。

例2：

lect regexp_substr('MY INFO: Anxpp,23，and boy','[[:digit:]]',1,2) from urs;

此处会返回3。

注意这⾥同时⽤到了“[]”和“[:digit:]”。

经常洗头好吗2.2、REGEXP_INSTR

REGEXP_INSTR函数使⽤正则表达式返回搜索模式的起点和终点（整数）。如果没有发现匹配的值，将返回0。

语法：

regexp_instr(source_string,pattern[,position[,occurrence[,return_option[,match_parameter]]]])

return_option：为0时，返回第⼀个字符出现的位置，与instr作⽤相同。为1时，返回所搜索字符出现以后下⼀个字符的位置。默认为0。例1：

lect regexp_instr('MY INFO: Anxpp,23，and boy','[[:digit:]]') from urs;

该例会返回16。

REGEXP_INSTR函数常常会被⽤到where⼦句中。

2.3、REGEXP_LIKE

通常使⽤REGEXP_LIKE进⾏模糊匹配。

语法：

市盈率是什么意思

regexp_like(source_string,pattern[match_parameter])

⽐如，查找电话好吗以666开头的：

lect name from urs where regexp_like(phone,'666');

例1：

lect * from urs where regexp_like('MY INFO: Anxpp,23，and boy','[[:digit:]]');茉莉花茶属于什么茶

此例判断串中是否包含数字。

该函数可以使⽤前⾯介绍的所有搜索功能作为REGEXP_LIKE搜索的⼀部分，可以是⾮常复杂的搜索变得简单。

2.4、REPLACE和REGEXP_REPLACE

REPLACE函数⽤于替换串中的某个值。

语法：

replace(char,arch_string[,replace_string])

如果不指定replace_string，会将搜索到的值删除。

输⼊可以是任何字符数据类型：char,varchar2,nchar,nchar,nvarchar2,clob或nclob。

例1：

作文两百字lect replace('MY INFO: Anxpp,23，and boy','an') from urs;

返回：MY INFO: Anxpp,23，d boy

下⾯演⽰使⽤该函数计算某字串在源串中出现的次数：

lect (length('MY INFO: Anxpp,23，and boy')-length(replace('MY INFO: Anxpp,23，and boy','an')))/length('an') from urs;

REGEXP_REPLACE是REPLACE的增强版，⽀持正则表达式，扩展了⼀些功能。

语法：山药炖排骨的做法

regexp_replace(source_string,pattern[,replace_string[,position[,occurrence[,match_parameter]]]])

replace_string表⽰⽤什么来替换source_string中与pattern匹配的部分。

occurrence为⾮负整数，0表⽰所有匹配项都被替换，为正数时替换第n次匹配。

其他参数在前⾯都已经介绍过了。

伤心女人

例1：

想象这样⼀个场景：有⼀个分布式的爬⾍，负责抓取⽹页的程序已经将数据存⼊数据库，⽽当前负责处理的程序需要从其中读取其中的⼀些数据，包括电话号码。号码⼀般是11为，前3位区号，中间4位表⽰交换机，再加上后⾯4位，格式也不能确定，我们可以试着⽤下⾯的SQL来读取，⽣成我们想要的格式：

lect regexp_replace('电话：023 5868-8888 邮箱：',

'.*([[:digit:]]{3})([^[:digit:]]{0,2})([[:digit:]]{4})([^[:digit:]]{0,2})([[:digit:]]{4}).*',

'(\1)\3\5'

) phone from urs;

该例返回：(023)58688888

“\1”、“\3”、“\5”分别表⽰第1、3、5个数据集。其他的，⼤家慢慢看就能看懂了。

配合where⼦句，可以限制要返回的⾏。

2.5、REGEXP_COUNT

REGEXP_COUNT函数返回在源串中出现的模式的次数，作为对REGEXP_INSTR函数的补充。

虽然COUNT是⼀个集合函数，操作的是⾏组，但是REGEXP_COUNT是单⾏函数，分别计算每⼀⾏。

语法：

regexp_count(source_char,pattern[,position[,match_param]])

REGEXP_COUNT返回pattern在source_char串中出现的次数。如果未找到匹配，函数返回0。

metch_param参数，相对于前⾯介绍的match_parameter参数多⼀个取值“x”。

‘x’：忽略空格字符。默认情况下，空格与⾃⾝想匹配。

metch_param如果指定了多个互相⽭盾的值，将使⽤最后⼀个值。

前⾯介绍了使⽤replace函数统计字串在源串中出现的次数，这⾥可以使⽤REGEXP_COUNT实现，⽽且看起来更简单：

lect regexp_count('MY INFO: Anxpp,23，and boy','an') from urs;

返回：1

此处还是使⽤match_param参数进⾏不区分⼤⼩写搜索：

lect regexp_count('MY INFO: Anxpp,23，and boy','an',1,'i') from urs;

返回：2

3、总结

以上正则表达式相关函数的使⽤，主要体现在对正则表达式的掌握程度上，如果精通了正则表达式，⼀些⾮常复杂的串处理，也能⽤⽐较简洁的代码完成。

本文发布于:2023-06-19 10:34:04，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/89/1045450.html

上一篇：正则表达式匹配引号中间的内容怎么写？

下一篇：python爬取asphttperror400._python爬虫1网页下载与正则匹配

标签：函数源串搜索返回出现匹配位置参数

留言与评论（共有 0 条评论）