Excel REGEXEXTRACT函数使用详解 一文掌握正则表达式数据提取技巧
今天我们继续来聊聊Excel的新函数——REGEXEXTRACT,它可以根据正则表达式来进行数据的提取,堪称最强大的数据提取工具之一。WPS中该函数称为REGEXP,虽然名称不同,但用法基本一致。

一、什么是正则表达式
正则表达式是一种用于描述文本模式的方法,包含普通字符(如字母a到z)和特殊字符(称为元字符)。它通常用于搜索、编辑或操作文本和数据。简单来说,通过正则表达式可以依据数据的规律进行提取与匹配。
以下是一些常见的元字符,了解即可,无需死记硬背,毕竟现在有AI辅助。

二、REGEXEXTRACT函数
REGEXEXTRACT函数可根据正则表达式提取数据。
- 参数1:需要提取的文本
- 参数2:正则表达式
- 参数3:匹配类型,有3种类型,下文会详细说明
- 参数4:是否区分大小写
接下来我们通过实例来了解其具体使用方法。
三、常规用法
其中d表示整数,+号表示匹配一个或多个数字。
公式:=REGEXEXTRACT(B3,"d+",0)
将第三个参数设为0或忽略,只返回第一个匹配结果。
公式:=REGEXEXTRACT(B3,"d+",1)
将第三个参数设为1,会返回所有符合条件的结果。
公式:=REGEXEXTRACT(B3,"d+",2)
将第三个参数设为2时会返回错误值,因为2表示获取匹配组的第一个结果,而当前表达式并非匹配组,使用较少,了解即可。

四、提取小数
公式:=REGEXEXTRACT(B3,"d+.?d+",1)
解释一下这个正则表达式:d+表示多个数字,.?表示0个或1个小数点,再次使用d+匹配后续数字,从而实现小数提取。
注意:该函数返回的是文本格式的数字,如需求和需转换为数值格式。
公式:=SUM(REGEXEXTRACT(B3,"d+.?d+",1)*1)

五、提取字母
公式:=REGEXEXTRACT(B3,"[a-z]+",1,0)
第四个参数为0表示区分大小写,为1则不区分。不过也可以直接使用[A-Z]表示大写字母,[a-z]表示小写字母。

六、提取汉字
公式:=REGEXEXTRACT(B3,"[一-龟]+",1)
方括号表示字符集,一-龟表示汉字的Unicode范围,基本涵盖所有常用汉字。

七、AI辅助使用
正则表达式规则繁多,无需全部掌握。如今AI已普及,遇到不会的表达式可直接询问AI,其回答通常准确。
例如提取以下句子中的金额:
早上5个人花了100元,今天中午2个人花了12.6元,晚上花了19.63元。

以上就是今天分享的内容,该函数在WPS中为REGEXP,升级至最新版即可使用,建议动手练习,非常实用。
相关阅读:Excel函数使用技巧、WPS办公软件使用指南、正则表达式入门教程。
相关文章
-
Excel怎么计算时间差? Excel表格计算两个时间相差几小时的技巧
Excel怎么计算时间差?excel表格中输入的时间想要计算两个时间相差几个小时,该怎么计算呢?下面我们就来看看Excel表格计算两个时间相差几小时的技巧,需要的朋友可以参考下04-26 -
Excel表格Ctrl+E都有哪些功能 Excel表格Ctrl+E功能介绍
我们在使用Excel的时候,快捷键可以帮助我们更轻松的办公,其中Ctrl+E的功能就十分实用,一起来了解一下吧04-23 -
excel表格怎么快速分离中英文双语字幕? excel分离中英文字符串的技巧
excel表格怎么快速分离中英文双语字幕?excel表格中想要分离中英文双语字幕,该怎么实现呢?下面我们就来看看excel分离中英文字符串的技巧,需要的朋友可以参考下04-25 -
Excel2019函数MAXIFS怎么用?Excel2019函数MAXIFS使用教程
Excel2019函数MAXIFS怎么用?这篇文章主要介绍了Excel2019函数MAXIFS使用教程,需要的朋友可以参考下02-25 -
Excel2019函数MAXIFS怎么使用?Excel2019函数MAXIFS使用教程
Excel2019函数MAXIFS怎么使用?这篇文章主要介绍了Excel2019函数MAXIFS使用教程,需要的朋友可以参考下01-29

