Excel REGEXEXTRACT函数使用详解 一文掌握正则表达式数据提取技巧

  发布时间:2025-07-19 17:54:36   作者:手工客  
本文详解Excel中强大的REGEXEXTRACT函数的使用方法,涵盖正则表达式基础、提取数字、字母、汉字、小数等实用技巧,适合需要高效处理文本数据的用户。

今天我们继续来聊聊Excel的新函数——REGEXEXTRACT,它可以根据正则表达式来进行数据的提取,堪称最强大的数据提取工具之一。WPS中该函数称为REGEXP,虽然名称不同,但用法基本一致。

一、什么是正则表达式

正则表达式是一种用于描述文本模式的方法,包含普通字符(如字母a到z)和特殊字符(称为元字符)。它通常用于搜索、编辑或操作文本和数据。简单来说,通过正则表达式可以依据数据的规律进行提取与匹配。

以下是一些常见的元字符,了解即可,无需死记硬背,毕竟现在有AI辅助。

二、REGEXEXTRACT函数

REGEXEXTRACT函数可根据正则表达式提取数据。

  • 参数1:需要提取的文本
  • 参数2:正则表达式
  • 参数3:匹配类型,有3种类型,下文会详细说明
  • 参数4:是否区分大小写

接下来我们通过实例来了解其具体使用方法。

三、常规用法

其中d表示整数,+号表示匹配一个或多个数字。

公式:=REGEXEXTRACT(B3,"d+",0)

将第三个参数设为0或忽略,只返回第一个匹配结果。

公式:=REGEXEXTRACT(B3,"d+",1)

将第三个参数设为1,会返回所有符合条件的结果。

公式:=REGEXEXTRACT(B3,"d+",2)

将第三个参数设为2时会返回错误值,因为2表示获取匹配组的第一个结果,而当前表达式并非匹配组,使用较少,了解即可。

四、提取小数

公式:=REGEXEXTRACT(B3,"d+.?d+",1)

解释一下这个正则表达式:d+表示多个数字,.?表示0个或1个小数点,再次使用d+匹配后续数字,从而实现小数提取。

注意:该函数返回的是文本格式的数字,如需求和需转换为数值格式。

公式:=SUM(REGEXEXTRACT(B3,"d+.?d+",1)*1)

五、提取字母

公式:=REGEXEXTRACT(B3,"[a-z]+",1,0)

第四个参数为0表示区分大小写,为1则不区分。不过也可以直接使用[A-Z]表示大写字母,[a-z]表示小写字母。

六、提取汉字

公式:=REGEXEXTRACT(B3,"[一-龟]+",1)

方括号表示字符集,一-龟表示汉字的Unicode范围,基本涵盖所有常用汉字。

七、AI辅助使用

正则表达式规则繁多,无需全部掌握。如今AI已普及,遇到不会的表达式可直接询问AI,其回答通常准确。

例如提取以下句子中的金额:

早上5个人花了100元,今天中午2个人花了12.6元,晚上花了19.63元。

以上就是今天分享的内容,该函数在WPS中为REGEXP,升级至最新版即可使用,建议动手练习,非常实用。

相关阅读:Excel函数使用技巧、WPS办公软件使用指南、正则表达式入门教程。

相关文章

微信 投稿 脚本任务 在线工具