RHZ'S BLOG | 个人分享

  • 首页
  • 笔记
  • 小日常
  • 音乐
  • 读书
  • 软件分享
YOLO
  1. 首页
  2. 笔记
  3. Code
  4. 正文

正则表达式提取技巧

2022年7月20日 274点热度 0人点赞 0条评论

1.不需要compile

如果阅读PYthon正则表达式模块的源代码,就可看出re.compile()是完全没必要的,

正则表达式提取技巧插图

使用re.compile()的时候,程序内部调用的是_compile()方法;当使用re.finall()的时候,在模块内部自动先调用了_compile()方法,再调用findall()方法。re.findall()自带re.compile()的功能,所以没有必要使用re.compile()。

以上说法,属于作者个人见解,无需过度解读,不一定对

2.先抓大再抓小

一些无效内容和有效内容可能具有相同的规则,如:

有效用户:
姓名:rhz
姓名:sd
无效用户:
姓名:cc
姓名:ss

如果使用姓名:(.*?)\n来进行匹配,就会把有效信息和无效信息混在一起,难以区分

正则表达式提取技巧插图1

要解决这个问题,就需要使用先抓大后抓小的技巧,先把有效用户这个整体匹配出来,再从有效用户里面匹配出人名

正则表达式提取技巧插图2

3.括号内与括号外

正则表达式提取技巧插图3

如果括号里面有其他普通字符,那么这些普通字符就会出现在获取的结果里面。把普通的字符放在括号里面就表示结果中需要包含他们。

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可
标签: 暂无
最后更新:2022年7月20日

RHZ

即使单枪匹马,我亦勇敢无畏

点赞
< 上一篇
下一篇 >

文章评论

取消回复
归档
  • 2023年2月
  • 2022年12月
  • 2022年11月
  • 2022年10月
  • 2022年9月
  • 2022年8月
  • 2022年7月
  • 2022年6月
  • 2022年5月
  • 2022年4月
  • 2022年3月
  • 2022年2月
  • 2021年12月
  • 2021年11月
  • 2021年10月
  • 2021年8月
  • 2021年7月

COPYRIGHT © 2022 RHZ的博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

渝ICP备2022008933号-1