Python 超级强大的模式匹配工具—Pampy

作者丨Ckend
来源丨Python实用宝典(ID:pythondict)

在自然语言处理界,模式匹配可以说是最常用的技术。甚至可以说,将NLP技术作为真实生产力的项目都少不了模式匹配

什么是模式匹配呢?在计算机科学中,往往是检查给定的序列或字符串中是否有符合某种模式的片段。比如说:“啊,你的AK-47打得真准”,如果我们将 “啊,你的_打得真准 ” 作为一种模式,则会将AK-47匹配出来。

实现模式匹配往往都是用正则表达式,但是如果你想识别特别复杂的模式,编写正则表达式就会变得非常非常麻烦。而Pampy这个项目能解决你不少的烦恼。https://github.com/santinic/pampy

下面是一个使用例子:

1. 安装

赶紧让我们来试一下,安装Pampy前,你要确保Python和pip已经成功安装在电脑上噢

打开Cmd(开始—运行—CMD)或Terminal(command+空格输入Terminal). 输入以下命令安装Pampy:

$ pip install pampy

看到 Successfully installed pampy-0.3.0 则说明安装成功。

2. 使用

特性1:HEAD 和 TAIL

HEAD和TAIL能代表某个模式的前面部分或后面部分。

比如将特定模式后的元素都变成元组:

from pampy import match, HEAD, TAIL, _x = [-1, -2, -3, 0, 1, 2, 3]print(match(x, [-1, TAIL], lambda t: [-1, tuple(t)]))# => [-1, (-2, -3, 0, 1, 2, 3)]

将特定模式前的元素设为集合,后面的元素设为元组:

from pampy import match, HEAD, TAIL, _

x = [-1, -2, -3, 0, 1, 2, 3]

print(match(x, [HEAD, _, _, 0, TAIL], lambda h, a, b, t: (set([h, a, b]), tuple(t))))

# => ({-3, -1, -2}, (1, 2, 3))

特性2:甚至能匹配字典中的键

在你不知道哪个键下有某个值的时候,这招非常好用:

from pampy import match, HEAD, TAIL, _

my_dict = {    'global_setting': [1, 3, 3],    'user_setting': {        'face': ['beautiful', 'ugly'],        'mind': ['smart', 'stupid']    }}

result = match(my_dict, { _: {'face': _}}, lambda key, son_value: (key, son_value))

print(result)

# => ('user_setting', ['beautiful', 'ugly'])

特性3: 搭配正则

不仅如此,它还能搭配正则一起使用哦:

import re

from pampy import match, HEAD, TAIL, _

def what_is(pet):
    return match(
        pet, re.compile('(\w+),(\w)\w+鳕鱼$'), lambda mygod, you: you + '像鳕鱼'
    )

print(what_is('我的天,你长得真像鳕鱼'))
# => '你像鳕鱼'

好了,以上就是今天的文章。

(0)

相关推荐

  • Fluentd部署:多Workers进程模式

    本文介绍如何使用Fluentd的多worker模式处理高访问量的日志事件.此模式会运行多个worker进程以最大利用多核CPU. 原理 默认情况下,一个Fluentd实例会运行一个监控进程和一个工作进 ...

  • Python中JSON结构数据的高效增删改操作

    ❝ 本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes ❞ 1 简介 在上一期文章中我们一起学习了在Py ...

  • Python重大变化:match-case模式匹配

    花下猫语:有很多人期待在 Python 中使用 switch-case 语句,Python 社区里针对它有过长达数年的讨论(PEP-275.PEP-3103),然而结论是不支持.我曾在文章< & ...

  • Python正则表达式之re.match()分组

    https://www.jianshu.com/p/cc26837242b1 我们在面对生物数据,比如序列信息(比如碱基序列.氨基酸序列等)的时候, 会时常要问,这其中是否包含着且含有多少某种已知的模 ...

  • 理解lambda表达式,为什么用它?

    初学者接触 lambda表达式 ,觉得语法很清奇,正好今天看到 python weekly 推送了一个youtube的视频教程,今天大邓就顺便领大家简单认识一下lambda语法. up主:PyLeni ...

  • Python 强大的模式匹配工具

    简说Python 1周前 以下文章来源于Python实用宝典 ,作者Ckend  简说Python推荐  来源|Python实用宝典 作者|Ckend 在自然语言处理界,模式匹配可以说是最常用的技术. ...

  • 软件分享No.2 | 超级强大(免费)的CAD文件格式转换工具!

    CAD格式转换工具 对于工程相关的行业来说,各种图纸是必不可少的,设计图纸.施工图纸.竣工图纸等等,它们最普遍的格式就是利用CAD制作的dwg格式.对于dwg格式的图纸,我们在日常工作中无非是两个需求 ...

  • Pandoc:一个超级强大的文档格式转换工具

    文章目录 Pandoc 简介 下载安装 Windows macOS Linux 初步使用 Pandoc 集成 相关资源 总结 大家好,我是只谈技术不剪发的 Tony 老师.最近发现了一款免费的文档格式 ...

  • 功能超级强大的AI驱动自动一键安卓抠图工具,人物商品图章签名logo

    抠图是我们日常工作中经常遇到的一项工作,比方说扣个签名,扣个人像,或者给产品扣一张白底图,但是很多软件我们试过以后,发现都不太好用,扣出来的效果非常不好,边界非常粗糙,抠图这项工作看起来简单,但是对于 ...

  • 一款超级强大的慢SQL排查工具!

    作者丨李立敏 来源:经授权转自 Java识堂(ID:erlieStar) 开启慢查询日志 在项目中我们会经常遇到慢查询,当我们遇到慢查询的时候一般都要开启慢查询日志,并且分析慢查询日志,找到慢sql, ...

  • 强大的数学工具:不变量,捕捉数学对象的本质

    当丽莎·皮克西里洛解开了关于"康威结"的这个长达几十年的数学难题时,她必须克服这个结的神秘能力--它能欺骗数学家们设计的一些最强大的工具.这些工具被称为不变量,它不仅是纽结理论的支 ...

  • 贾静雯的小宝曝光,颜值超越姐姐,网友:这基因超级强大

    提起明星,最值得我们关注的就是他们生娃后,宝宝们的超级颜值,简直就是天生的明星脸.远的不说,看看我们的贾静雯一家几口人.小宝模样直逼姐姐,大有超越的意思. 小的时候,最小的波妞还没有显示出该有的相貌基 ...

  • 一个非常强大的盈利工具!4月29日!

    开头提醒:现在公众号的推送时间线改了,为了大家能每天准时接收到智丽的复盘,不和智丽失联.大家一定要将"智丽淘金"添加星标,同时记得每天点下右下角的"在看"或者评 ...

  • Python爬虫常用模块及工具!

    想要学好Python,除了合适的学习路线外,选择合适的工具也很重要,它可以提高我们的工作效率,也可以节省时间.这篇文章重点为大家介绍Python爬虫常用工具,快跟着小编来看看吧. 第一种:常用模块介绍 ...