文本处理技巧：移除和提取

2024-05-01 21:58:19

每当拿到原始数据，不如意十有八九，快速准确的清洗数据也是必备技能，数据清洗正好是 PowerQuery 的强项，本文就来介绍两个常用的 M 函数：Text.Remove 和 Text.Select。

看到以 Text 开头的，就知道是文本处理函数，比如原始数据如下，

如果只想要中文名，就是把英文字母都去掉，可以用Text.Remove函数，添加自定义列，

姓名=Text.Remove([客户],{"A".."Z"})

Text.Remove 的参数有两个，第一个就是文本，第二个就是要移除的字符，可以是文本或者是文本的列表，{"A".."Z"}就是生成了一个从A到Z的列表，只要是大写字母，就从客户的信息中移除。

如果有小写字母，需要把所有的字母都移除了，把大写的"Z"替换成小写的"z"就行了，

姓名=Text.Remove([客户],{"A".."z"})

如果只想要英文名，要去掉中文名，可以这样写，

英文名=Text.Remove([客户],{"一".."龟"})

Powerquery 的中文字符以 Unicode 连续储存，"一"的 Unicode最小，正常使用的汉字中，"龟"的 Unicode 最大，因此{"一".."龟"}就包含了所有正常使用的汉字列表，正好利用这个特性，去除了所有的中文字符。

如果有更多种类的文本数据不规则的堆放在一起，比如这样，

想把联系方式提取出来，第二个参数还可以这样写，

联系方式=Text.Remove([客户],{"A".."z","一".."龟"})

把中文字符和英文字符的列表都放到第二个参数中，全部移除。

不过如果字符种类很多，像这样更加杂乱的，

要提取联系方式，用Text.Remove 就有点麻烦，各种奇怪的符号种类太多了，编码也不一定连续。还好有一个 Text.Select 函数专门用来提取的。

Text.Select 函数和 Text.Remove 正好相反，Text.Select 只提取第二个参数中的字符，上图中提取联系方式，直接这样写，

联系方式=Text.Select([客户],{"0".."9"})

直接就可以得到联系方式信息。

提取各种字符的列表如下，

这两个函数也都很简单，需要提取或者移除字符的情况直接套用就可以了。

赞 (0)

Android应用程序----界面事件（按键事件）

在Android系统中,存在多种界面事件,如点击事件.触摸事件.焦点事件和菜单事件等等在这些界面事件发生时,Android界面框架调用界面控件的事件处理函数对事件进行处理按键事件在MVC模型中, ...
其他文本函数numberstring，unichar，unicode的简单介绍

常用文本函数除了text函数,我们基本都说过了.text这个函数是很重要的,那你会问为什么不先说text这个函数呢?因为这个函数和自定义数字格式有关,而自定义数字格式又包括很多内容,一次根本说不完,以 ...
怎样去掉单元格内的字母只留数字？五大方法我选俩

首先,对于Excel里去掉单元格内的字母只留数字先给出我最常用的2种比较容易掌握的处理办法: 一.Excel智能填充(快捷键Ctrl+E) 1.在第一行(B2)输入需要提取的数字,如下图所示: 2.定 ...
【Excel技巧篇】快速提取文件夹下所有文件名

本文由两部分构成,[批量提取指定文件夹下文件名]以及[批量文件重命名].嗯~简易操作~不涉及VBA编程~ 批量提取指定文件夹下文件名操作动画如下: 如动画所示,先定义一个名称. 名称为文件夹,引用位 ...
Excel教程：文本数字混杂的单元格提取数字并汇总

公众号回复:入群,下载练习课件从文本中提取数字汇总的方法很多,可以根据自己熟悉的方法来解决就好.本文分享两种方法,如下. 第一,快速填充法借助辅助列,在C2.C3单元格手动输入数字,然后下拉快速填 ...
CT后处理小技巧：支气管树提取

气管.支气管疾病的传统诊断一直是依据纤维支气管镜的检查结果,但作为一种侵入性检查有一定的风险,患者痛苦难忍,对于小儿.老人及体弱者有时无法接受. 螺旋CT三维重建可用于气管.支气管树的三维成像.通过对 ...
#excel#excel技巧 #word #word教程提取图片文字

#excel#excel技巧 #word #word教程提取图片文字
【技巧1001-3】批量提取姓名电话号码

方法1:快速填充操作说明: 1.手工拆分一组数据,比如这里姓名和电话 2.鼠标点击B2,点击开始-填充-快速填充当然,我们也可以使用快捷键,CTRL+E,更快,效率更高版本限制:office20 ...
【技巧1001-4】-批量提取文件名并建立超链接

批量提取文件名的方法有很多批处理提取 VBA提取浏览器提取这样方法,有的需要VBA基础,有的操作繁琐,整体效率也不高,今天我们要介绍一种新的方法,估计先叫做,复制路径法我们来一探究竟第一步: ...
我第一次也做错的问题 Excel日期与文本连接技巧

我第一次也做错的问题 Excel日期与文本连接技巧
550.office技巧：如何快速提取收支记录？

Excel技巧: 如何快速提取收支记录? 财务的收支数据,尤其是银行数据导出来的时候,收支数据是放在一列的,这就导致对收入和支出的分开或者是数据的获取就需要财务对Excel的应用比较自如,今天牛闪闪正 ...
Excel技巧：5种提取不重复值的方法，学会几个，留着备用

[温馨提示]亲爱的朋友,阅读之前请您点击[关注],您的支持将是我最大的动力! Excel表格中经常会遇到一些重复值的问题,今天阿钟老师和大家分享几个关于重复值提取.标注的几种方法.以下表中名称列为例, ...