字符提取,这些招数会了吗?
我们来看看这样一组数据:
怎样用公式将A列的数据分别提取成B、C列呢?
在这里告诉大家一个正确的写公式的过程:
1、碰到问题,一定要先分析问题,查找规律;
2、之后将问题拆解,使用我们平实的清晰的逻辑描述清楚;
3、使用函数将思路翻译成Excel语言;
4、调整细节,使公式具有更强的通用性和容错性。
那么我们静下心来仔细看看原始数据,进行简单的分析。
<方案一>:
通过仔细观察,我们发现,这些数据全都是中文与字母数字的区分,而字母数字的部分恰好是7位长度,于是根据文本函数,在C2单元格很容易得到:
=RIGHT(A2,7)
那么B列的产品名称呢?就是把型号删除的部分,那就把字母数字替换掉就行啦,借用C2已经得到的结果,我们在B2写下这样的公式:
=SUBSTITUTE(A2,C2,'')
<方案二>:
我们观察的更加细致一些呢,发现每一个数字都是以0开头,而中文是在数字0前面两位之前的部分,那么根据这个特色,我们就想到了使用FIND函数来查找0的位置。
=FIND(0,A2)
综合使用,在B2写公式:
=LEFT(A2,FIND(0,A2)-2)
在C2写公式:
=MID(A2,FIND(0,A2)-1,99)
这样的题目,我们使用两种方法搞定,只需要耐心一些,仔细分析数据特点就好。
如果数据中的型号,并不是固定的7位长度,也没有固定的字符,而是像下面这样的数据的话,那该怎么处理呢?
经过前面的学习,大家可能已经形成了自己的分析和思维方式,我们来看看这些数据要怎么处理。
首先补充一个基础知识:
字符与字节的区别
函数LEN始终将每个字符(不管是单字节还是双字节)按1计数,数LENB会将每个双字节字符按2计数,否则,函数LENB会将每个字符按1计数。
这个是Excel的帮助信息中所写的内容,看上去晦涩难懂,我们日常的使用就可以简单记忆:
每一个英文字母、数字、以及英文状态下的标点符号,都是1个字节宽度;
每一个中文字符、以及中文标点符号,都是2个字节宽度。
有了这样的一个基础概念,我们来看看处理方案:
<方案一>:
首先通过长度的差异来取值:
=LEN(A2)
返回的结果是9,因为A2单元格有9个字符。
=LENB(A2)
返回的结果是12,因为A2单元格的3个汉字每个占2个字节宽度,再加上6个英文、数字每个占1个字节宽度,总计12字节的宽度。
仔细观察:
LENB(A2)-LEN(A2)的这个差值,恰好等于3,就是A2单元格中汉字的个数。
LEN(A2)-(LENB(A2)-LEN(A2)),通过LEN减去汉字的长度,恰好就等于剩下的字母、数字的长度6。
做好以上铺垫,于是在B2写公式:
=LEFT(A2,LENB(A2)-LEN(A2))
在C2写公式:
=RIGHT(A2,LEN(A2)*2-LENB(A2)))
就完美的分别提取产品和型号到B、C列当中。
<方案二>:
通过观察,我们可不可以以英文字母作为起点呢?虽然字母不一样,有A、B、T,但我们希望找到一个简单的办法,找到这些第一次出现的位置。
好的,我们来引入一种通配符的概念,那就是英文半角状态下的问号(?),在可以使用通配符的函数当中它可以指代任意的一个字符。
什么样的查找字符函数可以使用通配符呢?
SEARCH呼之欲出。
进一步,如果这里单单只用SEARCH显然是无法解决问题的,那么就得召唤他的兄弟SEARCHB出场。在文本函数中,有n多带有B的函数,他们的计算都是按照“字节”,而不是“字符”来统计的。
于是有:
=SEARCHB('?',A2)
这个结果返回数字7,通过SEARCHB查找第一个“单字节”的位置,因为每一个汉字都代表2个字节宽度,所以SEARCHB在只查找那些单身字符时,这些成双配对的字符全部都忽视不见,这样就找到了A2单元格中的字母B。前面3个汉字,总计6个字节宽度,而B恰好在第7个字节的位置,所以结果是7。
有了这个分割点,于是进一步我们就得到了B2的公式:
=LEFTB(A2,SEARCHB('?',A2)-1)
以及C2的公式:
=MIDB(A2,SEARCHB('?',A2),99)
LEFTB、MIDB都是按照字节来计算的。
思路决定了你的公式是什么样子。写公式,一定是先有思路,再“翻译”成公式。
作者:翟振福