公司小朋友又发来了乱七八糟的资料,他整理了一上午,但还没整理好,让我整理一下。

如上图所示(为了保护隐私,随意替换姓名和手机号码),只需要保留姓名和联系方式这两列,其余不必要的字符和符号都要删除。

基本事故

以前我用的excel处理,后来用power currency处理,发现根本不简单,这次要用Word处理。(阿尔伯特爱因斯坦)。

具体地说:

1.使用“查找替代项”功能成批删除不必要的信息。

2.保存在每个步骤中创建的宏,这样以后就不必再次重复操作了。

“太空空城.请更换酒吧”。

首先要替换“宇宙空城12号拨号按钮点击累计16次,电话号码线索10条”等。通过分析,发现该字符的规律可以概括为“一个或多个中文字符一个或多个数字任意汉字条”。为了保险,“赵”后面的段落标记也可以计算为查找条件。

将上述文字规律转换为Word中的查找替换符号的方法很简单。我先找百度Word找替换,再找Word找替换的通配符列表保存在本地。(为了以后不去百度,使用我用的onenote。)。(阿尔伯特爱因斯坦,Northern Exposure,)然后,一个一个地去名单上寻找符合要求的符号。

从上表可以找到,所有中文字符和中文标点符号的查找代码都是[!1-127],数字为[[0-9]],一个或多个前一个字符为[@],任意字符为[*]以查找第一个字符串[!1-127] @ [0-9] @ *酒吧。因为使用了通配符,所以还必须在“替换”窗口中选择“使用通配符”。需要删除这些不需要的字符,因此可以将要查找的内容留空。

请运行一下。请试着完美地改变。如果替换多或少,则必须与查找替换通配符列表进行比较,以调整查找字符串。

替换数字序列号及其后面的标点符号

接下来我们要去掉数字和后面的标点符号。通过之前的工作,我们已经知道可以用[[0-9]@]杀死所有数字,但我们不是要杀死所有数字,而是要去掉序列号和后面的标点符号。因此,还必须在查询条件中添加删除标点符号的代码。

粗略观察后,序列号后面的标点符号包括中英文逗号、中文敦豪和英文句号。移除这些符号可以一次替换一个符号来实现,但太麻烦了。

我们用寻找特定范围的文字的方式去除。特别是[[0-9]@[:] @]。标点符号的顺序不用考虑。运行后,如果发现序列号后面的标点符号没有删除,可以单独添加到查找代码中。

更换“姓名”、“电话”和“手机号码”以及后面的标点符号

想法与上一步一致,但不能以“[] @”的方式一次性替换,因为“姓名”、“电话”和“手机号码”不是单个字符。[电话[。

运行代码后,您可能会发现有问题。

的原因是“电话”后面的标点符号,部分原因是还有一个空格。因此,在执行此步骤之前,必须插入步骤并首先替换空格。空格替换相对简单,不再单独列出。

分别更换“姓名”、“手机号码”和“手机”将得到以下结果:

在上图中,姓名和手机号码之间出现了空格。这些空格其实不是空格,而是不知道我同事是怎么进来的空白区域[W]:

tail&_iz=31825&index=5" width="134" height="178"/>

我是研究了好半天才发现是这个字符。

替换掉多余的段落标记

结果中有太多不需要的段落标记,我们只需要保留一个即可。在勾选通配符的情况下,段落标记的查找字符是【^13】,那么怎么删除多个段落标记,只保留一个呢?还是查Word查找通配符列表,我们发现【{n,}】表示N个以上前一字符或表达式,所以去掉多余段落标记的查找代码是【^13{2,}】。

在姓名和电话号码之间插入制表符

上一步操作后,得到的结果如下:

并不美观,我们需要将其转化为表格,一列姓名,一列手机号。转化为表格的第一步就是获得制表符。也就是在姓名和手机号之间插入制表符。

既然需要在姓名和手机号之间插入制表符,那么需要想法把两者分开。把两者分开就是把两者变为两个表达式,查通配符表可以发现表达式的查找符号是【()】,所以查找框需要输入的是【([!0-9])([0-9])】,而替换框需要输入的是【1^t2】。

文字转表格

接下来我们全选所有内容,选择内容,然后一次点击:插入-表格-文本转换成表格:

进行简单设置:列数设置为2,因为我们最后只需要姓名列和手机号码列。“自动调整”设置为“根据窗口调整表格”,以免待会儿我们还得再调整表格外观。“文字分隔位置”选择“制表符”,因为我们前面插入了制表符。

确定后获得的结果如下:

最后再插入一行,作为表格标题行:

将以上步骤录制成宏,以自动化处理类似问题

由于要经常进行这一系列操作,因此,有必要将其自动化。在Word中自动化的办法是使用宏。宏就是一串代码,可以帮助我们自动执行特定任务。

首先调出“开发工具”菜单,因为录制宏的命令在开发工具中。

在开发工具选项卡中点击“录制宏”,准备录制我们刚才操作的一系列命令:

宏的名字可以改成你喜欢的有意义的名字,以免将来不知道它是干嘛的。

确定后就开始录制宏了,然后就再把我们前面的操作按顺序执行一遍。执行完毕后,点停止录制。

录制完之后就可以运行它了:

当我们在Word中放入我们需要格式化的文本,点击运行按钮,就自动格式化成最后的表格这样了:

结语

步骤比较繁多,但主要还是关注思路:

首先分析文本,找到规律,然后查找通配符列表,使用适当的查找替换代码来进行格式化。

然后用宏把操作固定下来,以后格式化同类型文本,只需要运行一下宏就可以了。这跟PowerBI的思路很像——辛苦一次,终身使用。

相关推荐