昨天上网,偶遇一篇美文,欲收藏之,但当我将其复制到文本文件中时,却发现每行的后面都有一些不规则的乱码,莫非这就是传说中的防复制乱码?怎么办?难道要一行一行的清理这些乱码?在一番摸索后,终于找到用word快速清除乱码的方法。
问题分析:
在正常状态下看不见这些乱码,但只要选中了几行或整篇文字,这些乱码就会显露出来了。点右键查看网页的“源文件”,发现在每一行的后面都有一段乱码,并且其“font”标签中的“color”值都是一样的——“#FFFFFF”(白色)。白色的乱码,在网页背景是白色的情况下当然看不到了。
看来要解决乱码,只有从复制后的文字入手,但这些乱码的值及长度又没有规则,如何将其替换为空呢?
问题解决:
说到“替换”,我忽然想起了word,其“替换”功能中好像有一项“字体”替换,前面的乱码虽然在长度上没有规则,但其颜色却都是一样的,这不也是一种关键字吗?
启动word,将复制的文字粘贴到空白文档中,在默认状态下,Word是按源文件的格式进行显示的,所以这段文字在Word中和在网页中看到的效果是一样的,乱码隐藏在白色背景中。
接下来点击菜单“编辑”中的“替换”,在打开的“查找和替换”窗口中点击“高级”,展开替换的高级功能,接着点击“格式”下的“字体…”,在打开的“字体”窗口中,点击“全部文字”中的“字体颜色”内的“下拉菜单”,选择其中的“白色”(图1)
注:有些网页中的防复制代码的颜色不是白色,比如是:#FCFCFC,对这种不在常规中显示的颜色,我们就要采取自定义的方式,选择“其他颜色”窗口中的“自定义”面板,将其中的“红色”、“绿色”、“蓝色”分别设为“#FCFCFC”中所对应的十进制数值。
怎么将十六进制FC转为十进制数值呢?用WINDOWS的计算器吧,使用其的“科学型”方式,就可以将一个数值转为在十六、十、八、二进制数值,比如前面的十六进制FC,转为十进制就是252。
设置完字体颜色,点“确定”返回到“查找和替换窗口”(图2)
在“查找内容”中虽然没有内容,但其下的格式却给出了当前查找的关键字是字体颜色为“白色”的内容,接下来是“替换为”的设置,因为我们要将这些乱码替换为空,所以在“替换为”中什么也不用输入,直接点击“全部替换”就可以了,待替换完成后查看一下效果,无论是更改word的背景颜色,还是将这些文字复制到文本文件中,均看不到乱码的踪迹了。