各种电子图书馆文章转为Word文档的方法-word教程-office-浏览器之家

各种识别软件对电子图书馆文章的识别各有缺陷，有的只能识别字，对表格和图形无能为力；有的识别后生成的版面乱七八糟，无法使用。还在为不同格式的文件怎么变成Word文件发愁吗？现在好了，本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案，帮助大家掌握正确方法，节省时间：

1、PDF文件的识别

1)文件可以直接识别的(以文本形式保存的PDF文件)：安装acrobat 7专业版，注意不是acrobat reader，直接另存为rtf文件(识别整个文件)，或者选择工具栏上的文字选择按钮，然后选择文字区域，然后复制到Word等中。

2)文件不能直接识别的(以图片形式保存的PDF文件)：安装office2003，并装上office工具Microsoft Office Document Imaging(完全安装此工具)，然后在打印机里面会增加Microsoft Office Document Image Writer打印机，然后将PDF文件打印到此打印机，选择打印形成的文件的保存位置，然后会自动形成一个MDI文件，并且自动用Microsoft Office Document Image打开此文件，然后选择“工具”菜单下的“使用ocr识别文本”，识别完成后，在选择“工具”下的，“将文本发送到Word”，最后将把整个PDF文件识别输出到Word文件中。

注意：Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格，但是无法将图形输出到Word，而是把文件中的所有图形单独形成一个个独立的图片文件，放在相同位置的一个相同名称的文件夹中，因此可用snagit软件将图形打开，然后复制到Word中。(所有的识别软件都不能很好的处理图形的识别问题，Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)

3)加密的Pdf文件：先下载解密软件，解密后在参看1),2)

4)繁体pdf文件：用2)的方法识别到Word后，用Word中的“工具”--“语言”---“中文繁简转换”

2、caj文件的识别：

1)局部文字识别：直接使用caj浏览器的ocr

2)全文件识别：打印到Microsoft Office Document Image Writer打印机，后面和上面的2)操作一样

3)博硕论文全文下载：在线阅读博硕论文，待可以看到最后一页后，不要关闭caj浏览器，到caj安装目录下cache中找到一个较大的文件，拷贝到其他位置即可。然后使用2)全部转化为Word。

3、超星文件的识别：

1)局部文字识别：直接使用超星浏览器的ocr

2)全文件识别：打印到Microsoft Office Document Image Writer打印机，后面和上面的2)操作一样，要注意的是，超星打印功能有点区别，因为超星是目录和全文分开的，所以打印时，需要分别把目录和正文识别到Word中，在合并到一起。打印时要填入打印页码从1到最后一页，不要选择打印全部。此外在打印选项中，还要将页面比例设成真实大小，而不是整宽。注意：识别速度比其他格式要慢很多，请保持耐心，但是最后当你看到轻松的生成全本书的Word版本时，你会欣喜若狂的，呵呵。我的试验结果是一本280页的书，识别需要几分钟的时间。

3)超星相对比较麻烦一些，如果还有问题，可以先把超星打印成完整的pdf文件，然后在用1、的方法转成Word

4、其他情况下的识别：

使用snagit软件将任何形式的文字可以变成图片，例如使用snagit将屏幕拷贝成图片，然后右键点击图片文件，用microsoft Office Document Image打开图形，其他和2)一样。

浏览器之家

各种电子图书馆文章转为Word文档的方法

相关推荐

评论