注册 登录
英语家园 返回首页

伊奕的个人空间 https://www.enfamily.cn/?135898 [收藏] [复制] [分享] [RSS]

日志

将PDF格式转化为WORD格式

热度 2已有 808 次阅读2009-12-9 11:14

原来空间里的,因为那个空间登陆不上,只好再次放到这里,以备后用

如何将PDF格式转化为WORD格式-


一、pdf文档的介绍 

首先,pdf文档本身分为以下几类:非加密的pdf文档和加密的pdf文档。

1.非加密型的pdf文档

这类文档是作者公开在网路上流行的文档,其内容是允许 读者拷贝粘贴的,当然这其中要设计到合理的引用注释。主要有两种类型,一个是编辑 好的可以对文字部分操作的文档,另外一种是扫描格式的。对于前一种文档adobe公司出 品的pdf阅读和编辑软件都可以对文字部分进行选取,拷贝和粘贴,当然图片部分也可以 。通常我们写文章需要引用或编辑的时候,有选择的选取其中的文字就可以了,很方便 ,也没有必要全文选取。当然,如果处于版面要求以及某种目的需要快速的全文转化,也是完全可以实现的。
主要方法包括:
a. Adobe公司出品的pdf创建和编辑软件Adobe Acrobat(不是reader)本身就具有将pdf文档转化为word文档的能力。只要我们打开菜单栏,将文档另存为doc格式或 rtf格式就可以了。但是说实话,这种方法得到的文档只能够说是变成了一堆字而已,原来的版式都没有了。不过这也不失为一种方法。
b. 借助于其它软件实现高质量的pdf文档向word文档的转换。其实现在能够实 现这种功能的软件很多,我只介绍其中的两个,而这两个也绝对是具有业界领先水平的 。它们是Scansoft公司出品的Scansoft PDF Converter和ABBYY公司出品的ABBYY PDF Transformer。当然后者作为OCR领域的业界大企业,还有一些具有此功能的更高级的软 件,但是这个已经足以应付大部分的转换了。 这两个软件能够快速实现对于可拷贝的pdf文档的迅速转化,而且绝对是高质量的全文转换。经过转换得到的word文档,排版和原来的pdf文档几乎没有分别,绝对
是让你震惊的水准,需要全文转换的绝对推荐使用!
c. 对于非加密扫描型pdf文档来说,其上面包含的文字实际上是属于图片的一 部分,我们如果想大量的一次性得到这些文字,必须借助于OCR软件的辅助,这种软件种类繁多,中文外文的都有。当然,对于英文的识别效率应该好于对于中文的,这也和选择的软件关系很大。而且,最重要的是,pdf文档中文字的清晰度。

2.加密型的pdf文档

加密型pdf文档通常不允许读者对其进行任何拷贝和编辑, 包括其中的文字和图片。这也是对版权的保护。如果你非要违背作者意图来获得其中的 文字,使用的方法主要有两种:第一就是借助于pdf加密破解软件,第二种就是手动往电脑里面敲吧。推荐后者,毕竟该尊重的一定要尊重。


二、pdf格式的文件如何转换成Word文档的几种方法
1、用ScanSoft PDF Converter Pro v3.0 特别版
为PDF转换提供了完整的解决方案,能合并,转换,直接编辑PDF文件
2、可以利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转WORD文档
也就是说利用WORD来完成该任务。方法如下:
用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机” 栏中的名称设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除
组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。 然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本 发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重 新运行OCR。这可能需要一些时间”,不管它,确认即可。 以上仅在word2003中可用,其他版本没有Microsoft Office Document Image Writer。

3、pdfundo.net在线转换

在线的http://pdfundo.net(名称很有意思),可以上传pdf文档,30秒-几分钟即可转换为doc,并给出下载链接。它也有相应的客户端软件。[via lifehacker]

优点:免费、在线、直接生成doc
缺点:试转了一份台湾朋友制作的pdf(原始文件也根本不是word,繁体中文),发现很多汉字无法显示。

4、共享软件 e-PDF To Word Converter

善用佳软很少有pdf2doc需求,并没用过e-PDF To Word Converter。小众软件《e-PDF - PDF 转换 Word 文档》称 “e-PDF 可以把 PDF 文件比较完美的转换成 Word 文档,我用104页的 PDF 做了测试,除了少数地方,其余都属于完美转换了。”

5、网上其他介绍:
e-PDF To Word Converter 是一款将AdobePDF文档转换成 Word 文档的工具软件,它支持文字,图像及其它内容的输出。这款软件可以脱离 Microsoft Word,Adobe Acrobat 或 Acrobat Reader 独立运行。完美的中文支持和原始版面转换,基本做到了百分百的原汁原味……
目前唯一发现的不足,数字会被转换成全角数字,不知道可否在word中批量把数字换回半角,另外有些文字大小会小一号。试用了超多的PDF转Word工具了,应该说这个是所见过版面保留最好的了,虽然还是有点缺憾。

优点:见上
缺点:不免费,USD35

三、结论

偶尔有pdf2doc需求的网友,建议先试用在线的Gmail 和 PDFundo 。如果质量不能满足需求,或转换的数量、速度有更多要求,可以试用/注册 e-PDF To Word Converter 软件。
但无论哪种办法,在行动之前都值得想一下:真有必要从pdf转为word吗?

四、附注

[1]:早期版本MS Word采用封闭格式,WPS和OOo通过各种技术手段才能与之保持尽力兼容,而其他无此实力(经济实力)的软件则不能编辑Word。当然,可以用免费的WordViewer查看(应该也能复制到其他程序中吧)。新的MS Office采取了XML格式,相对开放了一些。所以,也不应该基于过时的理由过于反对doc格式。但无论如何,请有如下意识:除了昂贵的MS Office,还有个人免费的WPS(非常小巧)、开源的OOo、在线的Google Doc;在很多情况下,你只使用了MS Office的3%的功能;很多文档没有必要存为word格式。

注解: 在搜狐博客网上看到别人写的一篇日志http://jiang-yuzhao.blog.sohu.com/113356146.html,觉得很实用,经过一番整理,现在贴上来,一是可以大家共享,二是做一个笔记,以备查阅提供便利性。


路过

雷人
1

握手

鲜花

鸡蛋

全部作者的其他最新日志

发表评论 评论 (3 个评论)

回复 20550514 2009-12-13 10:11
wow,it's a hard to read to me.
回复 伊奕 2009-12-14 11:53
20550514: wow,it's a hard to read to me.
me too.but  It's the reason we  study it.
回复 20550514 2009-12-16 00:56
you are right.

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

关闭

站长推荐上一条 /1 下一条


关于我们|免责声明|广告合作|手机版|英语家园 ( 鄂ICP备2021006767号-1|鄂公网安备42010202000179号 )

GMT+8, 2026-4-27 07:36

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

返回顶部