办法一:
pdf 转WORD的Office2003方法[OCR文字识别或图片文字识别]
在Office中将PDF转换为DOC(word文件)具体实现是利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求。 第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具--> Microsoft Office Document Image ”。这个时候文件会被转成TIF格式的图片文件 第二步:运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的tif文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。 注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
---------------------
办法二
上面转成tif文件,去网络上下载一套OCR软件,比如尚书六号等,直接运行OCR识别就可以了
pdf 转WORD的Office2003方法[OCR文字识别或图片文字识别]
在Office中将PDF转换为DOC(word文件)具体实现是利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求。 第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具--> Microsoft Office Document Image ”。这个时候文件会被转成TIF格式的图片文件 第二步:运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的tif文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。 注:对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
---------------------
办法二
上面转成tif文件,去网络上下载一套OCR软件,比如尚书六号等,直接运行OCR识别就可以了