sdlwp 2009-12-28 23:58
请问怎样将pdf文件里的文字提取出来?
一些文件数据在pdf文里面,自己不知道怎么获取PDF里面的数据
好郁闷哦,找了些软件好像效果不好,希望大家有什么推荐的
hl0579 2009-12-29 00:04
使用VJ软件(具体名字我记不清楚了)打开,然后进行OCT识别,能够识别80%左右
alancrane 2009-12-29 00:50
你可以考虑先把PDF转换成WORD文档,或者用ADOBE ACRABAT,注意啊,不是那个你已经在用的READER。
wuhenhot 2009-12-29 00:58
补充楼上兄弟的内容
CAJViewer7.0提取图片pdf文字绿色免安装版是在CNKI公司CAJViewer7.0的基础上,去除PDL后绿化而成,可以阅读CAJ、NH、KDH和PDF格式文件,支持ORC文字识别,识别率很高,配合PdfFactory一起使用,效果极佳!
可以通过关键字用搜索引擎去搜索,个人再提供两款软件
1.汉王 PDF OCR
2.PDF2Word(PDF to Word)
ybsyz 2009-12-29 01:38
装一个PDF编辑器就可以了~我记得叫FOXIT什么的~
wushinibaba 2009-12-29 01:44
转换成其他格式.. 文档的格式 再提出来
wdmjjsw 2009-12-29 10:20
Solid Converter PDF,这个软件有完全破解的,偶用过,里面的文字基本上全能提出来,不过图片就不行了。
laohuang2 2009-12-29 10:41
有的pdf是可以直接复制黏贴出来的,也可以先把pdf转word文档,这样的软件很多,然后你再编辑word即可。
chende815 2009-12-29 10:58
没有加密的文件可以直接复制的,有的可以转成word格式。
囧仔 2009-12-29 11:01
你可以转换成别的格式 例如 word 再用 word打开
3385588 2009-12-29 12:04
回复 1楼 的帖子
哪用什么转换那么麻烦啊,打开 PDF文档,点击上面的工具~选择和缩放~手型工具~直接复制粘贴就可以了~
搞的不是H是寂寞 2009-12-29 12:14
有的PDF有密码保护的无法提取,直接找TXT版的不就好了么。
gnu321 2009-12-29 12:30
adobe 系列里有个好象可以将pdf转乘word吧
小张先生 2009-12-29 12:33
转word的软件是有的,也可以word转成PDF的,找找看
柏家索斯 2009-12-29 12:37
现在的CAJ7.0已经具有文字识别的功能了!,下载试试吧!
jinyamazaki 2009-12-29 12:41
我正愁没有办法呢,试试看上面的几种方法管不管用
波心荡漾 2009-12-29 12:45
建议楼主下载Acrobat-7.0-PRO专业版的,里面有高级文字工具可以选择,也可以到处为文本文件。当然,如果源pdf文件是图片格式的,那就无法到处文字。这时候可以试试文字识别软件,不过会有一些错别字,需要核对检查一下。
starfire82 2009-12-29 12:45
用CAJViewer 7.0方便快捷!
有些PDF可以直接复制!
有些就用文字识别~