无法从PDF文件复制文本?


所以当我不得不从PDF文件中复制一些文本并将其粘贴到我正在做的演示文稿中时,我遇到了一个问题。问题是我无法复制文本!嗯,我想,因为我很确定我之前已经从PDF文件中复制了文本,所以我必须做一些愚蠢的事情。

幸运的是,我不是那么愚蠢,因为它最终成为了那个PDF文件有几页扫描已插入PDF的位图文件。所以这不是真正的文本。其次,如果存在通常可以复制的实际文本,则此PDF上设置了某种安全权限,因此不允许内容复制! Grrrr!

我仍然需要那个文本,我想找到一种方法来获得它。在本文中,我将介绍复制文本的简单方法,如果文档未受到保护且文本不是扫描图像,则该文本有效。我还将介绍在不允许复制文本的tricker场景中要做什么。它不是一个理想的解决方案,但它总比没有好,特别是如果你需要复制大量的文本。即使您可以省去手动输入80%,这也很棒!

选择PDF中的文本

在Adobe Reader中,如果文本是可复制的,那么所有你要做的就是选择它并右键单击并选择复制

复制文本pdf

在Foxit等其他PDF查看器程序中,你必须点击工具,然后点击选择文字

选择文字

显然,如果你能够做到这一点,你就不会阅读这篇文章了!但为了以防万一,这就是你选择文字的方式。现在讨论从图像或安全PDF文件复制文本的更棘手问题。

使用OCR复制PDF文本

您可以快速检查Adobe文件是否受到保护阅读器通过在标题栏中查找并查找单词SECURED

担保pdf

您可以通过以下方式查看特定权限点击修改,然后点击保护,然后点击安全属性

安全属性

在较新版本的Adobe Reader和Acrobat中,您必须单击右侧窗格中的保护以显示保护选项。

然后,点击更多选项,您将看到安全属性。

如下所示,不允许内容复制,并且安全性受密码保护。如果你知道密码,那么你可以删除安全性并复制你想要的所有内容。

除非你是黑客,否则不能破解密码。所以你唯一能做的就是截取文本截图,然后通过OCR程序运行它。听起来像是太多的工作,但事实并非如此。您可以在没有其他软件的情况下在Mac或PC上截取屏幕截图。

Mac - 只需按键盘上的Command + Shift + 4

Windows - 只需使用Windows Snipping Tool

内容复制

此外,如果您碰巧拥有Adobe Acrobat,您可以使用它自动将图像文本转换为可编辑的文本。您所要做的就是打开PDF文件,然后单击右侧窗格中的“编辑PDF”工具。它将使用OCR自动扫描整个文档并将其转换为完全可编辑的文档。

如果您有带文本的图像,请将其复制到剪贴板,然后打开Adobe Acrobat并选择文件 - 从剪贴板创建 - PDF。

只需单击右窗格中的编辑PDF,它就会将图像转换为可编辑文字。

这是我拍摄的一些我无法从安全的PDF文件中复制的文字的截图:

TestOCR

请注意,截取屏幕截图时,请确保将文档缩放设置为100%,以使文本清晰明了。获得屏幕截图后,下载免费的OCR程序。有很多选择,结果会在程序之间变化很大,所以你必须尝试一些。以下是我过去使用的两个:

http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html

https://www.simpleocr.com/OCR-Freeware

请注意您也可以使用Microsoft OneNote,因为它具有内置的OCR功能。显然,如果您已经拥有OCR软件,那么只需使用该程序。

FreeOCR程序运行良好,您只需要确保在安装时不接受任何其他软件“offer”,它只会在您的计算机上安装垃圾。但只要你这样做,该软件就没有间谍软件或类似的东西。 CNET也对此进行了测试以确保这一点。

无论如何,一旦安装了程序,点击大的打开按钮并选择你的图像。

ocr图像

它会在左侧窗格中显示图像的预览。然后点击OCR启动OCR流程

启动ocr进程

就是这样!文本现在将显示在右侧,您可以将其复制到剪贴板或将其导出到Microsoft Word。

将图像转换为文本

总体而言,该计划在这里和那里都有一些小错误做得非常好。尽管不必手动输入所有文本,但它节省了我很多时间。希望这可以帮助您从PDF文档中复制所需的文本。发表任何评论或问题,我会回复。享受!

[小訣竅] 擷取圖片中的文字內容

相关文章:


14.08.2012