使用ScrapBook在Firefox中下载整个网站


是否需要保存网页或网站才能离线查看?您是否会在较长时间内离线,但希望能够浏览您喜爱的网站?如果您使用的是Firefox,那么有一个可以解决您问题的Firefox插件。

剪贴簿 是一个很棒的Firefox扩展程序,可以帮助您解决问题。您可以以非常容易管理的方式保存网页并对其进行整理。关于这个附加组件非常酷的一点是,它非常轻巧,快速,准确地高速缓存网页的本地副本并支持多种语言。我在几个带有大量图形和花哨的CSS样式的网页上测试了它,并且非常高兴地看到离线版本看起来与在线版本完全相同。

firefox scrapbook

您可以将ScrapBook用于以下目的:

  • 保存单个网页
  • 保存代码段或单个网页的一部分
  • 保存整个网站
  • 以与包含文件夹,子文件夹的书签相同的方式组织集合
  • 对整个集合进行全文搜索和快速过滤搜索
  • 编辑收集的网页
  • 文本/ HTML编辑功能类似Opera的注释
  • 安装ScrapBook

    如果你我正在运行最新版本的Firefox,在撰写本文时对我来说是v33,你必须调整一些设置才能正确使用ScrapBook。默认情况下,ScrapBook图标不会显示在任何位置,因此您可以使用它的唯一方法是右键单击网页。通过右键单击工具栏上的任意位置,将按钮添加到工具栏或菜单中,然后选择自定义

    customize firefox

    在“自定义”屏幕上,您将看到左侧的ScrapBook图标。继续将其拖动到顶部的工具栏或菜单。然后继续点击退出自定义按钮。

    customize firefox add

    在我们开始使用ScrapBook保存网站之前,您可能想要更改加载项的设置。您可以通过单击右上角的菜单按钮(三条水平线),然后单击附加组件来执行此操作。

    firefox addons

    现在点击扩展程序,然后点击ScrapBook插件旁边的选项按钮。

    scrapbook options

    您可以在此处更改键盘快捷键,存储数据的位置以及其他次要设置。

    scrapbook settings

    使用ScrapBook下载网站

    现在让我们深入了解实际使用该程序的细节。首先,加载要下载网页的网站。开始下载的最简单方法是右键单击页面上的任意位置,然后在菜单底部选择保存页面将页面另存为。这两个选项由ScrapBook添加。

    save page right click

    保存页面将允许您选择文件夹,然后仅自动保存当前页面。如果您想要更多选项(我通常会这样做),请单击“将页面另存为”选项。您将获得另一个对话框,您可以从众多选项中进行选择。

    download webpage

    重要部分是选项下载链接文件部分,然后是In -depth保存选项。默认情况下,ScrapBook将下载图像和样式,但如果网站要求正常工作,您可以添加JavaScript。

    下载链接文件部分只下载链接图像,但您也可以下载声音,电影文件,存档文件或指定要下载的文件的确切类型。如果您所在的网站上有大量指向某种文件(Word文档,PDF等)的链接,并且您希望快速下载所有相关文件,这是一个非常有用的选项。

    最后,深入保存选项是您下载网站较大部分的方式。默认情况下,它设置为0,这意味着它不会跟随任何链接到网站上的其他页面或任何其他链接。如果您选择一个,它将下载当前页面以及从该页面链接的所有内容。深度为2将从当前页面,第一个链接页面以及第一个链接页面的任何链接下载。

    start download website

    单击“保存”按钮弹出新窗口,页面将开始下载。您需要立即按暂停按钮,让我告诉您原因。如果您只是让ScrapBook运行,它将开始从页面下载所有内容,包括源代码中可能链接到许多其他网站或广告网络的所有内容。如上图所示,在主站点(labnol.org)之外,它从googleadservices.com下载广告,从ctrlq.org下载。

    你真的希望广告出现吗?您在离线浏览时在网站上?这也会浪费大量的时间和带宽,所以最好的办法是按暂停,然后点击过滤器按钮。

    download filters

    最好的两个选项是限制域限制到目录。通常这些是相同的,但在某些网站上它们会有所不同。如果您确切知道自己想要的页面,甚至可以按字符串过滤并输入自己的URL。这个选项非常棒,因为它可以摆脱所有其他垃圾,只下载你所在的实际网站上的内容,而不是来自社交媒体网站,广告网络等。

    继续点击开始,页面将开始下载。下载时间取决于您的Internet连接速度以及您下载的网站的确切数量。该插件适用于大多数网站,我遇到的唯一问题是,在某些网站上,用于链接到自己内容的网址是绝对网址。

    绝对网址的问题是当你在离线时在Firefox中打开索引页面并尝试点击任何链接时,它将尝试从实际网站而不是从本地缓存加载。在这些情况下,您必须手动打开下载目录并打开页面。这是一种痛苦,我只是在少数几个网站上发生过这种情况,但确实会发生。您可以通过单击工具栏上的ScrapBook按钮查看下载文件夹,然后右键单击该站点并选择工具 - 显示文件

    tools show files

    在资源管理器中,按键入排序,然后向下滚动到名为HTML文档的文件。内容页面通常是default_00x文件,而不是index_00x文件。

    local copy website

    如果你没有使用Firefox而仍然想要要将网页下载到您的计算机,您还可以查看名为 WinHTTrack 强> 的软件,该软件将自动下载整个网站以供以后离线浏览。但是,WinHTTrack占用了大量空间,因此请确保硬盘上有足够的可用空间。

    这两个程序适用于下载整个网站或下载单个网页。实际上,由于Word软件等CMS软件生成的大量链接,下载整个网站几乎是不可能的。如果您有任何疑问,请发表评论。享受!

    相关文章:


    19.10.2014