-
Notifications
You must be signed in to change notification settings - Fork 121
Diffs (zh_TW)
Danny Lin edited this page May 16, 2021
·
18 revisions
以下簡介 WebScrapBook (0.87.0) 及前作 ScrapBook X (1.14.7) 的主要功能差異。
-
跨平台支援:
- 除 Firefox 桌面版以外,亦支援 Chromium 系瀏覽器及行動瀏覽器(Firefox for Android、Kiwi browser、Yandex browser 等)。
- 編輯器加入的註記在多數瀏覽器,包括行動瀏覽器及未安裝網頁剪貼簿的瀏覽器,皆可正常瀏覽。
- 瀏覽器不須特殊設定即可在本機使用靜態網頁的全文檢索功能。
-
遠端存取支援:
- 後端伺服器經適當設定後,可從多部機器遠端存取剪貼簿。
-
更多客製化擷取功能:
- 圖片、多媒體、樣式表等元素支援連結、移除、儲存使用、儲存現用等更多種擷取方式。
- 支援對樣式表圖片、最愛圖示、畫布、EMBED、OBJECT 元素、及影子物件等的擷取設定。
- 支援用擷取助手預先處理擷取頁面,或客製針對特定網站的擷取方式。
-
強化批次擷取:
- 可選取多個分頁或多個超連結批次擷取。
- 批次擷取管理員可對所有或個別擷取工作自訂擷取模式或選項。
-
更靈活的儲存格式及架構:
- 擷取網頁的 ID 改為基於 UTC 時間,不同時區的擷取資料可彼此合併而不致衝突。
- 擷取的網頁可儲存為不同形式的檔名,例如日期時間、網頁標題、來源網域、UUID,也能儲存到子資料夾。
- 網頁除了儲存為資料夾,還可以儲存為 ZIP 壓縮格式(HTZ、MAFF)或單一 HTML 檔案。
-
更靈活的剪貼簿:
- 剪貼簿目錄樹中任意類型的項目皆可存放子項目。
- 剪貼簿目錄樹中的項目可歸至多個項目之下。
- 從剪貼簿刪除的項目會放到回收筒,可在需要時還原,保障資料安全。
- 支援更多對多個選取項目的操作,如開啟頁面、開啟原始網址、在檔案管理員檢視、搜尋下層項目、排序、重新擷取。
- 支援跨剪貼簿的項目定位、全文搜尋、已擷取網頁提示及尋找。
-
強化全文索引:
- 全文搜尋快取搭配後端伺服器處理,檢索速度大幅提升。
- 擷取及編輯頁面時會自動更新全文索引。
-
相較於 ScrapBook X 使用的 XUL/XPCOM 框架,WebScrapBook 使用的 WebExtension 瀏覽器擴充框架限制較多,有些功能瀏覽器不支援,必須依賴後端伺服器輔助,因而效能較差,例如組織及管理剪貼簿。(由於現代瀏覽器效能多有提升,未必能感受到明顯差異)
-
以下功能理論上可實做,但目前仍有大量困難的技術問題需要解決,短期內不考慮實行:
- 互動式的深層擷取
- 合併精靈
ScrapBook X 與 WebScrapBook 資料結構不同,無法直接使用,可用 PyWebScrapBook 提供的雙向轉換工具自動轉換。
安裝 Python 和 PyWebScrapBook,然後在命令列執行以下命令,即可將 ScrapBook X 或 ScrapBook 建立的剪貼簿轉換為 WebScrapBook 支援的格式:
wsb convert sb2wsb /path/to/scrapbook /path/to/webscrapbook
先前用其他方式由 ScrapBook X 轉為 WebScrapBook 可能不夠完全,可用以下指令進一步轉換:
wsb convert migrate /path/to/webscrapbook [/path/to/output]
此工具可省略輸出路徑做原地轉換,但為防止出錯,建議輸出至另一路徑,或用其他版本控制工具管理。
也可以反過來把網頁剪貼簿資料轉回 ScrapBook X 規格:
wsb convert wsb2sb /path/to/webscrapbook /path/to/scrapbook
由於 WebScrapBook 資料結構較靈活,ScrapBook X 轉 WebScrapBook 不會損失資訊,後者轉前者則可能損失部分資訊,例如:
- 歸屬於多個項目的項目(只會保留第一次出現位置)
- 回收筒中的項目
- 檔案儲存路徑會改變,因此剪貼簿項目之間的交互連結可能不再有效
此外,轉換工具的相容性檢驗是以 ScrapBook X 為準,由 WebScrapBook 轉換為 ScrapBook X 的剪貼簿若使用於其他版本的舊版 ScrapBook,可能會有一些相容性問題,例如:
- 筆記:舊版 ScrapBook 對特殊字元(如
<
、&
、>
)的處理方式不一致,ScrapBook X 則統一只接受純文字格式。 - 筆記頁面
- 非屬資料夾型態的容器項目
- 檔名含有中文或某些特殊字元的檔案