我的自炊流程:自炊的工具和自炊後的整理術


自炊就是一種把書本轉變成電腦掃描文件的一個方法。做法就是把書本的書脊裁掉,變成一疊紙後把它們掃描機裡,最後變成一個電子版。這篇介紹自己自炊時使用的工具,以為自炊的流程。

其實自炊最初源自日本,有些日本人買了很多書/漫畫,然後發現家裏沒有位,但是又很想把內容保存,於是便發明了這種方法。

至於本人決定自炊的原因有四個:

  1. 由於本人家裏也有很多書,家裡已經快沒有位放書了,可是又不捨得就這樣把書扔掉(還有想到假若日後需要搬屋時要如何搬運這些書),於是想把這些書永久保存。
  2. 有時突然想起一些內容是在某本看過的書裡有提及過,如果當時手上能夠立即查看那本書便好了。
  3. 買了 Kindle 後,才發現比起拿著 Kindle 來看書,拿著書本來看太重了(特別是看磚頭書的時候)。
  4. 就算現在有後多付費電子書的平台(例如 AmazonReadmooKobo Books 等等),除非購買到的電子書是 PDF 檔案(或是可以自由在不同地方閱讀,不受任何平台限制),否則可以的話我也寧願買實體書再把它變成電子書,而不會直接去買電子書。原因是我們在電子書平台買的書看似很方便,可是只要這個電子書的公司倒閉了,你便不可能再看到在這個平台買的書了。在今天這個任何公司也可以倒閉的時代,我寧願花一點功夫把這些書變成自己的電子書,而不是一個在單一平台上的閱讀權。

> 自炊的流程

  1. 自炊的第一步:以美工刀把書割成不多於一百頁的小書本。
  2. 自炊的第二步:以 Carl DC-201N 裁書刀把這些小書本的書邊割掉,變成一壘紙的狀態。
  3. 自炊的第三步:在 macOS 上以 ScanSnap IX500 把這些不多於一百頁的小書文掃描。
  4. 整理的第一步:把自炊後的小書本以 AirDrop 傳送到 iOS 上作文字識辨(OCR)幫助日後搜尋。
  5. 整理的第二步:把自炊和 OCR 後的小書本放到 Documents 裡並組合為一本書的檔案。
  6. 整理的第三步:使用 Briss 為電子書裁掉空白的地方。

> 自炊的第一步:以美工刀把書割成不多於一百頁的小書本

這個步驟是首先以美工刀由書脊中間切下去,分成不多於一百頁的小書本。

不能多於一百頁的原因有三個:

  1. 這個大概是掃描器每次可以承受的紙張數量。
  2. 這個大概是 Carl DC-201N 裁書刀每次可以裁掉書邊的厚度。
  3. 日後為檔案作文字識辨時,應用程式只能每次處理一百頁的原因。

> 自炊的第二步:以 Carl DC-201N 裁書刀把這些小書本的書邊割掉,變成一壘紙的狀態

然後便是以 Carl DC-201N 裁書刀把這些小書本的書邊割掉,變成一壘紙的狀態了。變成一壘紙後便可以在下一步中放入掃描器裡直接為每張紙掃描。

有些人會用一些很大型的油壓裁書刀來把書脊裁掉,因為他們能夠把很厚的書一次裁掉。可是這種裁書刀的體積太大和十分重,於是便決定用 Carl 的 DC-210N 來裁書。這個裁書刀的好處便是體積比較小,雖然一次只能裁掉大約30張紙,不過這對我來說也足夠了。

> 自炊的第三步:在 macOS 上以 ScanSnap IX500 把這些不多於一百頁的小書文掃描

基本上會進行自炊的人都是用同一部掃描器。這就是Fujitsu的 ScanSnap IX500

大家都用這部機的原因是因為它的掃描質素和速度都是超級快的。另外它有 OCR 可以把書本內容轉變成文字(還是由最好的 OCR 公司 ABBYY 提供的呢)。

在掃描之前,必須要安裝電腦版的 ScanSnap 程式 或是 iOS 版的 ScanSnap 應用程式。個人實測後,發理電腦版的 ScanSnap 程式掃描的質素比較好,顏色也比較深一點。

> 整理的第一步:把自炊後的小書本以 AirDrop 傳送到 iOS 上作文字識辨(OCR)幫助日後搜尋

文字識辨(OCR)就是把文件內的文字識別出來並變成可搜索的文字。這個功能對於自炊來說很重要,因為突然想起書中的某句時如果能用搜尋的方式會十分方便。

試用了很多 OCR 軟件後,還是要用 ABBYY 家的(雖然也是最貴的)。原因是它可以支援中文字的 OCR ,還有在辨識後文件的大小反而變少了,可能是因為它以文字取代了自炊時被認為是文字的每一頁的原故。

本來購買 ScanSnap IX500 時也有免費附送 ABBYY 家的 OCR 軟件可在 Windows 或 macOS 上使用,可是由於這個附送的 OCR 軟件一次只能處理一個檔案,而每次處理檔案的時間有點長,所以決定購買 iOS 上的 ABBYY 應用程式。

在 iOS 上的 ABBYY 要作 OCR 是需要把文件上傳至它們的服務器做的,壞處是上傳私隱的文件去它們的服務器十分危險,而好處是它們的服務器可以同時處理不同的文件,所以相對之下這個步驟來得比電腦版的 ABBYY 要快上很多倍。


PDF Scanner by ABBYY

另外有一點要注意的是, iOS 版的 ABBYY 不可以處理超過100頁的文件。所以個人會在自炊掃描時放一百頁以內的文件進去,那麼便可以把掃描的檔案直接以 AirDrop 的方式送到 iOS 上的 ABBYY 作 OCR。

個人會在 macOS 把書本掃描後以 AirDrop 的方式傳送到 iOS 上再直接打開 ABBYY 來作 OCR 。

首先在 iOS 上收到檔案後,點選 FineScanner 打開 ABBYY 的 OCR 應用程式。

然後點選 Recognize 來進行 OCR。

然後選擇辨識的語言,在這裡選擇繁體中文(ZHT)和英文(EN)。簡體中文可以選擇 ZHS 。

然後這個檔案會上傳至 ABBYY 家的伺服器。

上傳後,我們會看到這個檔案正在處理中(Processing)。

過了一會後,當 Processing 變成 PDF 後,代表這個檔案已經處理完畢。我們可以按 PDF 進入處理後的文件。

然後打開 Open in ,並把檔案傳送至 Documents。

> 把自炊和 OCR 後的小書本放到 Documents 裡並組合為一本書的檔案

把文件 OCR 後,就是如何把分散的檔案合為一個完整的檔案和如何整理它們。

個人會用的文件整理應用程式是 Documents 。這是個人認為最好的檔案管理應用程式。 資粒夾和 iOS 11 上的功能例如 Drag and Drop 等等都有。另外, Documents 也可以和它們自家的應用程式互動,例如只要安裝了它們自家的 PDF Expert 後,我們便可以在 Documents 內使用 PDF Expert 的功能。在這裡,我們會把不同的 PDF 檔案合為一份。


Documents by Readdle


PDF Expert by Readdle

安裝了 Documents 和 PDF Expert 後,可以在 Documents 裡點選 Select:

然後按次序點選要合併的檔案,再點選合併(Merge)。

然後檔案便會合併了。這時可以為這個合併後的檔案改名。

> 整理的第三步:使用 Briss 為電子書裁掉空白的地方

如果你是使用 Kindle 看自炊的電子書的話,可以進行這個步驟為書子書裁掉空白的地方為 Kindle 小小的螢幕省掉寶貴的位置。

Briss 是一個在電腦上使用的程式。可以自動檢測出文件中的空白邊並把它裁掉。如果發現程式檢測不準確時,也可以人手決定裁掉的位置。對我來說裁掉空白後的電子檔在在 Kindle 看的文字大小也是可以的。



分類: 工作心法
寫作日期: 2018-04-08

隨機文章: