螺旋階段を一歩ずつ

研究のタネから趣味のネタまで

複数のURLからPDFをいっぺんに作るシェルスクリプト(wkpdf利用)

タイトルのまま。URLを並べただけのテキストファイルから各リンク先をPDFとして保存するシェルスクリプト。こんな時に便利。

  • 何百ページもある参考書のようなサイトやブログの全記事を一度にPDFとして保存したい!

    1ページずつ印刷・PDF化する手間が省けます

必要なもの

ソフトウェア

使うのはMac OSX専用のターミナルを使って指定URLをPDFファイル化するソフトウェア

インストールはRuby gem packageを通して行います。

% sudo gem update --system
% sudo gem install wkpdf
% gem update wkpdf

豊富なオプションは要確認。用紙サイズや余白も変更できます。

% wkpdf --help

URLを並べたファイル

目次ページやArchiveページからリンクを取得してやります。いわゆるWebスクレイピングをしてやればいいです。Sublime Textでやってしまうのもアリ。例えば、このブログのArchiveからはこんな感じ。

Note

url.txt

http://hironow.bitbucket.org/blog/html/2013/07/06/nicomas20sen_2013_first_half.html
http://hironow.bitbucket.org/blog/html/2013/06/24/video_gif.html
http://hironow.bitbucket.org/blog/html/2013/06/23/app_store_link.html
http://hironow.bitbucket.org/blog/html/2013/06/22/can_not_login_flickr.html
http://hironow.bitbucket.org/blog/html/2013/06/21/video_extension.html
http://hironow.bitbucket.org/blog/html/2013/06/20/image_flickr.html
http://hironow.bitbucket.org/blog/html/2013/03/29/first_post.html

シェルスクリプト

出力されるPDFファイルは連番になります。

Note

urltopdf.sh

URLを並べたファイルを渡して実行します。

% bash urltopdf.sh url.txt
urltopdf by hironow365, on Flickr

さいごに、出力された各PDFファイルをAdobe Acrobatやプレビュー.appで結合してやれば完成です。プレビューでのPDF結合はこちら。

参考書のようなサイトをPDF化すれば、全文検索ができる上にオフラインでも見れるようになるので勉強が捗ること間違いなしです!