複数のURLからPDFをいっぺんに作るシェルスクリプト(wkpdf利用)
タイトルのまま。URLを並べただけのテキストファイルから各リンク先をPDFとして保存するシェルスクリプト。こんな時に便利。
- 何百ページもある参考書のようなサイトやブログの全記事を一度にPDFとして保存したい!
1ページずつ印刷・PDF化する手間が省けます
必要なもの
ソフトウェア
使うのはMac OSX専用のターミナルを使って指定URLをPDFファイル化するソフトウェア。
インストールはRuby gem packageを通して行います。
% sudo gem update --system
% sudo gem install wkpdf
% gem update wkpdf
豊富なオプションは要確認。用紙サイズや余白も変更できます。
% wkpdf --help
URLを並べたファイル
目次ページやArchiveページからリンクを取得してやります。いわゆるWebスクレイピングをしてやればいいです。Sublime Textでやってしまうのもアリ。例えば、このブログのArchiveからはこんな感じ。
Note
url.txt
http://hironow.bitbucket.org/blog/html/2013/07/06/nicomas20sen_2013_first_half.html
http://hironow.bitbucket.org/blog/html/2013/06/24/video_gif.html
http://hironow.bitbucket.org/blog/html/2013/06/23/app_store_link.html
http://hironow.bitbucket.org/blog/html/2013/06/22/can_not_login_flickr.html
http://hironow.bitbucket.org/blog/html/2013/06/21/video_extension.html
http://hironow.bitbucket.org/blog/html/2013/06/20/image_flickr.html
http://hironow.bitbucket.org/blog/html/2013/03/29/first_post.html
シェルスクリプト
出力されるPDFファイルは連番になります。
Note
urltopdf.sh
URLを並べたファイルを渡して実行します。
% bash urltopdf.sh url.txt
さいごに、出力された各PDFファイルをAdobe Acrobatやプレビュー.appで結合してやれば完成です。プレビューでのPDF結合はこちら。
参考書のようなサイトをPDF化すれば、全文検索ができる上にオフラインでも見れるようになるので勉強が捗ること間違いなしです!