ArtSaltのサイドストーリー

音楽、フリーウェア、WEBサービス、食べものなどに関する日記。トラックバック、コメント歓迎。

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

PDFの改行コード削除とKindle

Webで見かけるPDFには優れた内容のものが多い。これをiPadや Kindle DX などで読むのは問題ないが、Kindleで読むのは難しい。6インチのディスプレイでは字が小さくなるからだ。

誰もが思いつくことだが、以下のようにすれば文字が普通の大きさになる。

  1. PDFのテキストをコピーし (Ctrl + A, Ctrl + C) 、テキストエディタに貼りつける (Ctrl + V)
  2. それをもとに青空キンドルで6インチKindle用PDFをつくる

しかしPDFからコピーしたテキストには下のスクリーンショットのような問題が残る。不要な改行コードだ。こいつをなんとかしたい。

邪魔な改行コード

やりたいことはこういうこと。以下のように条件つきで改行コードを削除することだ。

  • 原則として改行コードをすべて削除する
  • ただし下記の事例についてはその限りではない
    • 読点の直後に改行コードが来る
    • 終わり鉤括弧の直後に改行コードが来る
これを実現するにはITで言うところの正規表現というものを学ぶ必要があったのでちょっと勉強した。改行コードは \n と表現されるので上記条件を満たすには以下のように正規表現すればよい。
(?<!。|」)\n

ここからはスクリーンショットで説明。使用したテキストエディタは EmEditor Free。大抵のテキストエディタはこういうことができるはず。

置換条件

無駄な改行コードが削除された結果

Kindleのハードコピー

青空キンドルは縦書き表示のPDFを生成してくれる。併せて普通の数字を漢数字に置換する作業もやっておくと縦書きがますます美しく見える。縦書き明朝の日本語は本当に美しい。

関連

Google
WWW ArtSaltのサイドストーリー
Web site (optional)
Comment - Need to type CAPTCHA, an image of distorted Japanese Hiragana or Katakana afterward.
Password - Not allowed to modify your comment later if password not entered.
On secret mode?
 

http://art2006salt.blog60.fc2.com/tb.php/1169-b210c14d

このブログについて

最近のエントリ

カテゴリー
あわせて読みたいブログ

あわせて読みたい

最近のコメント
Internet Explorer
よりも便利です

Opera 9 - Always secure with Opera Firefoxをダウンロード!!

相互リンク
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。