青空文庫にも色付けできそうな件(Shift-JISのページへの対応)

青空文庫も色付けして読めそうです。
以下の画像を参照ください。

龍之介龍之介はparseミスなので無視してください。
行けそうですね。SHIFT-JISに悩まされていたのですが、以下の方法で上手くやれました。

ShiftJISで書かれたDOMをサーバ側がUTF8で受け取る場合は、fetch(POST)する前に、

      const hoge = document.charset;
      document.charset = "utf-8";

responseがかえってきたら、

      document.charset = hoge;

これでサーバー側でもUTF8で問題なくparseでき、戻ってきたUTF8文字列をShift-JISページで問題なく表示できます。

対応できるページが増えてきました。
青空文庫は一つの目玉ですね。

小説なので私もそこまで実験していない領域になります。
登場人物系で色分けすると、楽勝で読めるのは分かっているので、
試してみると面白いはずです。
あと少しでできそうですが以下の事情で技術書典11時点では公開しません。

今から心配してもしょうがないかもですが、
上手く技術の良さが伝わって、多くの人が今の貧弱なサーバーに一度にアクセスすると対応できなかったり。

あくまで過程ですがそういう嬉しい悲鳴が出た際に対応ができなくなってしまうので、今回は本命のWikipediaのみに限定する予定です。

更に別件ですが、以前の拙著「技術書を自作PDFリーダーで読む、Haskellでつくる不思議な読書体験」ですが、諸事上あり頒布中止しました。一時的なものですが。Booth版も中止しています。既に購入された方は問題なくDL出来ますのでご安心ください。

技術書典11では、Chrome拡張絡みの内容で(仮)として電子のみ無償配布を予定しています。技術書典12 or 技術書同人誌博覧会(6月のではない)で本格的なものを電子と紙で頒布したいです。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする