英語にも対応できました。以下の動画をご覧ください。
もともとこのpopilizerはpoppySというPDFリーダーの技術を流用しており、更にそのPDFリーダーは英語から開発がスタートしていました。なので移植は楽というか、むしろ日本語より完成度は高いです。
ただ一点課題なのは処理速度です。今借りているサーバーのマシンだとちょっと足りない感じです。アルゴリズム側をもう少し改善する必要があるなと思っています。
頭が痛いのは、これを大きく展開しようとすると一人一台の高性能マシンが必要ということになってしまい、気軽に使えません。英語だと単体でも弱いですし、先日のとおりに複数人がサーバーを使うとパフォーマンスが著しく落ちてしまっています。なんとかしないとです。
技術が普及してしまえばこの過程がなくなります。すなわちHPを用意している人が前処理でpopilize(ペイント読書が可能なデータ構造にHTMLをしておく)しててくれれば「サーバーにDOMデータを送信してごにょごにょ」はしなくてよくなります。最終的にはここに持っていく計画でいます。
サーバー側でデータをキャッシュするのもありかなと。Wikipediaとかの比較的静的なサイトならやれそうです。
ペイント読書の有用性がまだ広く知られていない状況ではこれが妥当な解だと思っています。
Wikipediaのみ、という当面の縛りではやれそうですね。
段々体制が整ってきました。