今回は英語文書に適用した例を紹介します。
(動画があると解りやすいとのことでしたので、最下部に追加しました。)
対象としたのは、Robert Harper氏の教科書
“Practical foundations for programming languages”です。
http://profs.sci.univr.it/~merro/files/harper.pdf(※1)
まずはスライドを参照ください。
英語の教科書を読む際には上の通りの順番で読んでいます。これまでの契約文書や特許文書と違って、定型的な表現が出てこないので、視認性が良い、悪いは微妙なところです。
Harper氏の上の文章は初見では結構理解するのが難しかったので、色を付けたほうが読みやすい例として挙げさせていただきました。
技術的な工夫としては、英文の場合も名詞句を単位として着色しています。
唐突ですが、英語を読める人は以下の通りの単位で見えているのではないでしょうか?(※2)
名詞句単位で交互に赤青に着色しています(散見される代名詞等は対象から外しています)。英語を学習中の人にも役立つ技術と思っています。
シンプルに指定語自体が一致している箇所を着色した場合は以下のとおりです。冠詞や複数形、間に形容詞が入っているパターン(例えば a nullary operatorやa binary operator)が読みにくくなっています。
このあたりで色を付けた際に視認性が悪くなる要素として気づいたものを挙げてみます。
1.着色語を指定する際に読書の一連の流れから意識が飛ぶ(アドホックな場合)
2. 人間が一度に脳で仕分けできる色はそんなに多くない(せいぜい3色~5色が限界)
3. 構文解析が完璧でなければ、着色に身を委ねられない
1.については、文章中の単語の一部を指定して、それを含む名詞句を一気に指定しているとはいえ、不十分です。目が物理的にそれるのが最も致命的です。人の視線をトラッキングして単語を見ながら色を決定、という技術で解消できる気がしています。
2.については、これまで色が付いてて読みやすいでしょう?というスタンスで話をしてきましたが、同意できない方も少なからずいると思います。自分も7色以上は今はまだ無理です。ただもしかすると慣れの問題かもしれないです。例えば自分はVRは最初は酔いが止まりませんでしたが段々慣れてきました。ただ、何らかの酔い止めはあったほうがいいです。
3.については、本当に厄介です。もし、この技術の普及がうまくいった場合に、読者でなく書き手が設定してあげる、というシナリオが生まれたらあわよくばといった感じです。決定論(構文解析)と確率論(機械学習)の手法を組み合わせても限界があるとみています。書き手が書き終わったときに両手法を適用して、確定、といった感じになれば完璧なものにできそうですが、そのためにはこの技術がその手間を割いても有用だと実証する必要があります。先は長そうです。
次回は法律関連の教科書(レジュメ)に適用した例をご紹介します。法学部やロースクールの学生さん、法律関連の資格試験を受けられている方に役立つと思います。
連絡先: mailto:polymonyrks@gmail.com
(※1) 著作権について以下の通りの条件が付されています。着色という形でDerivativeになっているので、あくまでここでの閲覧にとどめてください。また、現段階ではCommercialに該当していないと考え、引用しました。https://creativecommons.org/licenses/by-nc-nd/3.0/us
(※2)理解している単位としては上記のとおりだが、読む際にはそういうブロックで見ていないのでは?という意見をもらいました。英語はラジオ型言語、日本語はテレビ型言語、と言われたりします(鈴木孝夫氏)。確かに英語を聞くときだけでなく、読む時もラジオとして情報処理している気もしてきました。逆に考えれば、この製作物をうまく使えば英語をテレビ化できるのではないかと思っています。
★動画(20190429追記)
私が実際にこの文章を読んだ際の動画です。文章に色を付けつつ、それと対応する図を描きつつ理解を進めています。スマートフォンの方はすいません、見づらいかもしれません。