【次回予告】Haskellと自然言語処理の勉強会 -ご案内

コロナウイルス感染拡大が収束したら、下の内容で勉強会を再度開く予定です。
その際はよろしくお願いします(以下、中止前に掲載した内容です)。


勉強会の詳細はConnpassの案内を参照ください。
今回は動いているガジェットのGIF動画を作成しました。真ん中辺りにあります。
(この記事の最後に、このGIF動画が何をやっているのかを解説しました。)
量子コンピューティングの教科書を読む際に、紙だとしんどい感じでしたがこのガジェットだと初見の概念でも対応可能でした。
もちろん、ランダムアクセス性は圧倒的に紙です。見開き2ページと、好きなページに好きに飛べるのはやっぱり開放感があります。
しかし、よくわからない概念を精読する、という観点では製作者としての贔屓もありますがガジェットに分があるかなと。
量子コンピューティングの勉強会もいずれ開きたいです。
HaskellだとQuipperというライブラリがあり、そのへんを絡めると面白いかなと。
何より、前回の勉強会でも触れましたが、Haskellは数学的最適化のポテンシャルがかなりあるはずですが、
現状では、最適化がかかるだろうと予想できるものが最適化されていないことがままあります。
画像処理周りの開発をしていて、そう思いました。
慣れていないC++より速いだろうと思ったら、全然だめでした。残念な気持ちになったのを憶えています。
それ以降そういう重い系は現状ではC++なのだろう、というスタンスでいます。
(前にHaskellDay2019に参加した際に、数値計算系のベンチャーさん(DeepFlow株式会社)がHaskellで頑張っているというプレゼンがあったので、
上手い人がやれば速度が出るのかも知れませんが、自分はそこまでやる気力はないです)
この辺り、NP問題(総当り問題)が楽に解けるとされる量子コンピューティングなら、最適化問題を解決できるはず、
というふんわりとした意識で勉強を始めています。
なぜ総当りかというと、数学の証明は経路問題に帰着するから、です。
イメージとしては、長野から東京には色々な行き方があります。それぞれ時間と費用が変わってきます。
状況に応じてそれらを選択するのですが、そもそも論としてきちんと東京に行けることが証明されている必要があります。
ここで、すべての経路を総当りで調べてみる、というプロセスが発生するわけです。
ここが現状では弱いです。機械学習技術(強化学習とか)を応用して総当りでなくても目星をつけて証明する、みたいな路線もあるようです。
ただし、総当りができれば全然違って来る感じです。わからないからこその期待かも知れませんが、どうしても期待してしまいます

経路の話なのでHomotopyと絡めて議論している学者さんもいるようです(HoTT)。
この本もあれですね、ガジェットありだと結構楽が出来ます。
こういう数学系って初学者からすると、よくわからない定義が沢山、しかも同一ページに複数回出てくるので、色を付けるのはかなり有効です。
他にも微分方程式の各項のインデックスとか、色がついていたらかなり視認性が良くなると思います。
しかし、汎用の自然言語処理向けの外部Parserの結果を少し修正するだけでは、ちょっと難しそうです。
やはり数学専用の特注Parserを自分でつくる必要があるかな、という印象です。
このHaskell勉強会をきっかけにつくっちゃおうと思っています。

【勉強会でつくっていくガジェット】

 
こんなの2
 

【GIF動画が何をやっているのか】

出典はThinking With Typesです。
一体何をやっているのか不明な感がありますが、以下の観点で着色しています。
0. 最初は何も着色されていない。
1. ヒントモードを起動。そのページでの重要語が黄色で表示される。
2. タイトルが、TermsとTypes、Kindsである。
3. Termsが重要語と判断、Termまでを重要色1(赤色)に指定。
4. 同様にTypesも重要語のはず、Typeまでを重要色2(青色)に指定。
5. 同様にKindsも重要語のはず、kindまでを重要色3(緑色)に指定。
6. programが黄色になっている。重要色4(ピンク色)にしておく。
こんな感じです。GIFファイルが大きくならないように、高速で着色していますが、実際は読みながらゆっくり着色しています。
黄色いのが残ったり、残らなかったりというのはバグなので直す必要があります。
更にfundamental(水色)はズルをしています。こういうのをうまく重要語として拾えるともっと良くなりそうです。
上記は英文ですが、普通に前から読むのとは違う読書感があると思います。
カラフルになったあとで結構時間を取っています。ゆっくり読んでみてください。

【GIF動画もうひとつ】

こんなの

一般受けしそうな機械学習の例も用意しました。
出典はDeep Learning Bookです。
自分はフォローしきれていないのですが、ここ数年のトレンドだと思いますのでいい例と思い取り上げました。
上と同様の着色方針です。以下の観点で着色しています。
1. タイトルが、ProbabilityとInformationである。
2. Probabilityが重要語と判断、語根であるprobab辺りまでを重要色1(赤色)に指定。
3. 同様にInformationも重要語のはず、語根であるinformまでを重要色2(青色)に指定。
4. そのページでの重要語は黄色で表示されている
5. chapterが目に止まる。こういう構造を支配する系の語(他にはSectionとかPageとか)は青色にする自分ルールなのでそうする。
6. 同様にuncertainも目に止まる。重要色3(ピンク色)にしておく。
7. ページを送る。
8. 今度はmachineが黄色になっている。重要色3(緑色)で着色する。
9. systemも目に止まる。なんとなくだが水色っぽい単語なのでそうしておく。
(色パレット出現時に、一見固まっているように見えますが、自分がどの色にしようか迷っているだけで処理が鈍いわけではないです。)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする