rabbitfoot530's diary

読んだ本と、プログラムに関することのメモです。好きな言語は、C++, Python, Golang, TypeScript。数学・物理・学習理論も好きです。

日本語入力を支える技術


 各所で良書と名高い日本語入力に関する本。著者自信が日本語入力のOSSに関わっていたことから、内容に関しては詳しく書かれています。
 また、3章から6章、付録だけで別の機械学習の本になるんじゃない?って内容です。

 機械学習のコーナーに置くべき本ですね。

 特に、この手の本は実装関連については書かれていなくて、理論寄りの本が多いかと思もうのですが、本書は実際に日本語入力の実装で使われている実装に関して、ほぼrubyのコードで書かれているのでLLがわかる方だったら、難なく理解できるかと。

 特にダブル配列とかLOUDSは、勉強になりました。。。というより、知りませんでした。。。

 こういうデータ構造集みたいな本ってないんですかね...

 
 で、参考文献で上がってる「言語処理のための機械学習入門」「これならわかる最適化数学」は、先に読んでおいた方がより理解が深まるかと思います。
 なぜかというと、

 「これならわかる最適化数学」 -> 「言語処理のための機械学習入門」 -> 「日本語入力を支える技術」って順番で読んだほうが、それぞれの内容がわかると思います。

 ちょっと遠回りかもしれませんが、最適化数学の内容は抑えておいた方が、僕はいいと思います。。。僕は数学力があまりないので、ためになりました。

 この手の機械学習関連の情報は、echizen_tmさんのblogが詳しいです
(http://d.hatena.ne.jp/echizen_tm/20120202/1328207315)