rabbitfoot530's diary

読んだ本と、プログラムに関することのメモです。好きな言語は、C++, Python, Golang, TypeScript。数学・物理・学習理論も好きです。

バッドデータハンドブック ―データにまつわる問題への19の処方箋

 昨今流行ってるデータサイエンティスト(笑)ですが、そんな魔法の方程式があったり、魔法のデータ処理があったりするわけじゃねぇ!

 っていう内容の本です。

 統計やるのに、いかに下処理が重要で、データからモデル推定するのが本質だっていうのが書かれています。
 
 Web2.0、ビックデータといい、こういうバズワードに踊らされて、無理難題言われる側の身になってあげてください。。

 猫も杓子もデータサイエンティスト、データサイエンティスト...

 じゃあ、統計処理やるのに、どういったモデルがあったり、誤差は何%まで許容できたり、データ数ってどんだけいるのか、どうやって計算するのかわかってんだよね!?ってことがわかります。