PyLadies Tokyoで機械学習のアルゴリズム選択とハイパーパラメーター最適化について話しました

舞い降り...†

10/24のPyLadies Tokyo一周年パーティーで機械学習の自動化についてLTしました。 所属してる会社以外の人の前でLTするのははじめてだったのでちょっと緊張。

www.slideshare.net

元となるauto-sklearnの論文はこちら

一週間前まで別の話をしようと思ってたけど、LTで話すには地味かなーと思ったりPyLadiesってことで多様性のある感じにしたいと思ったので急遽auto-sklearnの話に。。。ソルバーについての説明が雑なのはそういうことです (間に合わなかった...💧)

実はauto-sklearn自体にそれほど愛着はありません。論文の内容を再現できるようにと公開したものだと思うので、実用的に使えるフェーズのものではないです (ソルバーが選んだ一番いい組み合わせの詳細がわからなかったり、digitsやirisは通るけどNEWS20とかYahoo!ディレクトリのデータセットでエラーが起きたり)

でも、機械学習自体を自動化するAutoMLあるいはメタ学習って試みが面白いと思ったので、今回はPyLadiesにちなんで何かPythonと絡めたいってことで題材として選びました。(JavaだったらAutoWEKAについて話してたかも)

もちろん普段機械学習使ってる側としてはブラックボックス的でこわいなーと思うけど、それでも自動でよろしくやってくれたら面白そうだし、なんか未来っぽくていいなって思うんです。

アンサンブル構築用のsolverとして採用してるrunsolverがLinuxでしか動かなかったり依存ライブラリのバージョンが固定だったりして、動かすまで大変だったのですぐ再現できるようにVagrantfileも書いてみました。

それにしてもこういうスライド作りって難しいですね。わかりやすい表現にしたほうが短時間で説明しやすいし聴衆の興味を引くけど、そういう表現を使うと意味が広くなってしまって(曖昧になって)厳密性が欠けてしまうことがある。これ以上噛み砕いたらアカンみたいなラインが詳しくない分野だとわからなくて若干恐る恐るって感じでした。

さて今回はPyLadiesのイベントだけど男性も参加するとのことでどうなるんだって思ったけど、普通に楽しかったし結局懇親会も最後まで残ってました^^

f:id:yukinoi:20151026001446j:plain

ケーキとMacBookとビール、この会らしい一枚笑