2018-03-01から1ヶ月間の記事一覧

不均衡データの学習 ~imblanced-learnを例に~

ちゃお・・・† まいおり・・・† 不均衡データとは? 不均衡データとはクラスに属するサンプルサイズに偏りがある不均衡なデータのことです。 例えば、ネット広告のCTR (Click Through Rate; クリック率) のデータは正例 (クリックした数) が少なく、負例 (ク…

Sentiment AnalysisのVADER論文を読んだ

ちゃお・・・† まいおり・・・† 今回はNLTKに採用されたVADERの論文について紹介しようと思います。 VADERって? ICWSM-14で提案されたsentiment analysisの手法。 Hutto, C.J. & Gilbert, E.E. (2014). VADER: A Parsimonious Rule-based Model for Weblogs…