sammi@DataScience

Python, Machine Learning, Deep Leaning, Data Science, Kaggle.

スポンサーリンク

2019-07-01から1ヶ月間の記事一覧

不均衡データの評価指標 - マシューズ相関係数(MCC)とF1スコアの比較

不均衡データ(imbalanced data)におけるモデルを評価する時に、指標としてはマシューズ相関係数(Matthews Correlation Coefficient)とF1_Score使用した方がマシです。今回はMCCとF1_Scoreについて紹介し、さらに両者の違いを比較します。

不均衡データ - ROC曲線欠点の実装例

前回はROC AUCの欠点に関して少し言及しましたが、今回は実装例に基づいて、ROC曲線が不均衡データ(imbalanced data)に対して簡単に0.90+上がってしまうという欠点について説明していきたいと思います。

ROC_AUC曲線の解説、実装と欠点

ROC_AUC曲線は分類モデルのパフォーマンスを評価するための重要な指標です。現場やkaggleコンペでよく使われています。実装はシンプルでグラフも見やすいので、かなりいい指標ですが、全ての場合に使えるわけではないです。今回はROC_AUC曲線について詳しく…

スポンサーリンク