タグ 天色グラフィティ
人気順 10 users 50 users 100 users 500 users 1000 usersなぜn_estimatorsやepochsをパラメータサーチしてはいけないのか - 天色グラフィティ
ハイパーパラメータを探索するため、グリッドサーチやOptunaなどを利用することがあると思います。 しかし、「ハイパーパラメータ探索してみた」のようなQiita記事などでは間違って書かれていることも多いのですが、XGBoostやLightGBMの n_estimators ( num_boosting_rounds )やKerasの epochs をパラメータサーチの対象... 続きを読む
Dockerでデータ分析環境を手軽に作る方法 - 天色グラフィティ
何かデータ分析を行わなければいけないとき、手軽に分析環境を用意したいというニーズがあります。 Jupyter Notebook上でnumpy、pandas、matplotlib、scikit-learnあたりが使えれば十分でしょうか。XGBoostやLightGBMといったライブラリも使えるようにしておきたいという人もいるかと思います。 一方、ローカルにいろい... 続きを読む
Kaggleで使えるpandasテクニック集 - 天色グラフィティ
2018 - 05 - 30 Kaggleで使えるpandasテクニック集 Python データ解析 Python でKaggleなどのデータ分析を行う際、pandasでゴリゴリ作業をすることが多いかと思います。 最近知って「めっちゃ便利やん!」ってなったものをまとめておきたいと思います。 全部の関数にドキュメントへのリンクを付けたので参考にしてください。 今回も検証にはTitanicのデー タセ... 続きを読む