タグ rmizuta
人気順 10 users 50 users 100 users 500 users 1000 users機械学習における欠損値補完について考える - rmizutaの日記
はじめに 最近多重代入法という欠損値補完の手法があることを知りました。 統計学の界隈では欠損値補完は多重代入法を使用するのがベターのようですが、 機械学習の文脈ではあまりその手法が使用されている形跡がなかったので、 なぜそうなのか調査・実験した結果を記述します。 参考資料 欠測データ処理: Rによる単一代... 続きを読む
傾向スコアと機械学習とprobability calibrationの話 - rmizutaの日記
はじめに RCTが使えない場合の因果推論の手法として傾向スコアを使う方法があります。 傾向スコアの算出はロジスティック回帰を用いるのが一般的ですが、この部分は別にlightgbmとか機械学習的な手法でやってもいいのでは?と思っていましたが既にやっている記事がありました。 統計的因果推論(3): 傾向スコア算出を機械... 続きを読む
「勢い」が存在するかを統計的に確認する(大相撲編) - rmizutaの日記
はじめに スポーツの世界においては「勢いがある」、「流れが来ている」等の表現がよくされると思うのですが、これらはオカルトではなく実際に存在するものなのでしょうか?この分野ではバスケのホットハンドの話が有名で、色々な方が研究されているのようなのですが、気になったので自分でも検証してみることにしました... 続きを読む
箱根駅伝で優勝する確率をエントリー時のタイムを用いて予測してみる - rmizutaの日記
はじめに 箱根駅伝は好きで割と毎年見ているのですが、 マラソン系の競技ってパフォーマンスの分散が対人競技と比較すると小さくなるため、実は事前の情報から結果を予測することが比較的容易なんじゃないか?という疑問が浮かんだので、各大学が優勝する確率を出してみることにしました。 方針としては、箱根駅伝に出場... 続きを読む