タグ データサイエンティスト見習い
人気順 5 users 10 users 100 users 500 users 1000 users傾向スコアを用いた因果推論入門~実装編~ - データサイエンティスト見習いの日常
0. はじめに 1. 対象データ 2. 先に各手法の結果を確認 3.準備 4. 基礎集計~CMを見た人と見ていない人での目的変数の差~ 5. 因果推論の流れのおさらい 6. 傾向スコアモデリング 6.1 モデリング 6.2 テスト / コントロールの傾向スコアの可視化 6.3Rでの傾向スコアモデリングの実装 7. 傾向スコアマッチング 7.1 結構面倒... 続きを読む
傾向スコアを用いた因果推論入門~理論編~ - データサイエンティスト見習いの日常
0. はじめに 1. 因果推論~施策の本当の効果~ 1.1 TVのCMを見るとアプリのプレイ時間が短くなる!? 1.2じゃぁ理想的な比較方法は? 1.3 背景要因を揃えた比較が難しい問題 1.4 反実仮想:仮に「xxxしたら / しなかったら」の効果算出 2. 傾向スコアを用いた効果測定 2.1 絶対にこの条件は守ろう ~ 「SUTVA」/「強く無視... 続きを読む
B'zの歌詞をPythonと機械学習で分析してみた 〜LDA編〜 - データサイエンティスト見習いの日常
1. 本Part概要 前PartではB'zの歌詞を「TF-IDF」を用いた分析を行いました。 本Partではトピックモデルの一つである「LDA」を用いた分析についてお話しします。 pira-nino.hatenablog.com 2. LDAとは 2.1 LDAのイメージ 先に簡単な説明をしてしまいます。 LDAは「たくさんの文書データから単語のグルーピングを行う」モ... 続きを読む
バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践 Presentation Transcript バンディットアルゴリズム入門と実践 村上 智之(@GreenGreenMidor) 1 自己紹介 名前 村上 智之(@GreenGreenMidor) 仕事 データサイエンティスト見習い 日々の業務 データ分析、分析用コーディング 2 自己紹介 • 趣味 麻雀、ポーカー、 ゲーム 、テニス ETC. • データ分析... 続きを読む