タグ データ解析
人気順 5 users 10 users 50 users 500 users 1000 userschatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話
先日、データ解析のセミナーを開催しました。 未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。 好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。 このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサ... 続きを読む
アパレルで死ぬほどがんばって年収400万だった人がSQLとExcelと基本情報技術者試験で年収600万になった話
(あんちべ! 俺がS式だ) @AntiBayesian 統計屋。 データ解析やDMP開発、データ解析組織作りなどご相談ください。 主著:「データ解析の実務プロセス入門(amzn.to/3vgVTmS)」 プロフィール:engineer-lab.findy-code.io/jobs-in-statis… (あんちべ! 俺がS式だ) @AntiBayesian 飲食やアパレルなど、市場の先行きも不安で... 続きを読む
データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、食べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説を食べログの店舗デ... 続きを読む
Pythonでデータと向き合いながら価値を見出す「探索的データ解析」に挑戦しよう (1/3):CodeZine(コードジン)
本連載では、プログラミングの基本は理解していて、より実践的なデータ解析に取り組みたい方を対象に、スクリプト言語によるデータ解析の実践を解説します。スクリプト言語のなかでも特にデータ解析に役立つライブラリや環境が整っているPythonを取り上げ、対話型解析ツールやライブラリについて導入から解析の実行・可... 続きを読む
東大松尾研、データサイエンティスト育成講座の演習を無料公開 - ITmedia NEWS
データサイエンティスト育成講座の演習コンテンツを東大松尾研が無償公開。「無償公開によって、実社会で価値を生むことができるデータサイエンティストの育成拡大を目指す」としている。 東京大学大学院工学研究科の松尾研究室は3月19日、データ解析からモデルのアウトプットまで学べる講座「GCIデータサイエンティスト育成講座」(正式名:グローバル消費インテリジェンス寄附口座)で利用している演習コンテンツをWeb... 続きを読む
ヤフー、技術者採用に初年度650万円提示 新卒も可 :日本経済新聞
ヤフーはトップ級のエンジニアの採用拡大に乗り出す。30歳以下で新卒・既卒を問わず、就業経験のない入社希望者に初年度から年収650万円以上を提示する。通常の採用より200万円ほど高い。特定の技術分野で論文を発表していたり、自身が開発したアプリのダウンロード数が100万件以上になったりした人が対象。専門分野で活躍できる即戦力を獲得する。 これまで同様の採用の取り組みはデータ解析などの事業に導入してい... 続きを読む
探索的データ解析における正しい可視化手法の選び方と描き方 - Qiita
データ分析における関数の使い方については様々な記事が上がっています。関数を知らなかったり使い方が分からないときは調べればだいたい答えが見つかります。 一方で、実際に分析を始めようとすると、たとえ関数の使い方がわかっていても、データをどのような切り口から何を分析・可視化していけば良いのか困ってしまうことがよくあります。 この記事では、あんちべさんが書いた データ解析の実務プロセス入門 という本をベー... 続きを読む
コインチェック580億円流出は「わずか5分」の犯行と判明、データ解析で探る巨額のゆくえ | BUSINESS INSIDER JAPAN
仮想通貨取引所コインチェックから、約580億円相当の仮想通貨NEM(ネム)が不正に引き出された問題を受け、Business Insider Japanは、ブロックチェーンに詳しいエンジニアに、コインチェックから仮想通貨が引き出された履歴の解析を依頼した。 その結果、2018年1月26日(時間はいずれも日本時間)、計11回、総額5億2630万10XEM(XEMは、NEMの通貨単位)がNC4で始まるア... 続きを読む
膳所59年ぶりセンバツ 野球知らぬ2人がデータ解析 - 高校野球 : 日刊スポーツ
今年創部120周年を迎える膳所(ぜぜ=滋賀)が、21世紀枠で今春センバツに出場することが決まった。その原動力となったのが、昨年春に募集したデータ解析専門の部員だ。野球経験のない野津風太さん、高見遥香さん(ともに1年)の男女2人が「データ班」として加わり、秋季滋賀県大会8強に進出。これが評価され、59年ぶり4度目となるセンバツ切符を手中にした。 野津さんは、主にデータ解析のプログラミングを担当。野... 続きを読む
仮想通貨取引所のPoloniexからAPI経由でデータ取得し、ディープラーニング(Chainer)で翌日の価格予測をしよう - Qiita
はじめに みなさま、こんにちは。 株式会社キカガク代表取締役の吉崎(Twitter: @yoshizaki_kkgk )です。 久々の休日にせっかくなら面白いことをしよう!と思いついたのが、今回の記事です。 ぜひ、読者の皆様にとって、データ解析のアプローチについて、理解の深まる記事となっておりましたら幸いです。 意外にも反響が! 前回、仮想通貨取引所のLiquiからデータをAPI経由で取得する初心... 続きを読む
1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py
2017 - 05 - 14 1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ Statistics 前回の「 ゲームプログラマからデータサイエンティストに転職しました 」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は 統計学 のお勉強しました。 今回はおすすめしてもらった... 続きを読む
まとまってない文章を晒すのに抵抗があったけど、メモを垂れ流したら仕事がうまく回りだした件について - VOYAGE GROUP techlog
2017 - 03 - 15 まとまってない文章を晒すのに抵抗があったけど、メモを垂れ流したら仕事がうまく回りだした件について Zucks Ad Networkでデータ解析をしています、@yuu_itoです。 気づいたら3月も半ばですね。花粉で目がしょぼしょぼします。 メモを取ることについて書いていきます。 きっかけ 技術調査のために論文を集めGoogle Docsにまとめていた時、 とりあえずま... 続きを読む
東京大学 杉山・佐藤研究室
東京大学 杉山・佐藤研究室:機械学習と統計的データ解析 機械学習の基礎理論の構築と実用的なアルゴリズムの開発,及び,実問題への応用研究を行っています [ English | Japanese ] 研究概要 教科書 機械学習のための確率と統計 イラストで学ぶ機械学習:最小二乗法による識別モデル学習を中心に 統計的機械学習 統計的学習の基礎:データマイニング・推論・予測 パターン認識と機械学習 強くな... 続きを読む
「パナマ文書」解析の技術的側面 — Medium
世界中で話題になっている パナマ文書 。各国で政権を揺るがすような事態にもなっていますが、純粋にデータとしてみた場合、これは計算機やデータ解析に関わる人々にも面白いものだと思います。データの中身や背景などについてはさんざん報道されていますのでここでは触れません。一方、現場でどのような作業が行われているのかはあまり報道されていません。現実的な問題として、人力ではどうしようもない量のリークデータを手に... 続きを読む
『DARK SOULS』のデータ解析から生まれた対人戦AI「Project King」、10か月の開発を経て不死の世界に降臨 | AUTOMATON
『DARK SOULS』のデータ解析から生まれた対人戦AI「Project King」、10か月の開発を経て不死の世界に降臨 高難易度アクションRPGの金字塔『DARK SOULS』シリーズ。最新作『DARK SOULS III』の発売を数か月後に控える中、初代『DARK SOULS』のデータ解析から生まれたファン作成の対人戦AIが、海外フォーラムを中心に脚光を浴びている。10か月におよぶ開発の裏... 続きを読む
R vs Python:データ解析を比較 | プログラミング | POSTD
主観的な観点からPythonとRの比較した記事は山ほどありますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していくことで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが... 続きを読む
受動喫煙で子の虫歯2倍 7万人超のデータ解析 - 47NEWS(よんななニュース)
家族の吸うたばこの煙にさらされた子どもは、家族に喫煙者がいない子どもに比べて、3歳までに虫歯になる可能性が2倍になったとの研究結果を、京都大の川上浩司教授と田中司朗准教授らのチームが22日、英医学誌BMJに発表した。 チームは、神戸市で2004~10年に生まれた7万6920人のデータを解析。 その結果、家族に喫煙者がいる子は全体の55・3%おり、家族に喫煙者がいない子に比べて虫歯になる可能性が1・... 続きを読む
データサイエンティストなら年収1000万円!?無料&日本語でプログラミングの勉強をする方法
21世紀初頭に「IT革命」という言葉が世の中を席巻してから、インターネットはもはや車やガスなどと同じ社会的なインフラになったと言っても過言ではないのではないでしょうか。 そんな中、データサイエンティストという仕事に注目が集まっています。年収1000万円を越えることも夢ではない職業です。そんなデータサイエンティストにとって不可欠なデータ解析に関する知識を無料で学べる「UDACITYonEdmaps」... 続きを読む
線形モデルによる文京区の賃貸物件価格の解釈(「最高の借家」は統計解析で見つかるか?)
Transcript 1. 3/28/15 線型モデルによる 文京区の賃貸物件価格の解釈 ̶「最高の借家」は統計解析で見つかるか?̶ 先行研究としてTokyo.R#37の安井さんの『Rでお部屋探し』と、 @berobero11さんの『データ解析で割安賃貸物件を探せ!(山手線沿線編)』を 参考にさせて頂きました。 1 @windfall_j 2015/03/28(Sat.) Tokyo.R 2. C... 続きを読む
当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 - ハウテレビジョン開発者ブログ
2015-02-06 当社データサイエンティストがこよなく愛している『mコマンド』で数億行を高速集計する話 データ解析 どうも。 1月に入社したばかりの、データ分析担当のn_maoです。 と言いながら、最近はHTMLとjsばかりいじっております。 それはそれで楽しいです。 さて今回はデータ分析のざっくりとした仕事内容と、その分析にかかる手間を省くツールをご紹介します。 データ分析の仕事 まずは私の... 続きを読む
ONI Tsukkomi「鬼ツッコミ」
webサイトの改善、UIUXの改善をするためのツール「ONI Tsukkomi」。webサイトの改善ポイントを直感的に把握することができます。「ONI Tsukkomi」を使えばデータ解析などの定量分析では分からなかったユーザーの声や不満を集めることができます。数値解析からは知ることのできない、 Webサービスに対するリアルな「本音」が、 即座に把握できるツールです。 今すぐ無料でお試し (30秒... 続きを読む
可視化で理解するマルコフ連鎖モンテカルロ法(MCMC) - ほくそ笑む
先日行われた第9回「データ解析のための統計モデリング入門」読書会にて、「可視化で理解するマルコフ連鎖モンテカルロ法」というタイトルで発表させて頂きました。発表スライドは以下です。 可視化で理解するマルコフ連鎖モンテカルロ法 from hoxo_m この発表は、みどりぼんに登場する、マルコフ連鎖モンテカルロ法(MCMC)のアルゴリズムである「メトロポリス法」と「ギブス・サンプラー」について、可視化し... 続きを読む
「データ解析の伝道師」になるため、私が参考にした書籍5選【2014年前半のインプットlog—鈴木理恵子】 - エンジニアtype
トレジャーデータ株式会社 ソリューションアーキテクト/エバンジェリスト 鈴木理恵子さん(@asyoulike007) 東京女子大学へ入学するも、好きなギター製作の道へ進もうと専門学校へ。卒業後は一転、IT業界に進み、プログラマーとなる。システム開発会社、名刺管理サービス会社を経て、ミクシィに入社。プラットフォーム開発に携わる。2013年12月、トレジャーデータに入社 新しい挑戦でより専門的な知識... 続きを読む
Python と R で連携する - Qiita
R と Python の連携を考える 最近 R による基本的なデータプロッティングやファイル入出力の方法について説明しました。 データ分析の言語としては Python ですべてをやろうという昨今の傾向があるようですが、やはり過去の膨大な R による資産は魅力的でそう簡単に切り捨てられるものではありません。 よくあるケースとしては、部分的なデータ解析については R を流用したいが、全体的なプログラミ... 続きを読む
SSDのせいで現代の犯罪捜査が極めて困難になっている状況が判明、その原因をSSDの仕組みから解説 - GIGAZINE
By Jung-nam Nam 高速なデータ処理が可能なソリッドステートドライブ(SSD)の高性能化・低価格化・大容量化の勢いはとどまるところを知らず、2014年度中にもIntelは2TBの高速SSDをリリースする予定です。身近なストレージとして普及しつつあるSSDですが、犯罪捜査におけるデータ解析を困難にさせる存在であると指摘されています。 Belkasoft: Digital Evidence... 続きを読む