タグ データ解析
人気順 5 users 10 users 100 users 500 users 1000 userschatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話
先日、データ解析のセミナーを開催しました。 未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。 好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。 このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサ... 続きを読む
アパレルで死ぬほどがんばって年収400万だった人がSQLとExcelと基本情報技術者試験で年収600万になった話
(あんちべ! 俺がS式だ) @AntiBayesian 統計屋。 データ解析やDMP開発、データ解析組織作りなどご相談ください。 主著:「データ解析の実務プロセス入門(amzn.to/3vgVTmS)」 プロフィール:engineer-lab.findy-code.io/jobs-in-statis… (あんちべ! 俺がS式だ) @AntiBayesian 飲食やアパレルなど、市場の先行きも不安で... 続きを読む
データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、食べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説を食べログの店舗デ... 続きを読む
統計的因果推論とデータ解析 / causal-inference-and-data-analysis - Speaker Deck
統計的因果推論の解釈と、実際の運用における注意点をまとめた資料です。 先日、closedな勉強会で発表したものを一部改変したものです。 twitter : @tomoshige_n mail : tomoshige.nakamura@gmail.com 注)一部、わかりやすさを厳密性よりも優先した部分があります。厳密性などを求める方は、文献等をあたってください。 続きを読む
Pythonでデータと向き合いながら価値を見出す「探索的データ解析」に挑戦しよう (1/3):CodeZine(コードジン)
本連載では、プログラミングの基本は理解していて、より実践的なデータ解析に取り組みたい方を対象に、スクリプト言語によるデータ解析の実践を解説します。スクリプト言語のなかでも特にデータ解析に役立つライブラリや環境が整っているPythonを取り上げ、対話型解析ツールやライブラリについて導入から解析の実行・可... 続きを読む
本格的なPythonデータ解析環境を手軽に! 「Jupyter Notebook」の導入から可視化まで (1/3):CodeZine(コードジン)
本連載では、プログラミングの基本は理解していて、より実践的なデータ解析に取り組みたい方を対象に、スクリプト言語によるデータ解析の実践を解説します。スクリプト言語のなかでも特にデータ解析に役立つライブラリや環境が整っているPythonを取り上げ、対話型解析ツールやライブラリについて導入から解析の実行・可... 続きを読む
「データを集める前にデータ分析責任者(データサイエンティスト)を雇うべき」理由とは - 六本木で働くデータサイエンティストのブログ
2018 - 05 - 15 「データを集める前にデータ分析責任者(データサイエンティスト)を雇うべき」理由とは データ分析 ビジネス データサイエンティスト (Image by Pixabay ) 先日こんな記事が注目を集めていたのを見かけたのでした。 ここで大事なのは、データ集めは非常に大事なステップですが、最初の0.8歩に過ぎないということです。データ解析やAI技術導入の準備に時間をかけすぎ... 続きを読む
SQLクライアントはこれひとつでOK! あらゆるDBMSで使える「SQL Workbench/J」をデータ解析で活用しよう (1/3):CodeZine(コードジン)
本シリーズではビジネスデータ解析でデータベースから情報を取得して活用する必要がある方を対象に、ビジネスデータ解析でよく使われる実践的なSQL例など、分析向けの活用を解説します。本稿では、さまざまなデータベースに接続する必要があるデータ解析の際に役立つ、フリーのSQLクライアントツール「SQL Workbench/J」の活用方法を解説します。導入・データベース活用手順を解説しデータ解析の際に役立つ機... 続きを読む
東大松尾研、データサイエンティスト育成講座の演習を無料公開 - ITmedia NEWS
データサイエンティスト育成講座の演習コンテンツを東大松尾研が無償公開。「無償公開によって、実社会で価値を生むことができるデータサイエンティストの育成拡大を目指す」としている。 東京大学大学院工学研究科の松尾研究室は3月19日、データ解析からモデルのアウトプットまで学べる講座「GCIデータサイエンティスト育成講座」(正式名:グローバル消費インテリジェンス寄附口座)で利用している演習コンテンツをWeb... 続きを読む
ヤフー、技術者採用に初年度650万円提示 新卒も可 :日本経済新聞
ヤフーはトップ級のエンジニアの採用拡大に乗り出す。30歳以下で新卒・既卒を問わず、就業経験のない入社希望者に初年度から年収650万円以上を提示する。通常の採用より200万円ほど高い。特定の技術分野で論文を発表していたり、自身が開発したアプリのダウンロード数が100万件以上になったりした人が対象。専門分野で活躍できる即戦力を獲得する。 これまで同様の採用の取り組みはデータ解析などの事業に導入してい... 続きを読む
探索的データ解析における正しい可視化手法の選び方と描き方 - Qiita
データ分析における関数の使い方については様々な記事が上がっています。関数を知らなかったり使い方が分からないときは調べればだいたい答えが見つかります。 一方で、実際に分析を始めようとすると、たとえ関数の使い方がわかっていても、データをどのような切り口から何を分析・可視化していけば良いのか困ってしまうことがよくあります。 この記事では、あんちべさんが書いた データ解析の実務プロセス入門 という本をベー... 続きを読む
コインチェック580億円流出は「わずか5分」の犯行と判明、データ解析で探る巨額のゆくえ | BUSINESS INSIDER JAPAN
仮想通貨取引所コインチェックから、約580億円相当の仮想通貨NEM(ネム)が不正に引き出された問題を受け、Business Insider Japanは、ブロックチェーンに詳しいエンジニアに、コインチェックから仮想通貨が引き出された履歴の解析を依頼した。 その結果、2018年1月26日(時間はいずれも日本時間)、計11回、総額5億2630万10XEM(XEMは、NEMの通貨単位)がNC4で始まるア... 続きを読む
膳所59年ぶりセンバツ 野球知らぬ2人がデータ解析 - 高校野球 : 日刊スポーツ
今年創部120周年を迎える膳所(ぜぜ=滋賀)が、21世紀枠で今春センバツに出場することが決まった。その原動力となったのが、昨年春に募集したデータ解析専門の部員だ。野球経験のない野津風太さん、高見遥香さん(ともに1年)の男女2人が「データ班」として加わり、秋季滋賀県大会8強に進出。これが評価され、59年ぶり4度目となるセンバツ切符を手中にした。 野津さんは、主にデータ解析のプログラミングを担当。野... 続きを読む
仮想通貨取引所のPoloniexからAPI経由でデータ取得し、ディープラーニング(Chainer)で翌日の価格予測をしよう - Qiita
はじめに みなさま、こんにちは。 株式会社キカガク代表取締役の吉崎(Twitter: @yoshizaki_kkgk )です。 久々の休日にせっかくなら面白いことをしよう!と思いついたのが、今回の記事です。 ぜひ、読者の皆様にとって、データ解析のアプローチについて、理解の深まる記事となっておりましたら幸いです。 意外にも反響が! 前回、仮想通貨取引所のLiquiからデータをAPI経由で取得する初心... 続きを読む
1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py
2017 - 05 - 14 1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ Statistics 前回の「 ゲームプログラマからデータサイエンティストに転職しました 」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は 統計学 のお勉強しました。 今回はおすすめしてもらった... 続きを読む
まとまってない文章を晒すのに抵抗があったけど、メモを垂れ流したら仕事がうまく回りだした件について - VOYAGE GROUP techlog
2017 - 03 - 15 まとまってない文章を晒すのに抵抗があったけど、メモを垂れ流したら仕事がうまく回りだした件について Zucks Ad Networkでデータ解析をしています、@yuu_itoです。 気づいたら3月も半ばですね。花粉で目がしょぼしょぼします。 メモを取ることについて書いていきます。 きっかけ 技術調査のために論文を集めGoogle Docsにまとめていた時、 とりあえずま... 続きを読む
東京大学 杉山・佐藤研究室
東京大学 杉山・佐藤研究室:機械学習と統計的データ解析 機械学習の基礎理論の構築と実用的なアルゴリズムの開発,及び,実問題への応用研究を行っています [ English | Japanese ] 研究概要 教科書 機械学習のための確率と統計 イラストで学ぶ機械学習:最小二乗法による識別モデル学習を中心に 統計的機械学習 統計的学習の基礎:データマイニング・推論・予測 パターン認識と機械学習 強くな... 続きを読む
「パナマ文書」解析の技術的側面 — Medium
世界中で話題になっている パナマ文書 。各国で政権を揺るがすような事態にもなっていますが、純粋にデータとしてみた場合、これは計算機やデータ解析に関わる人々にも面白いものだと思います。データの中身や背景などについてはさんざん報道されていますのでここでは触れません。一方、現場でどのような作業が行われているのかはあまり報道されていません。現実的な問題として、人力ではどうしようもない量のリークデータを手に... 続きを読む
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム
機械学習ライブラリ「Spark MLlib」で作る アニメレコメンドシステム 1. 秋葉原IT戦略研究所 野田純一 2. 秋葉原IT戦略研究所のご紹介 形態 アニメに関するデータ解析が主体の 同人サークル 兼 ITコミュニティ メンバー 現在11名 活動 オープンソースカンファレンス出展、コミケC89出展、デブサミ等のイベ ントで発表 合計7回 3. 自己紹介 所属 GMOインターネット 業... 続きを読む
『DARK SOULS』のデータ解析から生まれた対人戦AI「Project King」、10か月の開発を経て不死の世界に降臨 | AUTOMATON
『DARK SOULS』のデータ解析から生まれた対人戦AI「Project King」、10か月の開発を経て不死の世界に降臨 高難易度アクションRPGの金字塔『DARK SOULS』シリーズ。最新作『DARK SOULS III』の発売を数か月後に控える中、初代『DARK SOULS』のデータ解析から生まれたファン作成の対人戦AIが、海外フォーラムを中心に脚光を浴びている。10か月におよぶ開発の裏... 続きを読む
PCAの最終形態GPLVMの解説
PCAの最終形態GPLVMの解説 1. PCAの最終形態 GPLVMの解説 antiplastics@RIKEN ACCC 2015.11.14 2. ⾃自⼰己紹介 ・露露崎弘毅(つゆざき こうき) ・理理化学研究所 情報基盤センター バイオインフォマティクス研究開発ユニット (RIKEN ACCC BiT) 特別研究員 ・Single-‐‑‒cell RNA-‐‑‒Seqのデータ解析... 続きを読む
R vs Python:データ解析を比較 | プログラミング | POSTD
主観的な観点からPythonとRの比較した記事は山ほどありますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していくことで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが... 続きを読む
受動喫煙で子の虫歯2倍 7万人超のデータ解析 - 47NEWS(よんななニュース)
家族の吸うたばこの煙にさらされた子どもは、家族に喫煙者がいない子どもに比べて、3歳までに虫歯になる可能性が2倍になったとの研究結果を、京都大の川上浩司教授と田中司朗准教授らのチームが22日、英医学誌BMJに発表した。 チームは、神戸市で2004~10年に生まれた7万6920人のデータを解析。 その結果、家族に喫煙者がいる子は全体の55・3%おり、家族に喫煙者がいない子に比べて虫歯になる可能性が1・... 続きを読む
データサイエンティストなら年収1000万円!?無料&日本語でプログラミングの勉強をする方法
21世紀初頭に「IT革命」という言葉が世の中を席巻してから、インターネットはもはや車やガスなどと同じ社会的なインフラになったと言っても過言ではないのではないでしょうか。 そんな中、データサイエンティストという仕事に注目が集まっています。年収1000万円を越えることも夢ではない職業です。そんなデータサイエンティストにとって不可欠なデータ解析に関する知識を無料で学べる「UDACITYonEdmaps」... 続きを読む
線形モデルによる文京区の賃貸物件価格の解釈(「最高の借家」は統計解析で見つかるか?)
Transcript 1. 3/28/15 線型モデルによる 文京区の賃貸物件価格の解釈 ̶「最高の借家」は統計解析で見つかるか?̶ 先行研究としてTokyo.R#37の安井さんの『Rでお部屋探し』と、 @berobero11さんの『データ解析で割安賃貸物件を探せ!(山手線沿線編)』を 参考にさせて頂きました。 1 @windfall_j 2015/03/28(Sat.) Tokyo.R 2. C... 続きを読む