タグ 統計量
人気順 10 users 50 users 100 users 500 users 1000 users日本における自尊感情の時間横断的メタ分析:得られた知見とそこから示唆されること
自尊感情はこれまでの心理学の歴史の中で非常に多くの研究で取り上げられてきた構成概念のひとつである。近年では,多くの研究知見を統合するメタ分析が注目を集めている。その中でも本稿では,平均値等の統計量をデータが収集された調査年ごとに統合することで,心理学概念の時代的な変化を検討する時間横断的メタ分析... 続きを読む
「AI」エンジニアになるための「基礎数学」再入門 - @IT
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回から具体的に数学を学びます。統計とは、統計量とは何かを数学記号や数式、Pythonコード、図を交えて解説します。 続きを読む
Pythonコードと図で分かる平均値と標準偏差の違い――「統計」とはデータから価値ある情報を抜き出すこと (1/2):「AI」エンジニアになるための「基礎数学」再入門(3) - @IT
「AI」エンジニアになるための「基礎数学」再入門(3):Pythonコードと図で分かる平均値と標準偏差の違い――「統計」とはデータから価値ある情報を抜き出すこと (1/2) AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回から具体的に数学を学びます。統計とは、統計量とは... 続きを読む
毎月勤労統計調査における「母集団」の「復元」 - remcat: 研究資料集
厚生労働省「毎月勤労統計調査」のサンプリングがおかしかった問題について。標本調査で得た統計量をどうあつかうかの理屈自体がややこしいのに加えて、毎月勤労統計調査に固有の課題がいろいろあるので、理解するのがけっこう面倒である。以下、私の理解の範囲内で簡単な説明。 なお、この記事を書くにあたっての情報源... 続きを読む
Python: pandas-profiling でデータセットの概要を確認する - CUBE SUGAR CONTAINER
今回は pandas-profiling というパッケージを使ってみる。 このパッケージを使うと pandas の DataFrame に含まれる各次元の基本的な統計量や相関係数などを一度に確認できる。 最初にデータセットのサマリーを確認できると、その後の EDA (Exploratory Data Analysis: 探索的データ分析) の取っ掛かりにしやすいと思う... 続きを読む
P値を捨てた雑誌で使われている統計量: ニュースの社会科学的な裏側
ラジラジ言っている北海道の心理学者PsycheRadio氏と話をしていたときに、「 心理学で(他の学問でも)統計的検定や推測統計学への批判が高まって以前ほど使われなくなりつつある 」と言われたが、違和感がある。少なくとも社会科学分野で使われなくなったとは聞かない。話の流れにあわせて誤魔化されている気がするので確認してみた。 1. 確かに統計的仮説検定は非難されている PsycheRadio氏が全く... 続きを読む
『ベイズ統計の理論と方法』の行間を読む I - ill-identified diary
2018 - 03 - 30 『ベイズ統計の理論と方法』の行間を読む I 概要 渡辺澄夫の『 ベイズ 統計の理論と方法』 (以下, 渡辺本) は, 私のように 統計学 は多少知ってるものの, 統計力学 を知らない人間にとっては, 「自由エネルギー」だの「分配関数」だのが何を意図して定義された統計量 (物理量?) なのかよくわからず, はじめは数式を目で追うことしかできなかった. 加えて, 渡辺本は... 続きを読む
年収を"偏差値化"した世界 - RepoLog│日々感じたことをレポートするブログ
2017 - 01 - 28 年収を"偏差値化"した世界 生活レポート 年収を偏差値で表すと、どんなことが起きるのでしょうか。 「偏差値」という統計量は、受験戦争を通じて日本社会に定着しています。受験期には嫌というほど耳にする数値指標ですよね。 受験業界ではもはやなくてはならない統計量になっている偏差値ですが、その数値の高低のみで進学先を決定する風習から偏差値至上主義を生み出し、"悪の元凶"のよう... 続きを読む
時系列解析 - ナンバーズ予想で学ぶ統計学
時系列解析の説明 時系列解析とは 時間の経過と共に記録されたデータについて傾向、周期、誤差を分析する 手法を指す。 時間の経過と共に記録されたデータのことを 時系列データ と言う。 時系列データから何かを読み取ろうとするとき、数字を眺めているだけではどうにもなりません。 時系列データから 基本的な統計量 を算出して、 「当せん金額が最も多かったのは先月だ」とか「抽せん数字の平均値は 555.5 だ... 続きを読む
HaskellのFusionがあれば速度と抽象化を両立できる - りんごがでている
2014-06-10 HaskellのFusionがあれば速度と抽象化を両立できる Haskell データの分析をする際には配列やベクトルは欠かせないデータ構造です。 大体どの言語にも大体配列は用意されていて、そこにサンプルのデータ等を入れて統計量を計算したり関数に渡して回帰をしたりするわけです。 ベクトルという単位でデータの塊を扱うものの、実際のアルゴリズムではベクトル内の要素一つひとつを見てい... 続きを読む
落とし穴を回避する―データの読み方、考え方 - ZDNet Japan
第1回と第2回では目的を持って分析を実施することの重要性を解説しました。では、実際にデータを分析する際に扱うデータはどのようなものがあるのでしょうか。データはあくまで記号の羅列です。それぞれに意味があり、適切なコンテキスト(背景や意味)を読み取れなければ、正しいデータ分析はできません。そこで、今回はデータの基本的な尺度や統計量などを説明したいと思います。 データの4つの尺度について データには主に... 続きを読む