タグ Colorless Green Ideas
人気順 10 users 50 users 100 users 500 users 1000 usersRによるデータクリーニング実践――政府統計からのグラフ作成を例として|Colorless Green Ideas
はじめに データクリーニング は、データ分析の際に非常に重要なプロセスの1つであるが、データ分析の教科書では必ずしも十分に扱われていない。そこで、現実のデータクリーニングがどのように行われるかについて、一事例を紹介したいと思う。具体的には、統計処理に適したプログラミング言語の R を用いて、粗悪なデータから簡単な折れ線グラフが作成できる程度のきれいなデータにするまでのデータクリーニングを実施してい... 続きを読む
中国外交部の報道官の「お返ししなければ失礼」発言の出典は『礼記』|Colorless Green Ideas
“来而不往非礼也” 米国が中国への貿易制裁措置をとったことに対し、中国外交部の華春瑩報道官が2018年3月23日の記者会見で述べた言葉として、NHKが「お返しをしなければ失礼にあたる」というものを報じている 。 この「お返しをしなければ失礼にあたる」の 中国語の原文 を見てみると、“ 来而不往非礼也 ”(来タリテ 往 ( ゆ ) カザレバ礼ニアラザルナリ)となっている。これは儒教の経典の1つである... 続きを読む
阪大は入試ミス対応のために教職員に寄付をつのるべきでない|Colorless Green Ideas
はじめに 『毎日新聞』の報道によると、大阪大学が 入試ミスに対応 するために 教職員に寄付をつのっている という 。 このような手立てをとることは、教職員が今後ミスを報告したくなくなるなどといった 悪影響が考えられる ため、適切ではないと思う。 教職員寄付による基金 まずは、この寄付の話について知られていることをまとめてみよう。 阪大は、2017年に行われた入試の中で出題・採点のミスを犯し、201... 続きを読む
Amoing torans only の謎|Colorless Green Ideas
Amoing torans only の謎 看板の謎の言葉 2018年の1月に東京の渋谷駅に行ったとき、以下の写真に示す看板があった。 東京の渋谷駅構内の看板(2018年1月撮影)。上段には「この階段は降車専用です」とあり、下段1行目には“No bouding port the plantform”、2行目に“Amoing torans only” と記されている。 日本語で書かれている「この階段... 続きを読む
「元旦」で1月1日全体を指すことは別に誤りというわけではない|Colorless Green Ideas
「元旦」=「1月1日の朝」説 「 元旦 」という言葉は1月1日の朝を指し、1月1日全体を指すわけではないと説明する人がいる。この説明に基づけば、「元旦の夜」というのは語義矛盾であり、「誤った」言い方になる。 しかし、私としては、この説に反対したい。 「元旦」で1月1日全体を指すことは別に誤りというわけではない と思うのだ。実際、後に示すように、「元旦」で1月1日全体を指し示す事例はとてもたくさんあ... 続きを読む
外国語の名前を挙げて「わけがわからないよ」を示す例|Colorless Green Ideas
「ボクにとってギリシャ語だよ」=「わけがわからないよ」 「わけがわからないよ」に対応する英語の表現として、“It's Greek to me.”という表現がある 。これは、文字通りには「ボクにとって ギリシャ語 だよ」という意味。こんな感じで、 「わけがわからないよ」と言うときに外国語の名前を挙げる 例は、英語以外にも見られる。 英語では、「ボクにとってギリシャ語だよ」という語句で、「わけがわから... 続きを読む
「この春から統計を学びはじめたい!」という人のための書籍7冊(2017年4月版)|Colorless Green Ideas
はじめに この記事では、 統計についてあまりよく知らない人 が、 統計を学びはじめる ときに役に立つ書籍を紹介したいと思う。まず、前半では、統計のまったくの初心者が勉強するときに役立つ書籍を3冊紹介する。後半では、前半に挙げた書籍の内容を大体理解した人が、その理解を定着させるために役立つ書籍を4冊紹介する。 まったくの初心者のために まったくの初心者が、統計を勉強したいというときに一番おすすめなの... 続きを読む
統計の初心者のつまずきやすい点が分かる『統計的方法のしくみ』|Colorless Green Ideas
つまずきやすい点を解説した副読本 割とどんな分野でもそうだと思うが、初心者がつまずきやすい場所というものがある。例えば、小学校の算数の勉強を考えてみると、九九が覚えられないとか、割合の意味をうまく理解できないといったところがつまずきやすい場所になるだろう。 統計の勉強のときにも初心者がつまずきやすい場所がある。例えば、統計の教科書に出てくる Σ という記号の意味が分からなかったり、統計的仮説検定で... 続きを読む
DeNA に対する第三者委員会の調査報告書での信頼区間の説明|Colorless Green Ideas
調査報告書の背景 2017年3月13日、DeNA がキュレーションメディア事業で著作権侵害などの問題を起こしたことに対し、第三者委員会による調査報告書が出された 。この報告書は以下の場所からダウンロードすることができる。 株式会社ディー・エヌ・エー 第三者委員会調査報告書の全文開示公表のお知らせ (容量が大きいPDFなので注意) この調査報告書を読んでみたところ、 信頼区間についての説明が少しあや... 続きを読む
主要な統計解析ソフトの擬似乱数生成アルゴリズム|Colorless Green Ideas
はじめに 統計解析の際には、 乱数 (random number) が必要になることが多い。例えば、無作為抽出をしたり、モンテカルロ法を実行したりするときには、乱数が必要になる。しかし、計算機を使って分析する際に真の乱数を作り出すことは容易でないことから、何らかのアルゴリズムによって 擬似乱数 (pseudo-random number) を作り出すことが必要になる。 2017年2月現在、主要な統... 続きを読む
ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas
はじめに この記事では、科学研究における統計の誤用を扱った『 ダメな統計学——悲惨なほど完全なる手引書 』を読んだ 後 に、 実際に統計の誤用を防ぐ方法を学ぶ ために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。 なお、『 ダメな統計学——悲惨なほど完全なる手引書 』は、 科学の世界での統計の誤... 続きを読む
『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版|Colorless Green Ideas
はじめに このたび、私の翻訳した『 ダメな統計学――悲惨なほど完全なる手引書 』という本が勁草書房から出版されることになった。2017年1月27日ごろから書店などで手に入るようになる予定である。 アレックス・ラインハート〔著〕・西原史暁〔訳〕.(2017).『 ダメな統計学――悲惨なほど完全なる手引書 』東京:勁草書房. 訳書版元サイトでの紹介: ダメな統計学――悲惨なほど完全なる手引書|勁草書房... 続きを読む
これから数学を学ぼうと思った人のための読書リスト(2016年4月版)|Colorless Green Ideas
はじめに 新年度になって、何か新しいことを学ぼうという気になったという人は少なくないだろう。そうした人の中には、これから数学を学ぼうと思った人もいるかもしれない。それだけでなく、高校や大学に進学したことで、今までとは違った感じの数学を学ぶ必要が出てくる人もいるだろう。 この記事では、そういった人のために、数学の学び方や考え方に触れられる文献を紹介していきたいと思う。 大学での数学の勉強 大学での数... 続きを読む
Excelのダメなグラフでウソをつく法|Colorless Green Ideas
注意書き この記事は、 Excel でどこまでダメなグラフを作れるかを実際に試してみた報告である。この記事の内容に従えば、事実をねじまげて伝えるようなダメなグラフを作ることができてしまう。これは物事を正しく伝達できないという点で望ましくない。読者各位におかれては、この記事に書かれている内容を 悪用しないようにお願いしたい 。 なお、この記事では、OS X 10.11 El Capitan 上の M... 続きを読む
「彼はモンゴル語を研究しているからロシア語ができる」|Colorless Green Ideas
研究対象となる言語と研究に使う言語のずれ 前に言語学の話をしていて、「彼はモンゴル語を研究しているからロシア語ができる」というセリフを聞いたことがある。これだけ聞くと、だいぶ奇妙な感じがするだろう。「モンゴル語を研究しているからモンゴル語ができる」というのならば分かるのだが、「モンゴル語を研究しているからロシア語が分かる」と言うのだ。 だが、このことはモンゴル語の研究の文脈を踏まえるとそんなにおか... 続きを読む
最短の学術論文|Colorless Green Ideas
はじめに 学術論文の価値はその長さで決まるわけではない。短い論文であっても価値があるものは少なくない。例えば、DNAが二重螺旋構造をしているというワトソンとクリックの1953年の論文 は、たったの2ページしかない。この20世紀で最も重要な科学的発見を示した英語で書かれた論文の語数は、1000語に満たないのだ。これだけの短い論文であるが、この発見によってワトソンとクリックはノーベル医学・生理学賞を受... 続きを読む
分かりやすい文章を書くためのたったひとつのさえたやりかた:『数学文章作法』のレビュー|Colorless Green Ideas
はじめに 『数学文章作法 基礎編』という本と、その姉妹編に当たる『数学文章作法 推敲編』という本 について紹介する。 結城浩 (2013). 『数学文章作法 基礎編』 東京:筑摩書房. 結城浩 (2014). 『数学文章作法 推敲編』 東京:筑摩書房. この2冊は、分かりやすい文章を書く方法を記した本である。『基礎編』は、分かりやすい文章を書くための方法を具体例とともに説明し、『推敲編』は、文章を... 続きを読む
平成27年度センター試験の倫理で問題のある棒グラフが出題|Colorless Green Ideas
はじめに 2015年1月17日(土)に、平成27年度の大学入試センター試験の1日目が行われた。この日に出題された「倫理」の第1問の問4 において、棒グラフが2つ示されている。この棒グラフは、棒がゼロから始まっておらず、40%から始まっている。これでは棒グラフとして不適切である。 問題があるグラフは2つあるのだが、そのうち1つを先に挙げておこう。 平成27年度センター試験の倫理の第1問問4図1の棒グ... 続きを読む
『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
冊子の公開にあたって 『ダメな統計学』冊子PDFのダウンロードはこちら。 『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 PDF... 続きを読む
学術論文を書くときは Microsoft Word と LaTeX のどちらが効率的か?|Colorless Green Ideas
はじめに 研究者が学術論文を書く場合、どんなソフトウェアを使って文書を作成するのだろうか。使うソフトは、人によって異なっている。研究以外の世界でも広く使われているワープロソフトの Microsoft Word を使う人もいれば、LaTeX という数式処理に優れた組版システムで文書を書く人もいる。 それでは、Microsoft Word と LaTeX のどちらが効率的に文書が作れるのだろうか? 実... 続きを読む
ダメな統計学:目次|Colorless Green Ideas
『ダメな統計学』の目次。 『ダメな統計学』には科学研究での統計の誤用がもたらす問題点について様々なことが書かれている。科学を研究しようとする人や統計で分析をしようとする人は必読。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を... 続きを読む
魔王―ブラック企業編|Colorless Green Ideas
本文 風と闇の中、遅くに帰ってくるのは誰か? 残業で疲れ果てて帰ってくる息子だ。 父親は息子が帰ってくるのを迎え、 そしてまた職場に行くのを送る。 子を連れ去る魔王 「息子よ、なぜおそれて顔を隠すのだ?」 「お父さんにはブラック企業が見えないの? 朝早くも夜遅くも働かせるブラック企業を!」 「息子よ、あれは残業が多いだけの職場だよ」 「会社の大事な財産である人財よ、私と一緒においで。 夢に向かって... 続きを読む
Mac OS で簡単に旧字体や異体字を出す方法|Colorless Green Ideas
旧字体や異体字を出すための方法 Mac OS でことえりを使っている場合、以下の手順で簡単に旧字体や異体字を出すことができる。 標準的な字体で漢字を出す。 字体を変えたい漢字を1文字だけ選択する。 選択した状態で、コントロール (control) キーを押しながら「1」を押す。 例を見てみよう。ここでは、「広島県」の旧字体である「廣嶋縣」を出すものとする。まず、普通にかな漢字変換を使って、「広島県... 続きを読む
おとぎばなし:かねもちはくし と びんぼうはくし|Colorless Green Ideas
一 あるくにに だいがくいんという とても りっぱな がっこうが ありました。このがっこうでは だいがくいんせいという ひとたちを そだてて よのなかのやくにたつ りっぱなひとにするのです。そして このがっこうを でた りっぱなひとのことを「はくし」といいます。 はくしたちは とっても ものしりです。みんなが いままで わからなかったことを あきらかにしてくれます。みんなが いままで こまっていた... 続きを読む
忍殺語形態素解析辞書「チャドー」がリリース|Colorless Green Ideas
はじめに 「ドーモ。自然言語処理屋=サン。形態素解析辞書チャドーです」オジギ終了後0.7秒後。ネオサイタマのドロップボックスにアップロードされた辞書のURLが示された。 「アイエエエエ! ケイタイソカイセキ!? ケイタイソカイセキナンデ!?」 小説『ニンジャスレイヤー』の日本語訳 では独特の言葉遣いが使われており、俗に「忍殺語」 と呼ばれている。この忍殺語の形態素解析を行うための辞書「チャドー」の... 続きを読む