タグ Scaled_Wurm
人気順 5 users 10 users 100 users 500 users 1000 usersはてなブックマーク数が多い2016年のアドベントカレンダーの記事 - 唯物是真 @Scaled_Wurm
2016 - 12 - 27 はてなブックマーク数が多い2016年のアドベントカレンダーの記事 list Tweet QiitaとAdventarにあるアドベントカレンダーについて、個別の記事とカレンダー全体のはてなブックマーク数のランキングを27日の0時ごろに集計した 個別記事上位100件のURLについては軽く目で見て最近の記事でなかったりするURLをフィルタリングしてある(漏れはありそう ↓途... 続きを読む
Google の可視化ツールの Data Studio を試してみた - 唯物是真 @Scaled_Wurm
2016 - 10 - 16 Google の可視化ツールの Data Studio を試してみた list Tweet Google Data Studio という可視化サービスがベータ版で使えるようになっていたので試してみた 見たい数値を一覧するためのダッシュボード的なものを作るためのサービスなので、いろんな場所からデータを取ってきて一箇所でまとめて確認するのが用途っぽい(今のところ似たような... 続きを読む
BigQueryでクエリ課金額が多いユーザーを通知するbotを作ったら富豪的解決がなされた - 唯物是真 @Scaled_Wurm
2016 - 10 - 09 BigQueryでクエリ課金額が多いユーザーを通知するbotを作ったら富豪的解決がなされた list Tweet qiita.com 上の記事でBigQueryに投げたクエリのログ(Audit Log)がインポートできることを知ったので、会社で使われているBigQueryのアカウントについて毎日クエリの課金額(処理したバイト数)の多いユーザーをSlackに通知してみた... 続きを読む
PHP の mt_rand() は一貫して壊れている(consistently broken)らしい - 唯物是真 @Scaled_Wurm
2016 - 02 - 19 PHP の mt_rand() は一貫して壊れている(consistently broken)らしい list Tweet PHP で Mersenne Twister法 で 擬似乱数 を生成する関数の mt_rand() にバグがあり出力がおかしい、という話が流れてきておもしろかったので簡単にまとめておく kusanoさんがmt_rand()の実装に 9年以上前 か... 続きを読む
毎日が天皇誕生日になるには何回天皇が交代する必要があるか(シミュレーション版) - 唯物是真 @Scaled_Wurm
2014-12-23 毎日が天皇誕生日になるには何回天皇が交代する必要があるか(シミュレーション版) python 今日は天皇誕生日ですが、以前「あと何回天皇が交代すれば毎日が天皇誕生日になるか(不謹慎)」の期待値を求める記事を書きました 毎日が天皇誕生日になるには何回天皇が交代する必要があるか - 唯物是真 @Scaled_Wurm 毎日が天皇誕生日になるには何回天皇が交代する必要があるか - ... 続きを読む
日本語形態素解析器のイメージ - 唯物是真 @Scaled_Wurm
2014-12-21 日本語形態素解析器のイメージ 自然言語処理 前にこんなツイートをしたけどもうちょっとちゃんとメモっておく ゆるふわカジュアル勢()なので内容に間違ってる点があったら教えてくださると嬉しいです勝手なイメージだと、MeCab →一番使われてる 。速い。辞書を弄くるのが簡単。いろいろ移植されてる。Juman→出力が詳しい。代表表記に正規化できる。KNPを使うときはこれ。KyTea→... 続きを読む
Pythonで出力したCSV(UTF-8)がExcelで読み込めなくて困った話 - 唯物是真 @Scaled_Wurm
2014-12-09 Pythonで出力したCSV(UTF-8)がExcelで読み込めなくて困った話 python Pythonで出力したUTF-8のCSVを渡したら「文字化けしてExcelで読めない」と言われて困りました原因は文字コードがUTF-8の時によく問題になるBOM(バイトオーダーマーク)です バイトオーダーマーク - Wikipedia UTF-8のファイルにはBOMが付いている場合と... 続きを読む
サザエさんのジャンケンの次の手を決定木で予測+可視化してみた - 唯物是真 @Scaled_Wurm
2014-11-23 サザエさんのジャンケンの次の手を決定木で予測+可視化してみた python 機械学習 前に決定木の可視化をしようと思ってやってなかったのでやっておきます決定木のライブラリは例のごとくscikit-learnを使う pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm pythonの機械学習ライブラリscikit-learnの紹... 続きを読む
jqコマンドでJSONをCSVに変換する - 唯物是真 @Scaled_Wurm
2014-10-17 jqコマンドでJSONをCSVに変換する jq 前に以下のニコニコ動画のデータセットの記事でも使いましたが、jqコマンドはJSONを変形したり一部を抽出したりするのにとても便利なコマンドです ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurmマニュアルを見る... 続きを読む
Pythonのcollectionsモジュールが地味に便利 - 唯物是真 @Scaled_Wurm
2014-04-21 Pythonのcollectionsモジュールが地味に便利 python PythonのcollectionsモジュールにはdefaultdictやCounterなどの便利なデータ構造があります。 いくつかメモ代わりに紹介しておきます defaultdict 辞書にキーが含まれない場合のデフォルト値を指定できます。 リストをデフォルトで持つ辞書などが作れます。 default... 続きを読む
進捗ありません - 修士4年間の振り返り - 唯物是真 @Scaled_Wurm
2014-02-25 進捗ありません - 修士4年間の振り返り そういえば修士論文や発表が終わっていたので報告代わりに書いておきます 役に立つ内容だったりポジティブな内容だったりはしないただの記録なので注意 できるだけマイルドな内容にしたつもりです一応書いておくと2010年に大学院に修士として入って、2回修士論文を出せずに留年して、今回に至ります。 私がいた研究室はポジティブな結果が出ないとダメ的... 続きを読む
大量のテキストからランダムに少数の行を抽出したい - Reservoir Sampling - 唯物是真 @Scaled_Wurm
2014-01-11 大量のテキストからランダムに少数の行を抽出したい - Reservoir Sampling 前に以下のような記事を書きましたが、大量のテキストではうまくいかなかったので新たに書きました ファイルからランダムにN行取り出す(shufコマンド) - 唯物是真 @Scaled_Wurm 上の記事ではテキストをランダムに\(k\)行取り出したい時"shuf -n k"コマンドでランダ... 続きを読む
ニコニコ動画のデータセットが公開されたらしい - 唯物是真 @Scaled_Wurm
2013-06-15 ニコニコ動画のデータセットが公開されたらしい 研究用にニコニコ動画のコメント約300GBを公開‐ニコニコインフォ 情報学研究データリポジトリ ニコニコ動画コメント等データ 国立情報学研究所のダウンロードサービスでニコ動のデータセットが公開されていたので、とりあえずダウンロードしてみました ダウンロードの手順 以下のページで、名前、メールアドレス、所属を入力すればよいみたいです... 続きを読む
pythonの機械学習ライブラリscikit-learnの紹介 - 唯物是真 @Scaled_Wurm
2013-05-25 pythonの機械学習ライブラリscikit-learnの紹介 python 機械学習 scikit-learn(sklearn)の日本語の入門記事があんまりないなーと思って書きました。 どちらかっていうとよく使う機能の紹介的な感じです。 英語が読める方は公式のチュートリアルがおすすめです。 scikit-learnとは? scikit-learnはオープンソースの機械学習ラ... 続きを読む
小説家になろうのランキングをトピックモデルで解析(gensim) - 唯物是真 @Scaled_Wurm
2013-04-27 小説家になろうのランキングをトピックモデルで解析(gensim) python 自然言語処理 小説家になろうというWeb小説投稿サイトがあります。 いわゆるライトノベル的な作品が多いのですが、近年書籍化される作品が多く出ていて注目を集めています。 続々と「小説家になろう」から書籍化作品が登場! - フラン☆Skin はてな支店 小説を読もう! || 小説ランキング[累計]の上... 続きを読む