タグ レコード数
人気順 10 users 50 users 100 users 500 users 1000 usersブートストラッピング法による情報抽出の論文まとめ - ヤドカリラボ
はじめに 自然言語処理におけるタスクの一つとして、構造化されていないテキストから情報や知識を自動または半自動で取り出すことを情報抽出といいます。 最近では深層学習系の論文が国際学会ではメジャーですが、訓練・ベンチマークに用いているデータセットのレコード数が膨大であり、また高価なGPU環境が言語モデルの... 続きを読む
BigQueryの課金について考えた(前編) - Qiita
安すぎて今までその考えはなかったわwww さて、BigQueryの課金について。 今まで1テーブルあたりのデータ量も数十GBレベル、レコード数も億に届くかどうかぐらいのデータなんでクソクエリ回したところで1回1円未満とかそんなだったので、あんまり気にしなかった。(まぁ、使い始めた頃は5倍ぐらいの値段だったので気にするレベルだったのですが) あと、GoogleAnalyticsPremiumも入って... 続きを読む
Djangoでメモリに乗らないサイズのDBを扱うときに気をつける点 - orangain flavor
2013-10-02 Djangoでメモリに乗らないサイズのDBを扱うときに気をつける点 django はじめに Djangoでメモリに乗らないサイズのデータベースを扱うときに、気をつけるべきポイントをまとめます。メモリを大量に消費していつまで経っても処理が終わらなかったり、OOM Killerに殺されたりといった悲しい結末を回避できたら幸いです。 データ量としては、レコード数が数十万から数百万... 続きを読む