タグ データフレーム
人気順 10 users 50 users 100 users 500 users 1000 usersRubyのPolarsでデータサイエンティスト協会の100本ノックやってみた — 1 ~ 15問
記事の趣旨 本記事では、Rust製の高速データフレームであるPolarsのRuby版を利用して、データサイエンティスト協会の提供する「データサイエンス100本ノック(構造化データ加工編)」をやってみることを目的にしています。 Polarsについては、下記の公式サイトを参照してください。 Ruby版のPolarsは、polars-dfというge... 続きを読む
データ解析用ライブラリ - Qiita
はじめに 皆さん、データ解析やデータ処理にどのライブラリを使用していますか? 恐らく、ほとんどの人がpandasを使用していると思います。 今回は、その他のデータ解析用ライブラリやデータ処理ライブラリについて紹介したいと思います(/・ω・)/ Pandas 言わずと知れたデータ解析用ライブラリですね。 データフレームと... 続きを読む
Rust製高速データフレームライブラリ、Polarsを試す | gihyo.jp
門脇@satoru_kadowakiです。今月のPython Monthly Topicsでは、Rust製の高速データフレームライブラリ Polars について紹介します。 Polarsとは Pythonでデータ分析に使用される主なライブラリに pandas があります。Polarsはpandasと同様にデータフレームというデータ構造オブジェクトを提供するサードパーティライブラ... 続きを読む
速いと噂のPythonのVaexについて詳しく調べてみた。 - Qiita
結構前にPandasやDaskなどよりも大分高速と話題になっていたPythonのVaexライブラリについて、仕事で利用していきそうな気配がしているので事前にしっかり把握しておくため、色々調べてみました。 どんなライブラリなのか Pandasと同じように行列のデータフレームなどを扱うことのできるPythonライブラリです。 Pandasと... 続きを読む
Pythonで因果推論したい(CausalImpact) - あれもPython,これもPython
タイトルの通り、CausalImpactをPythonで試してみます。 下記本を元にし、RからPythonで書き直し、同様の効果が推定できるか試してみます。 導入 pyが最初につくのに注意します。 pip install pycausalimpact データの作成 statsmodelsのcigarデータを使います。 CausalImpactはデータフレームの一番左をyとし、それ以降... 続きを読む
seabornの細かい見た目調整をあきらめない - Qiita
はじめに seabornの洗練されたスタイルで作ったグラフはとてもきれいです。見た目だけでなく、列の多いデータの全体像を把握するのにも威力を発揮します1。特に適切に整形されたデータフレームを渡せばカテゴリの比較や全パラメータの相関を一瞥できる図が一瞬で作れる機能は、同等の図をmatplotlibで一から作る苦労を考... 続きを読む
データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - まだ厨二病
2017 - 08 - 09 データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 precis data exploration 探索的なデータ分析 (Explore Data Analysis: EDA )を行う際は、データの要約や欠損の有無の確認、可視化が欠かせない作業となります。 特に可視化は、データのもつ性質や関係を表現するのに大変役立ちます。一方で、可視化に用いた図はコードと... 続きを読む
[R] jqコマンドをRから呼び出し、JSONをデータフレームに格納する | Developers.IO
はじめに 外部のコマンドから呼び出したJSON形式の結果をデータフレーム形式に変換しておくと後々の処理に便利そうだと思い、今回は お天気WebサービスのJSONからjqコマンド経由でデータフレームまで格納するまでをやってみました。 jqコマンドでCSVに適した出力に加工 下記のコマンドを叩けば $ curl -s http://weather.livedoor.com/forecast/webse... 続きを読む
dplyrを使いこなす!基礎編 - Qiita
はじめに 4月ということで、新卒が入ってきたりRを使ったことないメンバーがJOINしたりしたので、 超便利なdplyrの使い方を何回かに分けてまとめて行きます。 Rは知らないけど、SQLとか他のプログラミング言語はある程度やったことあるみたいな人向けです。 dplyrとは データフレームの操作に特化したパッケージです。 Rは基本的に処理速度はあまり早くないですが、dplyrはC++で書かれているの... 続きを読む