
入れ子のDictionaryをPandasのMultiIndex型に変換する
概要 TwitterAPIで取得したツイートのデータなど、データ構造がjsonで定義されているデータを分析したいときには、pandasで入力(json→入れ子のDictionary型)をMultiIn… Read more »
概要 TwitterAPIで取得したツイートのデータなど、データ構造がjsonで定義されているデータを分析したいときには、pandasで入力(json→入れ子のDictionary型)をMultiIn… Read more »
概要 PandasのDataFrameを使ってデータを処理すると、maxやminといったメソッドを用いて簡単に各カラムの最大値や最小値を得ることが出来ます。しかしながら、現時点(pandas ver … Read more »
概要 pandasのdataframeは有用ですが、データ量が多くなっていると計算速度に不満を感じるようになってきます。調べると、GPUでpandasライクにdataframeを取り扱えるcuDFがあ… Read more »
概要 pythonでデータ分析をする際にはpandasのDataframe型が有効ですが、扱うデータが複雑になってくると、indexとcolumnsの2次元だけでは足りず、3次元、4次元のデータを扱う… Read more »
概要 PandasにはDataFrameが持つplotの他にpandas.plottingというメソッド群を持っており、これを使うことで通常のplotメソッドとは一風異なったグラフを作成することができ… Read more »
概要 カテゴリカル変数と連続変数の関係の分析に特に有効で、Excelでもよく使うピボットテーブルの機能ですが、Pythonのpandasでもpivot_tableというメソッドを使うことが出来ます。本… Read more »
はじめに その3では、「loto6で期待値の高い数値の選び方はあるのか?」について以下の手順で分析・解析していきます。 期待値の定義と算出 期待値を最大化する数字の選び方 なお、本記事ではその2の内容… Read more »
概要 データ分析を実施するとき、PythonのPandasを使って分析を行う、という人は多いと思います。分析をするときには、生データに含まれる不純なデータを使える形にしたり、アウトプットの体裁を整えた… Read more »
概要 pandasのデータフレームを使っていると、別カラムで与えたカテゴリ情報(目的変数やhueと呼ぶほうがしっくりくるかもしれません)ごとに色分けしたヒストグラムを眺めたいシーンがあります。ただし、… Read more »
概要 過去記事でPandasのデータフレームを→Sklearnのデータセットに変換する関数(pan2sk)を作っていたので、反対側のSklearnのデータセットをPandasのデータフレームに変換する… Read more »