SHAPの全メソッドを試してみた
概要 予測に影響した特徴量の重要度を可視化できるライブラリとしてSHAPが存在感を増しています。SHAPは SHapley Additive exPlanations を指しており、 Wikipedi… Read more »
概要 予測に影響した特徴量の重要度を可視化できるライブラリとしてSHAPが存在感を増しています。SHAPは SHapley Additive exPlanations を指しており、 Wikipedi… Read more »
概要 PandasにはDataFrameが持つplotの他にpandas.plottingというメソッド群を持っており、これを使うことで通常のplotメソッドとは一風異なったグラフを作成することができ… Read more »
概要 カテゴリカル変数と連続変数の関係の分析に特に有効で、Excelでもよく使うピボットテーブルの機能ですが、Pythonのpandasでもpivot_tableというメソッドを使うことが出来ます。本… Read more »
概要 Pythonで並列計算を実施したい時、joblibは最も手軽なライブラリの1つです。本記事では、このjoblibを使った並列計算の実施方法とそのパラメータの効果を整理しました。なお、joblib… Read more »
概要 Pythonモジュールのpandasには、その直下に181個という大量のメソッドがあります。さらにそれぞれのメソッドの下や、DataFrameオブジェクトもメソッドを持っており総数は非常に膨大な… Read more »
概要 Pythonにはseabornという多機能で綺麗なグラフを描くライブラリがあります。このseabornの全メソッドの効果を検証したのが今回の記事です。サンプルデータとしてirisとtitanic… Read more »
概要 Pythonで機械学習をするときに使うscikit-learn(恐らく、サイキットラーンと呼びます)には前処理用のライブラリであるpreprocessingが組み込まれています。前処理とは、デー… Read more »
概要 Pythonでグラフを描くお供であるmatplotlib.pyplotのplotメソッドについて、全引数の効果を検証しました。データはirisを使っています。 どんな引数があるのか? matpl… Read more »
概要 Pythonモジュールのpandasにはplot関数があり、これを使えばpandasで読み込んだデータフレームを簡単に可視化することができます。ただし、大量の引数(34個)があるにもかかわらず、… Read more »
概要 Pythonモジュールのpandasには、read_csv(又はread_excel等)という、csvやexcelのデータを分析に適した形で読み込む強力な関数があります。ただし、本関数には沢山の… Read more »