Python3でscikit-learnの決定木を日本語フォントで画像出力する方法のまとめ

概要 Pythonにはscikit-learnという便利な機械学習モジュールがありますが、これを使って決定木学習を実施した際、当然実行したい決定木モデルの画像出力がとても難しく、サンプルコード通りにやってもほとんどの場合でエラーが連発してしまい、決定木が描けないという問題に直面します。日本語を出力しようとするとさらに大変です。 ここを克服しないとなかなか本格的にPythonを使った決定木分析ができないため、なんとか動くところまでもっていき、対策を整理しました。参考までに環境はWindows10、64bit、Python3、scikit-learn0.17、graphviz2.38です。 手順・エラー・対策 手順1:まずサンプルコードを動かしてみる ソースコード scikit-learnの決定木の説明ページを見ると、決定木の画像出力のサンプルコードが書いてあり、簡単に言うと以下のようなコードで出力できると書かれています。 エラー 実行すると以下のようなエラーコードが出ました。 「pydotにはgraph_from_dot_dataなんてないよ」と言われています。調べると、python3の場合、pydotplusを導入しなければならないと書いてあります。python2を使っている場合は不要なのかもしれませんが、早速のジャブです。 対策 Anaconda...
2016年8月16日0 DownloadsDownload