開発環境構築
Pythonについて
「Python」はプログラミング言語の一種で、コードがCやVBA等と比較して非常に書きやすい&読みやすい&タダで使える、という特徴があります。
元々データ分析といえばRを使うのが基本でしたが、この特徴のためか、Rの様々な機能がPythonに移植され、最近ではchainerやtensorFlowといったツールがPythonで構築されるなど、その領域をだいぶ侵食しつつあるようです。そんな背景もあり、このブログでも、Pythonを使って話を進めていきます。
ダウンロード・インストール方法
Python自体は公式のページ(Welcome to Python.org)からダウンロードできます。バージョンには2系統と3系統があり、混用されている(各種ライブラリが一部3系統に対応していない)ようですが、このブログではとりあえずいろいろと便利になっていると噂の3系統を使っていきます。
なお、機械学習のことまで考えると、Numpy、sklearn等の必須ライブラリや後述する開発環境を一括でインストールしてくれる、Anaconda(Anaconda Scientific Python Distribution)をインストールすることを強くお勧めします。インストールは上記サイトからインストーラーをダウンロード後、ダブルクリックで進めていけば簡単にできます。
統合開発環境
統合開発環境(IDE)としてはAnacondaでインストールされるspyderが便利です。画面がMatlabライクで使いやすく、コードの自動色分けやエラー箇所の表示の他、デバッグ機能等も搭載されています。
Pythonの勉強方法
構文やデータの型の考え方、2系と3系の違いなど、Webを探せば大抵のことはわかりますが、基本をしっかり抑えたければ、ある程度書籍を入手して勉強されることをお勧めします。ちなみに、私は以下の本を使ってpythonの勉強をしましたので、よかったら参考にしてみてください。(