MeCab+GensimでWord2Vecモデルを学習する
概要 テキスト文章をMeCabで形態素解析し、gensimでword2vecのモデルにする方法を整理しました。 必要なライブラリのインストール 1. gensim gensimはpipで簡単にインスト… Read more »
概要 テキスト文章をMeCabで形態素解析し、gensimでword2vecのモデルにする方法を整理しました。 必要なライブラリのインストール 1. gensim gensimはpipで簡単にインスト… Read more »
概要 最近流行りのニューラルネットワーク(ディープラーニング)ですが、モデルがブラックボックスであり、どのようなモデルとなっているのか分からないのが1つのネックです。とりあえず、どのように学習されてい… Read more »
概要 Jupyter Notebookを使うと、Markdownやprint機能を使って、Python等で書いたブログラムを非常に分かりやすい形で残すことができます。ただ、このデータをWordPres… Read more »
はじめに 番外編2では、loto6のデータをPandasを使ってより分析に適した形状に整理した手順をご紹介します。 手順は以下になります。 当選数字のベクトル表現 キャリーオーバー額の1行ずらし 販売… Read more »
はじめに 本記事では、loto6の販売実績額のデータをBeautifulSoupを用いたウェブスクレイピングにより取得する手順を整理していきます。 手順は以下になります。 requestsライブラリを… Read more »
概要 Windows(10)とLinux(Ubuntu16.04)を相互にリモートデスクトップ接続(RDP接続)できるように設定できたので整理しました。 UbuntuからWindows 「rdeskt… Read more »
はじめに その2では、「loto6に当たりやすい目はあるのか?」について以下の手順で分析・解析していきます。 今までに出た目は偏りがあるか? 偏りは統計的に妥当か? データの入手方法や環境の設定方法に… Read more »
概要 日本語の形態要素解析に使うMeCabのインストール方法、及びPythonから呼び出して使う方法をまとめました。Ubuntuでも大変でしたが、Windowsは半日近くかかりもっと大変でした(覚悟し… Read more »
概要 Pythonモジュールのpandasには、その直下に181個という大量のメソッドがあります。さらにそれぞれのメソッドの下や、DataFrameオブジェクトもメソッドを持っており総数は非常に膨大な… Read more »
概要 マルコフチェーン(markov chain)を、PythonのPydotplus(又はPydot)からGraphvizを使って簡単に作るモジュール(markovViz)を作成しました。以下イメー… Read more »