統計処理
はじめに 手書き数字認識をタスクとして隠れマルコフモデル(HMM)の動作確認を行います。手書き数字認識は文字認識の中では単純な識別問題なのですが、タスクの困難性が想像しやすくサンプルデータが用意しやすい利点があります。 隠れマルコフモデル 隠れマ…
隠れマルコフモデルによる手書き数字認識を実装する前に、手書き数字データを収集するアプリケーションを作成します。 いきなり余談ですが、手書き文字は採取時のデータの性質によってオンライン手書き文字とオフライン手書き文字に分けることが出来ます。 …
前回実装したスケーリング処理を用いた離散隠れマルコフモデルは、EMアルゴリズムによって最適化パラメータを算出した際に、即時にHMMのパラメータを更新する為、複数の学習データを用いて学習することが出来ませんでした。emoson.hateblo.jpそこで今回は、…
前回実装した離散隠れマルコフモデルは、フォワード、バックワードアルゴリズムの確率計算を行う際に、長い時系列を適用するとアンダーフローが発生する問題がありました。emoson.hateblo.jpスケーリング処理はトレリス計算中に逐次スケーリング処理を施し、…
旋回作成した行列計算用のクラスを用いて多次元正規分布を求めるクラスを作成します。emoson.hateblo.jp多次元正規分布については以下の記事で触れました。emoson.hateblo.jp
この記事に書かれていること numpyによる多次元正規分布の実装 多次元正規分布とは 一般的によく知られている正規分布を多次元に拡張したものです。 正規分布自体の解説はWikipediaにまかせてしまいます 正規分布 - Wikipedia
相関係数とはなにか 多変量の変数の関係性を示す指標の一つに共分散がありました。相関係数は共分散の弱点を補ったものです。今回はこの相関係数を求めるプログラムをPythonで記述してみます。
共分散とはなにか 共分散とは二組の対応するデータ同士の関係を表す統計的指標の一つです。