確率に関する初歩的な知識(和、積の法則、密度関数、ベイズの定理など)、簡単なRの使い方を前提としているので完全に初心者向けとは言えないのですが、stanのインストール方法や文法など初心者向けの内容から情報量基準の特性やそれとのつきあい方、自動変分ベイズ(ADVI)とその特性のような高度な内容、そしてベイズ統計モデリングの手順と実例が分かりやすく書かれています。

2016-10-03

stanによるニューケインジアン・フィリップス曲線の推定

stan 時系列

経済学においては失業率とインフレ率をプロットすると負の相関関係が見られるというのが知られていてフィリップス曲線と呼ばれるそうです。
f:id:xiangze:20161002235530p:plain
https://gist.github.com/xiangze/b2a29f5f4ffb2be835b2#file-data_for_phillips-ipynb
その関係は10年程度の長期間では変化していき、原因として国ごとに様々な原因が考察されています。
各時点に対して失業率-インフレ率のプロットをして関係を見るのですが、各時点での値は独立ではなく、確率過程としてモデル化できると考えられます。実際ニューケインジアン・フィリップス曲線(NKPC)というモデル提唱されています。
実際のデータがどの程度当てはまるかを論文賃金版ニューケインジアン・フィリップス曲線に関する実証分析に沿ってstanで計算してみました。

2016-09-13

論文コーパスの次元圧縮とLDAによるトピックの関係の可視化

機械学習 python

機械学習の方法として教師なし学習で得られた量を特徴量として教師あり学習で使うという方法があります。
OnlineNewsPopularityの列の中にもLDAで推定されたトピックがあるようです。文書データもOnlineNewsPopularityと同じようにLDAで得られた量を使って機械的に分類が可能かと思われます。

2016-09-12

KerasとskoptでのBayesian Optimization

機械学習 python

使ったアルゴリズム(random forest, neural net, Bayesian Optimization)とデータ(OnlineNewsPopularity)はTJOさんのブログ記事
と全く同じでPythonのライブラリscikit-learnのrandom forestとKeras, bayesianを使っているところが異なります。

2016-08-19

stanでODEパラメーター推定を試す（その1)

stan

基本的には
http://statmodeling.hatenablog.com/entry/sir-model-ode-1
と同じ内容なのですが、

時間の間隔を指定しなくてもよいのか
transformed dataとして指定するx_i,x_tは必要か(stanを呼び出したコードからは見えない)

という(個人的な)疑問点に関する解答となっています。

xiangze's sparse blog

機械学習、ベイズ統計、コンピュータビジョンと関連する数学について

Exhaustive Hamilton Monte Carloの紹介

Recurrent Switching Linear Dynamical Systemsのstanでの再現

stanとRでベイズ統計モデリングをいただきました。

stanによるニューケインジアン・フィリップス曲線の推定

論文コーパスの次元圧縮とLDAによるトピックの関係の可視化

KerasとskoptでのBayesian Optimization

stanでODEパラメーター推定を試す（その1)