xiangze's sparse blog

機械学習、ベイズ統計、コンピュータビジョンと関連する数学について

論文コーパスの次元圧縮とLDAによるトピックの関係の可視化

機械学習の方法として教師なし学習で得られた量を特徴量として教師あり学習で使うという方法があります。
OnlineNewsPopularityの列の中にもLDAで推定されたトピックがあるようです。文書データもOnlineNewsPopularityと同じようにLDAで得られた量を使って機械的に分類が可能かと思われます。

続きを読む

stanでODEパラメーター推定を試す(その1)

基本的には
http://statmodeling.hatenablog.com/entry/sir-model-ode-1
と同じ内容なのですが、

  1. 時間の間隔を指定しなくてもよいのか
  2. transformed dataとして指定するx_i,x_tは必要か(stanを呼び出したコードからは見えない)

という(個人的な)疑問点に関する解答となっています。

続きを読む

Tokyo.stanの感想

stan開発者の一員であるBetancourtさんを招いたTokyo.stanを聴きにいきました。
Michael Betancourt's Stan Lectureを開催しました - StatModeling Memorandum
自分はstanを余り使いこなせていないのですが、主にアルゴリズムと実装に関する感想を書きます。

続きを読む

最近のpymcの進展(ノンパラベイズ)

pymcはpythonの文法の枠内で統計モデルが書けてMCMCを実行することで推定が出来るライブラリです。
最近開発に色々な進展があったので勉強しています。
https://pymc-devs.github.io/pymc3/

続きを読む

「R言語徹底解説」をいただきました

R言語徹底解説」(原題 Adbanced R)を訳者の方からいただきました。ありがとうございます。
最初15章 DSLまで読もうとしましたが挫折したので3章 データ抽出について書きます。

続きを読む