論文コーパスの次元圧縮とLDAによるトピックの関係の可視化
機械学習の方法として教師なし学習で得られた量を特徴量として教師あり学習で使うという方法があります。
OnlineNewsPopularityの列の中にもLDAで推定されたトピックがあるようです。文書データもOnlineNewsPopularityと同じようにLDAで得られた量を使って機械的に分類が可能かと思われます。
KerasとskoptでのBayesian Optimization
使ったアルゴリズム(random forest, neural net, Bayesian Optimization)とデータ(OnlineNewsPopularity)はTJOさんのブログ記事
と全く同じでPythonのライブラリscikit-learnのrandom forestとKeras, bayesianを使っているところが異なります。
stanでODEパラメーター推定を試す(その1)
基本的には
http://statmodeling.hatenablog.com/entry/sir-model-ode-1
と同じ内容なのですが、
- 時間の間隔を指定しなくてもよいのか
- transformed dataとして指定するx_i,x_tは必要か(stanを呼び出したコードからは見えない)
という(個人的な)疑問点に関する解答となっています。
続きを読むCVPR2016のひとり論文読み会
CVPR2016の論文読み会が大盛況で参加出来そうになかったので個人的に読んだ複数の論文を紹介します。
続きを読むTokyo.stanの感想
stan開発者の一員であるBetancourtさんを招いたTokyo.stanを聴きにいきました。
Michael Betancourt's Stan Lectureを開催しました - StatModeling Memorandum
自分はstanを余り使いこなせていないのですが、主にアルゴリズムと実装に関する感想を書きます。
最近のpymcの進展(ノンパラベイズ)
pymcはpythonの文法の枠内で統計モデルが書けてMCMCを実行することで推定が出来るライブラリです。
最近開発に色々な進展があったので勉強しています。
https://pymc-devs.github.io/pymc3/