xiangze's sparse blog

機械学習、ベイズ統計、コンピュータビジョンと関連する数学について

NLP

Pystanで自然言語処理 scikit.learnのdatasetで試す

scikit.learnは様々な機械学習のアルゴリズムのみならず、データセットも充実しています。stanのpythonラッパーpystanでこれを利用し、Stan manualのLDAのコードの性能を評価することを行いました。 20 newsgroupsというデータセットは名前の通りUsenetの20…

CVPRの論文タイトルの頻出単語と可視化

NLP cv R

コンピュータビジョン分野の査読つき国際会議であるCVPR(Conference on Computer Vision and Pattern Recognition)の論文題名を http://www.cvpapers.com/ から取得し、その変遷をRのtmモジュールを使い分析、可視化してみました。 CVPR2007からCVPR2013まで…