xiangze's sparse blog

機械学習、ベイズ統計、コンピュータビジョンと関連する数学について

C89であった統計関係の薄い本

コミックマーケット89で見つけた統計関係の同人誌を紹介します。

声優統計

第7号では5つの論文がありました。

このうち「結婚したら声優は仕事が減るのか? 〜種田梨沙が結婚したら僕はもう…〜

ではInterrupted time series analysis(ITSA)という手法を使って声優は結婚前後で仕事の数に変化はあるのかという問題をrstanを用いてベイズ的に推定しています(コードなど)。仕事の数をPoisson分布を用いてモデル化しています。Stanでは時系列データに対して結婚のようなイベントの他に周期的な変動や高次の自己回帰(Auto Regressive)モデルなど色々な効果の度合いを推定することが出来て自由度が高いです*1
しかし残念ながらRhatを見るとモデルが収束しなかったようです。

限界効用逓減と代替財を考慮した声優イベント参加モデル

では経済学で出てくるようなモデルを使って好みの声優の変化を代替財としての観点からのモデル化、類似性の可視化を試みています*2。Eventernoteの情報を使うとイベントに参加している個々のイベント参加者の情報が使えるためこのような遷移、財としての声優の類似性をモデル化出来るそうです。ECの会社などにいないと扱えないような興味深い反面少し怖いところも有ります。5-fold Cross Validationでモデルの評価を行っていますがあまり精度は良くないそうです。付記では既存の代替財に関する研究に関する差異として予測を試みた点が強調されていて興味深かったです。

黒沢ともよさんの音楽嗜好推定

では接近戦という概念を知りました。話題を合わせる為には相手の嗜好を推測することが重要です。リアルタイム性とジャンルの特性からWikipediaのデータを用いたそうです。

最後の「投稿&査読ガイド」では

統計に強い人と声優に強い人のディスコミニュケーションを回避する為に査読を行うことが書かれていますが、一方でAcceptance 100%を目指すことも表明されています。統計的、論理的正しさも重要ですが、事実に関する確認をするのは大変そうです*3

声優統計1-4合冊は岩波データサイエンス vol. 1よりも厚いのに衝撃を受けました。

R Maniax Advance

(amazonでも買えます)
著者の書いた他の同人誌や他の書籍で使われた分析の手法をRで行うというテーマで書かれています。
R,Rstudioのインストール方法、plot,heatmap,ggplot2の基本的な使い方があり、その後実験計画法、lvaanパッケージ (tutorial)を用いた共分散構造分析が紹介されています。
実験計画法の応用として艦これのレシピ(資源配分)をconjointパッケージを用いて評価しています。
資源は数量的なデータですが、conjointの入力してはいくつかの固定した数を水準としてその組み合わせ(レシピ)に対して複数回試行した結果を水準、レシピとともに渡しています。
lvaanパッケージのsemパッケージとの違いとして構造方程式のモデルの書き方の違い(semでは各外生変数への内生変数の寄与を別の行として各必要が有るのに対し、lvaanでは1行で良い)と他のパッケージを使わずにモデルのグラフを表示することが出来るところが有るそうです*4
ゲームの統計に関する同人誌の情報も豊富で以前このブログで少し取り上げた
東方コミュニティ白書
なども紹介されています。
Rだけでなくテキストマイニング、可視化でよく使われるツールであるKHcoderとpython、特にipythonの解説もあります(jupyterはないです)。KHcoderでネットワークとして可視化が出来るそうです。J-popの歌詞に出てくる語句の分析などを行っています。

3日目

機械学習、画像認識、その他プログラミング一般に関する同人誌が多かったようです。
http://kivantium.hateblo.jp/entry/2016/01/01/004915

*1:Stanではイベントが起こった時点を推測するようなモデルも書くことが出来ます http://abrahamcow.hatenablog.com/entry/2015/10/29/005418

*2:ここでは代替度Wは非対称なものとして、紅葉関数は対数的に減衰するものとして定義されています

*3:声優のブレイクの定義とその判定が興味深かったです

*4:Rで構造方程式モデリング(SEM)ができるパッケージはたくさん有るそうですhttp://pairach.com/2011/08/13/r-packages-for-structural-equation-model/