今回の実験ではトレーニング動画を27216個,テスト動画を13609個で実験を行いました.
現在の結果を載せます.上の2つ(RGBとFLOW)は本研究の個人行動認識の手法であり,下の2つは関連研究の手法における個人行動認識の手法です. 動きが特徴的である「setting」,「falling」, 「spiking」,「blocking」は良い認識率を得られましたが,行動に違いがあまり 見られにくい「waiting」,「digging」,「moving」はあまり良い認識率は得られませんでした.「standing」は今回のデータセットの 約75%を占めているので,学習データが多い分認識しやすい結果となりました.
今回の実験ではトレーニング画像を1442個,テスト画像を357個で実験を行いました.
上の図がグルーピングの結果を示した画像です.上側の行が推定結果で,下側の行が正解画像となっております.このグルーピングはどれだけ 推定結果のヒートマップにおいて点火している領域が,下側の正解のヒートマップにおいて点火している領域と重なっているかで評価します. これを定量評価したものが IoUで示されています. 上側の画像では「spike」,「winpoint」,「set」が比較的IoUが高く,「pass」がIoUが低い結果となっています.
また,全テスト結果によるそれぞれのクラスごとのIoUの平均であるmIoUを調べたところ「spike」が24.2%,「winpoint」が46.6%, 「set」が48.2%,「pass」が10.5%となりました.この数値の基準としては物体検出においてIoUが50%を超えると正しく検出できていると 判断しているため同じように50%ほどになればよい結果と考えてください.上の結果においてパスが著しく悪い理由として,パスの動作は 他の動作である「waiting」や「moving」に似ているため個人行動認識においてもグルーピングにおいても学習が難しかったからです.