« 加計学園問題の本質 ② | トップページ | 認識システムの最先端 第4回 ③ »

2017年8月29日 (火)

認知システムの最先端 第4回 ②

続き:
メトロノームがヒント!
 まず、誤差逆伝搬(Back Propagation)法による3階層型ANNを設計して、院生と同じ学習条件で車番位置の検出実験を行った。その結果、やはり95%位の検出率であった。確かに、夜間撮影された画像は、車番輪郭部分が周りの暗さに溶け込んで見えないものもあるが、人の視察では100%視認できる。何が原因?CMUにあるいくつかの駐車場に出向いては車番をしげしげと眺めていた。昼と夜の違いは何なのか。距離によって車番の大きさや向きはどの程度の偏差でカメラに捉えられるのか、車番(プレート)の色の割合や輝度分布などの統計データなど思い付くものはすべて整理したが、決定的な解決策に至らなかった。あるとき、「人は車を見た時、車番がどこについているかをどれぐらいの時間で認知できるのか?」と気になり、急ぎ駐車場に行って実験した。車の正面に対して反対向きに立ち、後ろの車を見るための首の振り(後ろを向いた瞬間、首はまた反対に戻す)速度を徐々に速くしていき、どの時点で消失するかを何度も試した。驚くことに相当速く首を振っても車番の文字は読み取れないが、車番がどの辺りについているかは、おぼろげながら覚えていることに気付いた。早速研究室に戻り、これまで実験に用いていた画像の解像度をさらに縦、横それぞれ1/6まで落としてモザイク状態にした画像で実験した結果、97%まで向上した。
 それから、1週間、新しいアイデアもなく、もんもんとしていた。ANNの内部的な動作をもう少し細かく観察しようと思い、中間層の神経の動作を画面いっぱいに表示して、パンとスープの昼食をとりながらその動きを見ていたそのときである。ほとんどの神経は、ランダムに動作しているのに2つの神経だけがメトロノームのように動作していることに気付いた。一つはゆっくりの周期、もう一方は速い周期である。二つの周期を何度も計測して平均値を算出した。何の時間だろう?プログラムの各ループの時間を計測して、その原因が判明した。当時、市販されているANN関係の書籍には、何度も同じデータを繰り返し学習することにより、だんだんとANNが賢くなることを書いていたが、それが盲点であった。周期の速い方は、同じデータを連続して学習させる時間で、ゆっくりの周期は、学習用車番画像のループ時間であった。つまり、ANNは事前に学習する順番と同じ画像の連続学習回数を知っていたわけである。これは性能を低下させる原因であり、車番画像の学習順番、一つの画像の連続学習回数にもランダマイズを加えた。実は、学習画像の車番の位置・大きさ・傾きにランダマイズをかけることで性能が良くなることは、以前より知っていた。ANNの学習時、ランダマイズを加えると学習誤差が発散して収束できないことがある。その場合、神経の応答を鈍くすることにより、振動しながらも単調減少関数となり、優秀なANNが設計できる。上記条件で設計したANNで評価実験した結果、いきなり100%の検出率が得られた。




« 加計学園問題の本質 ② | トップページ | 認識システムの最先端 第4回 ③ »

日記・コラム・つぶやき」カテゴリの記事

トラックバック


この記事へのトラックバック一覧です: 認知システムの最先端 第4回 ②:

« 加計学園問題の本質 ② | トップページ | 認識システムの最先端 第4回 ③ »