2014年4月8日火曜日

Fast Color-Based Object Recognition Independent Of Position and Orientation from Giessen and Schmidhuber セクション4以降 論文翻訳修行

Fast Color-Based Object Recognition Independent Of Position and Orientation from Giessen and Schmidhuber の翻訳後編。

論文の信頼性を確認する方法を教わった。

まず、査読されているか(査読が必要なジャーナルに投稿されたかどうか)。
また、簡単に通らない査読かどうか(信頼のおけるジャーナルかどうか)を確認する。

今回翻訳した論部は、SpringerのLNCSというシリーズのもの。

信頼のおける論文であれば、Abstructを読んで、Introduction、Conclusion、Figure の順で確認し、必要な論文か確かめる。

それでは、後半の実験結果についての翻訳。

この過程で、画像認識でよく使われる実験サンプルを手に入れた。

4. Experimental Results 実験結果


4.1 ZuBuD Building Database(Zurich Building Image Database)

http://www.vision.ee.ethz.ch/showroom/zubud/index.en.html

私たちは、特別な簡素化処理を行わない、320×240にリサンプリングした実世界の画像で
構成されたデータベースを使って、認識精度とスピードをテストしました。
私たちははじめ、ZuBuDデータベースを使いました。チューリッヒにある201のビルの
1005枚の写真を含んでいます。外から様々な気象条件の下で撮影されたものです。
DBは115枚のクエリ画像(画質の低いjpegで、320×240ピクセルにリサンプリングしています)
全てのクエリ画像で、私たちのアルゴリズムでマッチした 5 位までをリストしました。
画質の低いクエリ画像にも関わらず、82画像で正解し、29画像で5位に入り、4画像で
5位に入らなかった。
クエリ画像内の色情報は、クエリ画像とDB画像から同じ建物の画像をとってきて並べた図2を
見て明確にみられるように、非常に低品質です。
この信頼できる色情報の欠如は、正しい認識を妨げます。
図3の最初の行にあるクエリ画像は、私たちのアルゴリズムが例えば木のような障害物に
鈍感であることがわかります。
我々は、(小型モバイルロボットで簡単に動く)高品質の画像上でのパフォーマンスを
テストするために、201オブジェクトのそれぞれ4つの画像を使って新しいDBを構築しました。
私たちは、クエリ画像としてすべてのオブジェクトの5番目の画像を使用しました。

改善された画質は大きな認識率向上につながりました。
201のうち、正解:183、13個が5位に含まれる、5個が5位以内に入りませんでした。
図3の2行目は私たちのアルゴリズムの位置や方向に依存していないことがわかります。

5つの失敗と5位までのいくつかの完全でない結果の理由は、2つあると考えられます。
一つ目の理由は、DBとQeuryもしくはどちらか一方が主に保持する領域の彩度が非常に低いです。
二つ目の理由は、クエリ画像のいくつかは、オブジェクトのごく一部だけしか含まないことです。
図3の最後の行は、彩度がとても低いために失敗した1例です。
適応型リカレントニューラルネットワークのSVSを搭載した学習ロボットの場合、これらのミスは
大きな問題を提起しません。


4.2 Coil-100 Object Database

私たちの方法は、ZuBuDデータベースでを専門にしていません。
広く適用適用可能なように設計されています。
私たちはほとんどのパラメータをチューニングしていません。ただ一つ、3.1 の閾値を
物体認識処理を高速化するために可能な限り小さく選択しなければなりません。
メソッドの一般性を示すために、100個の物体をさまざまな角度から撮影したCoil-100データベースに
適応しました。
私たちは、0度, 100度, 215度, 270度, 325度 のアングルで撮影した画像をデータベースに配置し、
25度のアングルの画像をクエリとして使いました。
84個物体認識出来、12個が5位までに入りました。4つが5位圏外でした。
認識に失敗した画像は、様々なグレーを主に含み、少ない色情報は破棄されました。

4.3 パフォーマンス速度

私たちはPentium 4 (2.8GHz) 計算機で結果をまとめました。
2つの時間のかかる認識プロセスは、領域抽出と、データベースからの類似領域の探索である。
後者は、SVSでは情報を圧縮するので、必須ではありません。
前者の速度は、画像の複雑さに依存しますが、ZuBuDデータベースにあるような複雑な
画像で0.19秒以内に処理しました。データベース検索速度は、データベース内の領域の
数とクエリ画像内の領域の数に線形に依存します。
2番目のデータベースは93682の領域が含まれています。
ZuBuDデータベースの1枚の画像から、平均して177の領域を抽出しました。
平均して0.7秒で、クエリ画像からの領域抽出を含んでいます。
シンプルな物体はプロセスをスピードアップします。
Coil-100データベースでは、クエリ画像の処理も含めて 0.18秒でした。


5. Conclusions 結論

私たちは、シンプルで早くて、信頼できる画像符号化と認識のためのアルゴリズムを提案しました。
シンプルな色ベース領域抽出と加重投票によるオブジェクトマッチングです。

前者はHSV色領域でワークし、信頼できない色情報の領域を除外し、信頼できるもののみ保持し、
位置と方向に独立して、物体をエンコードします。
画像の類似度はクエリ画像とDB画像の領域間の類似度に依存する票(データベースの画像ごとに
類似した領域とその数が異なることを補いました)で測定されます。
ZuBuDとCil-100のデータベースで、私たちは十分な認識率と速度を得ました。

なお、しかしながら、これは非常に予備・暫定的で、文献中の以前の提案と私たちの
アルゴリズムを比較するためより深い勉強が必要である。

Acknowledgements 謝辞

私たちは、Hao Shao から提供された色ベースの画像認識アルゴリズムのコードに感謝します。
http://groups.inf.ed.ac.uk/calvin/Publications/shao-icip03.pdf ←元の論文
http://www.cs.gmu.edu/~kosecka/Publications/ZhangKoseckaCVPR05.pdf ←同様の研究論文



0 件のコメント:

コメントを投稿