近年、機械自体が学習機能を有する人工知能(AI: artificial intelligence)の研究開発が盛んとなってきています。
リコーは、機械学習(machine learning)を応用し、少ないサンプル画像でも高い精度で対象物の異常を検出する技術を開発しました。産業分野への応用が期待されます。
当技術を用いたプログラムは、製品の欠陥の検出精度を競う「外観検査アルゴリズムコンテスト」にて、2014年度、2015年度の2年連続で優秀賞を受賞しました。
工場では、製造した部品や製品が良品か欠陥品かを、画像を用いた外観検査により自動で調べたいというニーズがあります。
一般的に、製造される物は欠陥品と比べて良品が多いため、欠陥とされるサンプルを大量に準備するのは困難です。また、欠陥の種類が多数ある場合には、すべての欠陥の種類をカバーした多様なサンプルを準備することが、さらに難しくなります。
リコーでは、機械学習の方法として「半教師ありの異常検知」を用いるとともに、サンプル数が少なくても学習が行えるよう、機械学習で用いる特徴量に工夫を行いました。この「半教師ありの異常検知」を利用したアルゴリズムでは良品データのみを学習するため、未知の欠陥種類に関しても識別性能を確保できると考えられます。
図1 検出結果の例
(画像提供元:外観検査アルゴリズムコンテスト2014)
図2 検出結果の例2
(画像提供元:外観検査アルゴリズムコンテスト2015)
図1、図2は、このアルゴリズムを使用した場合の検出結果の例です。赤枠が人間が設定した正解の欠陥検出領域、緑枠が本アルゴリズムで検出した欠陥検出領域となっています。本アルゴリズムにより、正解の欠陥検出領域に近い検出ができていることが分かります。
画像認識・解析で用いる手法のひとつに、「機械学習」(machine learning)があります。機械学習では、ある入力に対して、コンピュータが学習を行い、有用な出力を予測します。事前のステップとして、入力画像とそれに対応する正解出力(正解のラベル)を学習データとしてシステムに入力して学習をさせます。学習ステップの後、判定ステップにおいて、システムにある画像を入力すると、システムは学習した内容に基づいて正解を予測して出力します。
一般的な「教師あり機械学習」では、学習データとしてすべてのラベルのデータ(入力画像とそれに対応する正解出力)を用いて学習を行います。例えば、部品が良品か欠陥品かの判定方法を学習する際には、良品と欠陥品、両方を含んだデータセット(部品のサンプル画像と、その部品が良品か欠陥品かのラベル)を用いて学習します。
それに対して、機械学習のひとつの方法である「半教師あり異常検知」では、学習データとして例えば良品のみといった、ひとつのラベルのデータのみを用いて学習を行います。この手法では、ひとつのラベルのデータを準備すればよいため、限られたサンプルで学習が可能です。
機械学習の学習ステップでは、複数の入力画像(正解画像)に対して特徴量を算出し、正解特徴量として学習します。そして、判定ステップにおいても、同様に入力画像から特徴量を算出します。判定ステップでは、算出した特徴量と学習ステップで学習した正解特徴量を用いて、正解を予測して出力します。
画像を特徴量に変換した場合、その特徴量(多次元なので特徴ベクトル)に基づく空間を「特徴空間」(feature space)と呼びます。認識処理では、この特徴空間上で、機械学習により識別を行います。図3に示されるように、学習ステップでは、多次元の特徴空間において識別面を形成し、判定ステップでは、入力画像の特徴量がどのラベルに分類されるかを識別することになります。
図3 特徴空間での学習手法の差
リコーは、この「半教師あり異常検知」を、画像中の対象物体の形状を適切に記述する特徴量と組み合わせたアルゴリズムを開発しました。このアルゴリズムを製造分野における画像を用いた外観検査に適用したところ、高精度な認識を行うことができました。
リコーは、産業分野において、光学モジュール製品だけでなく、このような画像認識・解析技術も含めたシステムソリューションを開発、提供していきます。
本技術の分類:分野別「画像処理・解析」「AI(人工知能)」
リコーテクニカルレポート
本技術の応用テーマ