RN 009865

【ロボットの目】画像認識とは―仕組み・流れを解説

2020.06.04  | 
WRITER:
haruka
 

あなたは今、動物特集の番組を見ているとしましょう。犬や猫、たくさんの可愛い動物たちが出てきます。さて、あなたはなぜ「犬」や「猫」と分かったのでしょうか?

なぜと言われても・・・と思うでしょう。

人間が「対象」を見てそれが「何か」識別する、という何気なく行っている処理をコンピューターに行わせたものがあります。それが画像認識です。

 

今回は画像認識とは一体どういうものなのか、そのしくみの解説を中心に、機械学習とディープラーニングに触れながら答えを導き出す=認識する方法について分かりやすくまとめました!どんなものに活用されているか具体例も挙げています。

画像認識とは

画像認識は、画像/動画の中に何が映っているのか識別する技術です。

顔認証、医療や製造業、自動運転車など幅広い分野に活用されています。

 

画像認識は、データから特徴を取り出す処理であるパターン認識のひとつです。パターン認識には画像認識のほかにも、音声認識や文字認識などさまざまな対象があります。

パターン認識(パターンにんしき、英: Pattern recognition)は自然情報処理のひとつ。画像・音声などの雑多な情報を含むデータの中から、一定の規則や意味を持つ対象を選別して取り出す処理である。

 

(出典:Wikipedia|パターン認識

画像認識のしくみ

画像認識を行うには対象の特徴量を抽出・分析し、そのデータをもとに機械学習やディープラーニングを行い対象を認識することが必要です。対象の色や形などを学習することで、新たに与えられた画像から対象を識別できるようになります。

画像認識の大まかな流れとして″前処理→学習→認識″という工程があります。

 

データの学習前に行うのが画像の前処理領域抽出です。

どうしてこのような工程が行われるかというと、コンピューターにとって画像はピクセルの集合体でしかないため、コンピューターが認識しやすいよう処理する必要があるのです。

 

人間は成長とともに自然に経験・学習しているので、画像内の対象の特徴をひとつひとつ挙げなくても簡単に識別できます。

例えば、この画像に映っているのは「猫」だと瞬時に判断できますよね。猫に詳しい人なら「アメリカンショートヘア」と種類まで分かるかもしれません。

しかし、コンピューターにとって″この画像のどこに何が映っているのか識別″することは難しいのです。これを解決するために先ほどの2つの工程があります。

 

前処理では、ピクセルの集合体である画像に対しノイズや歪みを除去したり、明るさを調節したり、輪郭を強調するなどの処理を行います。次に、画像のどこに対象があるのかを切り出す領域抽出が行われます。

 

こうした処理が行われた後、データをもとに対象を学習します。

機械学習とディープラーニング

画像認識の学習方法として、機械学習ディープラーニングがあります。これらは「人が特徴量を教える必要がある」と「自ら学習する」という大きな違いがあります。

 

【機械学習/マシンラーニング】

機械学習は大量のデータから特徴量(パターン)を見つけ出すことができるもので、データを与える際に人間が対象の特徴量を教える(ラベル付けする)必要があります。

 

例えば「犬」「猫」の画像を与えるとき、これは犬・これは猫と人間が定義して大量のデータを与えます。すると「犬」「猫」それぞれの特徴量を学習していきます。そして人間が「猫」を識別するように指示し新たな画像を与えると、適切な答えを出します。

 

【深層学習/ディープラーニング】

ディープラーニングは機械学習の手法のひとつで、与えられたデータをもとに自動で学習し対象を見つけ出すことができます。

 

ディープラーニングでは「犬」「猫」の画像を与えると、それぞれの特徴量を自ら見つけ出し学習していきます。そして「これは犬か猫か」識別するよう指示し新たな画像を与えると、学習をもとにその答えを出します。

 

ディープラーニングは、人間の脳の神経細胞をコンピューターで再現した「ニューラルネットワーク」をベースにした技術であり、機械学習よりも人間の思考に近いものと言えるでしょう。

 

画像認識を行うときに「機械学習とディープラーニングどちらを選べばよいか」という問題がありますが、ラベル付けした大量の学習データとそれを処理できる高性能なコンピューターを用意できるなら、ディープラーニングを選ぶ方が精度の高い画像認識を行えます。

 

 

続いて、対象を見つけ出す工程である物体認識について解説します。

物体認識

物体認識とは、画像/動画の中から対象を識別できることを言います。

物体認識とは、画像やビデオ内の物体を識別するためのコンピュータビジョンの手法です。ディープラーニングや機械学習の重要な成果のひとつが物体認識と言えます。人間が写真やビデオを見る場合、人物や物体、シーン、細部の情報をすぐに見分けることができます。物体認識の目標は、人間が自然に行っていることをコンピュータに教えること、つまり画像に含まれている情報を理解できるだけの認識レベルを獲得することです。

 

(出典:MathWorks|物体認識

 

物体認識は、対象が″何に分類されるか″を認識する一般物体認識、″対象そのものが何であるかを認識する特定物体認識の2つに大別されます。

 

例えば猫の画像を与えたとき、「一般物体認識」では種類が何であれ″猫″とカテゴリー分けします。一方「特定物体認識」では、対象の特徴から″アメリカンショートヘア″と種類を認識することが可能です。

 

また「一般物体認識」は、″猫である″という絶対的な特徴を認識する必要がある難しい処理なのですが、ディープラーニングに用いられるアルゴリズム(計算方法)がその力を大いに発揮します。

 

 

ここまで画像認識についてその仕組みを解説しました。続いて、画像認識が私たちの生活の中でどのように活用されているか見ていきましょう!

画像認識でこんなことができる!

【顔認証】

画像認識の中でも代表的で馴染みがあるのが顔認証です。顔認証は、顔のパーツの特徴やその位置を抽出し識別することができます。

日常的に使うものとしてスマートフォンのロック解除がありますね。これも持ち主の顔の特徴を学習することで、「持ち主」か「他人」かを識別しています。

 

関連記事|【ロボットの目】顔認証システムの仕組みと安全性

 

【自動運転車】

歩行者や障害物を検知し、危険を音で知らせたりブレーキをかけてくれる自動運転車。事故防止渋滞緩和などが期待され、完全自動運転化を待ち遠しく思っている方も多いでしょう。

自動運転車はセンサーやGPSなど多くの技術が活用されており、このうち車に搭載されたカメラで障害物などを検知するのに画像認識を活用しています。例えば歩行者を検知するには、「人」と「人以外」を学習させることで、映っている対象が歩行者であると検知できるようになります。

ちなみに、2020年4月1日に「道路交通法」と「道路運送車両法」が改正され、レベル3(条件付き自動運転)で高速道路を走ることが可能になりました。また政府は、2025年にレベル5(完全自動運転)を実現するという目標を掲げています。

 

【製造業】

製造業ではロボットの導入をはじめ自動化が進んでおり、画像認識による検品も行われています。

製品の検品など人によるチェック(目視)を画像認識に置き換えることで、ミスを減らしたり、精度の高い異常検知ができます。また人手不足の解消や作業効率化にもつながります。

 

【医療】

画像認識は、病気の早期発見や治療にも大きな影響をもたらしました。

従来の治療は、医師の経験や知識をもとにした診断、レントゲンやMRIなどから得た情報をもとにした診断が行われてきました。

ここに画像認識が加わったことで、人間の目では発見しづらい症状を見つけられるなど、より詳細な診断や適切な治療につながっています。

 

画像認識は生活を便利にしたり、人を救ったり、私たちの生活に密着する技術として普及しています。しかし、これだけではありません。画像認識を使って″ある挑戦″に取り組む人たちがいます。

画像認識でキャラクターを作った漫画『ぱいどん』

画像認識により日本の「漫画」が新たな進化を遂げています!

誰もが知っている漫画家・手塚治虫。彼が描くキャラクター、絵のタッチ、ストーリーを、人間×AIで再現できないか―そんなチャレンジが始動しました。

 

手塚プロダクションとキオクシア株式会社を中心に、手塚治虫の31年ぶりの新作として発表した漫画『ぱいどん』。この漫画は、手塚治虫がこれまで書いたキャラクターをもとに、画像認識技術で新たなキャラクターを生み出すというこれまでにない漫画です。

キャラクターの制作作業では、人の手で漫画に載っているキャラクターの顔を分類したり定義し、これをひたすらAIに学習させました。はじめに出てきた画像は顔にすらなっていなかったといい、「まるで模様」だったそうです。膨大な画像データを学習し、ついにキャラクターの顔が完成しました。さらに絵は、漫画家たちがサポートしつつロボットアームで描かれました。

 

AIや画像認識の技術が、今後の漫画界をどのように進化させていくのか楽しみです!

 

(出典:KIOXIA|「TEZUKA 2020」

 

 

「画像認識」について調べていくうちに、人間が目にしたものを理解する能力ってすごいんだなと思うようになりました。コンピューター上でこれを再現するにはいくつもの工程があり、複雑な計算が行われているんですね。

 

今回は仕組みと流れを大きく捉えられる解説をしましたが、「画像認識」で重要な機械学習ディープラーニングについて解説した記事もぜひチェックしてみてください!

thank you

この記事に関連するタグ

広告主募集
TARA
上に戻る