RN 010007

【ロボットの目】画像認識における機械学習

2020.06.25  | 
WRITER:
haruka
 

前回の記事では、画像認識の仕組みや流れについて解説しました。続いて画像認識で使われる機械学習やディープラーニングについてまとめていきます。

この記事では、画像認識において機械学習がどのように行われているのか、教師あり学習・教師なし学習・強化学習について解説しました!

画像認識とは

画像認識は画像/動画の中に何が映っているのか識別する技術で、人間の「成長とともに自然と学習し、目に映ったものが何なのかわかるようになる」という能力をコンピューターで実現したものです。

これを行うには、何が映っているのか識別できるよう学習していく=機械学習をします。画像データを学習することで、新たな画像データを与えられたときに何が映っているのか識別できるようになります。

 

関連記事:【ロボットの目】画像認識とは―仕組み・流れを解説

 

近年、画像認識の精度が飛躍的にアップした背景には、ディープラーニングの登場がありました。そのディープラーニングがどのようなものか知る前に、機械学習について知る必要があります。

なぜなら、AI/人工知能がもつ技術のひとつに機械学習があり、機械学習の手法のひとつにディープラーニングがあるからです。

画像認識と機械学習

機械学習(マシンラーニング)は、人間が自然に行っている″経験から学習する″ということをコンピューターで実現したものです。膨大なデータを学習し、答えの予測や分類を行います。

 

画像認識では、学習により何が映っているか識別できるようになったり、学習データから対象の特徴やルールを見つけることができたりします。

【機械学習とディープラーニングの違い】

前述のとおりAI/人工知能、機械学習、ディープラーニングは別々のものではなく包含関係があります。しかし、機械学習は対象の特徴量を″人が定義する″、ディープラーニングはコンピューターが特徴量を″自動で見つけて定義する″という違いがあります。

 

なお、AI/人工知能に明確な定義はなく「人間の知的行動をコンピューターに行わせること」とされています。

誤解を恐れず平易にいいかえるならば、「これまで人間にしかできなかった知的な行為(認識、推論、言語運用、創造など)を、どのような手順(アルゴリズム)とどのようなデータ(事前情報や知識)を準備すれば、それを機械的に実行できるか」を研究する分野である。

 

(出典:Wikipedia|人工知能

 

機械学習には、大きく分けて次の学習方法があります。

  1. 教師あり学習
  2. 教師なし学習
  3. 強化学習

それぞれの学習方法について見ていきましょう!

教師あり学習:学習データに基づいて答えを出す

教師あり学習とは、人が特徴量を定義(ラベル付け)したデータに基づいて学習する方法です。例えば「犬」とラベル付けした画像データを学習させたあと、ラベル付けしていない新たな画像を与えると、コンピューターは″犬が映っている″と識別できるようになります。

教師あり学習は、100%正解でない(不確実な)場合でも与えたデータに基づいて予測し識別します。例えば「犬」の画像を学習したのち、ラベル付けしていない新たな画像を与えると「″80%の確率で″犬である」というような識別となります。

 

教師あり学習の代表的な手法には「分類」「回帰」があります。

「分類」は与えたデータのカテゴリーや種類が何であるか判別します。YESorNO、犬or猫、文字or数字といった判別が可能です。

「回帰」は与えたデータを基に今後の値を予測します。金額、回数、温度といった値の予測が可能です。

教師なし学習:学習データから特徴や規則性を見つける

教師なし学習とは、特徴量を定義せず(ラベル付けせず)データを与え、コンピューター自身が特徴や規則性を見つけ出す方法です。与えられたデータから対象をグループ分けしたり、構造を見つけることができます。

 

例えば、ラベル付けしていない「犬」「猫」「鳥」の画像データを与えたとき、コンピューターは画像の特徴や規則性を基に学習しそれぞれをグループ分けします。このグループ分けは人から見て「犬」「猫」「鳥」かもしれませんし、色、大きさ、形で分けられているかもしれません。

そしてラベル付けしていない新たな画像を与えると、学習に基づき何が映っているのか識別します。

教師なし学習の代表的な手法には「クラスタリング」があります。

「クラスター」という言葉は″群れ″や″房″という意味を持ちます。クラスタリングはデータがどんなクラスターから構成されているのかコンピューター自身で見つけ出すことができ、人には見つけられなかった(隠れている)特徴やルールを発見できるというメリットがあります。

 

なお、クラスタリングは教師あり学習の「分類」と似ていますが、クラスタリングは人によるラベル付けが必要ないのに対し、分類は人によるラベル付けが必要です。

強化学習:試行錯誤してより良い答えを見つけ出す

強化学習とは、コンピューターが試行錯誤して学習し評価の高い答えを出す方法です。教師なし学習と同じく人による特徴量の定義はありません

強化学習を画像認識に当てはめると、試行錯誤していくことでどのようにすれば評価の高い答えが出せるか=精度の高い識別ができるかをコンピューター自身が見つけ出すということができます。

また強化学習は、現在の画像認識で主流となっているディープラーニングに応用されている学習方法でもあります。

 

強化学習は将来的な価値を最大化することを目的としています。強化学習を用いた技術に自動運転技術、ロボットの制御、人工知能が人間を超えたと話題になったプログラム「AlphaGo(アルファ碁)」などがありますが、これらも先のことを考えて行動していく必要のあるものです。試行錯誤して良い答えを出すという動作は、人間に近い動作と言えるでしょう。

 

強化学習の代表的な手法には「Q学習」があります。
「将来的な価値を最大化する」には、″どんな状態でどんな行動を取るとどのくらいの価値が得られるか″を学ぶ必要があり、その行動の価値をQ値または状態行動価値と呼びます。このQ値を学習していくのがQ学習です。

機械学習のおさらい

機械学習は3つの学習方法を持ち、画像認識では次のような方法で何が映っているのか識別できるようになります。

教師あり学習:ラベル付けされた画像データをもとに学習する

教師なし学習:ラベル付けしていない画像データから特徴を見つける

強化学習:試行錯誤して学習しより良い答えを見つけ出す

 

教師あり学習・教師なし学習が統計的な答えを出す一方で、強化学習はこれらに比べて人間の行動に近い学習方法という特徴がありました。

 

 

次の記事ではディープラーニングの仕組み、強化学習と深層強化学習について解説します!

thank you

この記事に関連するタグ

広告主募集
TARA
上に戻る