テクノロジ系 > 大分類1 基礎理論 > 中分類1 基礎理論 > 3.情報に関する理論 > (9)AI(Artificial Intelligence:人工知能)に関する技術
AIは近年急速に発達し、最も注目されている分野ですが、理論的に難しく深追いするときりがない分野でもあります。用語例にも様々なものが挙げられていますが、その中でも機械学習を中心にして過去問で出題されたものは最低限得点できるように対策をしていく必要があります。
AIとは
AIとは人工知能(Artificial Intelligence)の略で、コンピュータを用いて人間のような知能を実現しようという研究分野をいいます。もともとのコンピュータはインプットを与えてそのアウトプットを得るというもので、例えば1と2という数字を与えるとそれを足し算して3にするという単純なものでした。しかしその技術を発展させて推論・判断のような人間がもつ知能をコンピュータでも実現できるようにするのが人工知能で、近年急速にその実現が現実味を帯びてきています。
機械学習
機械学習とは人工知能の実現方法の一つで、コンピュータに大量のデータを読み込ませてパターンを分析することにより判定や分類などを実現する方法です。近年の人工知能の研究は機械学習を中心に発展してきています。
機械学習には教師あり学習、教師なし学習、強化学習の3つの分野があります。
教師あり学習
教師あり学習は教師となる正解データを与える機械学習です。正解データとはあるインプットに対するアウトプットで、例えば犬の写真に「犬」という正解のラベルを付けて学習をさせます。これを十分に用意することによりある写真が「犬」であることを判定できるようになります。
教師あり学習は大きく「分類」「回帰」の2つに分かれます。分類はデータをグルーピングして分けること、回帰は将来の値を予測することです。
教師あり学習のアルゴリズムには次のようなものがあります。
- サポートベクタマシン
- ニューラルネットワーク
ニューラルネットワークは人間の脳神経回路(ニューロン)を模倣して作成したもので、分類と回帰を行うことができます。ニューロンの階層を複数にしてより複雑な学習を可能にした機械学習をディープラーニングといいます。
分類
分類は与えたデータがどのグループに属するかを判定するために行われます。分類の種類も様々なものがありますが、ここでは過去問で出題されたことのある2値分類の中のROC曲線を中心に書いていきます。
2値分類とは、分類の中で特に「はい・いいえ」のような2種類に分類することいいます。この場合、AIが予測した分類と実際の分類の関係から真陽性、偽陽性、真陰性、偽陰性の4つに分けることができます。
実際に陽性のものを正しく陽性と予測した割合のことを真陽性率といい、実際は陰性のものを誤って陽性と予測した割合を偽陽性率と言います。
ROC曲線は縦軸に真陽性率、横軸に偽陽性率を取ったグラフです。
真陽性率が上がるにつれて偽陽性率も上がりますが、真陽性率を高くしても偽陽性率がなるべく低いモデルが良いモデルと言えます。
教師なし学習
データのみから学習を行う機械学習です。データの中から特徴を抽出しグルーピングを行うクラスタリングと呼ばれる手法がよく知られています。K-means法は代表的な教師なし学習のアルゴリズムです。
強化学習
強化学習はAI自らが試行錯誤を繰り返し、ある環境下での報酬を最大化するための行動を学習するアルゴリズムです。囲碁や将棋のプログラムなどで活用されています。
過学習
過学習とは、データの傾向に沿うように学習をさせすぎた結果、訓練データに対しては精度が高いのにも関わらず、未知のデータに対しては精度が低くなってしまうことを言います。
AIのポイント
応用情報技術者試験におけるAIの出題は「知っているかどうか」で正解・不正解が決まる知識問題です。同じ問題が何度も出題されるというよりは、新たな問題が出題される傾向にあり予想も難しいです。機械学習の分類や代表的なアルゴリズムの名前を押さえ、最新の動向を軽く追いながら、少なくとも大多数の人が答えられるような問題は正解できるように備えておく必要があります。