AI(人工知能)関連の話題が毎日のようにニュース欄を賑わせていますが、実際には私たちのビジネスや生活にAIはどのぐらい浸透しているのでしょうか。
コロナ禍に直面して、日本の社会はデジタルトランスフォーメーション(DX)が遅れていると指摘されていますが、DXを進めるにあたっては、既存のIT技術にプラスしてAIによる新しいテクノロジーの活用が必須となってきます。
アメリカの調査会社Tracticaは、世界市場におけるAIソフトウエアの売上高が、2018年の95億ドルから、2025年には1186億ドルに増加すると予測しています。富士キメラ総研は、国内のAIビジネス市場について、2018年の5301億円から2030年には2兆1286億円まで拡大すると予測しています。
AIに対する期待は高まる一方ですが、とはいうものの、2020年版の「AI白書」のアンケートによれば、企業におけるAIの利用率はいまだ4.2%にとどまっているのが現状です。
AI導入が進まない原因の一つとして、「AIへの理解が不足している」ことが挙げられています。
AIとはなんなのか? ここでは文系の方でも理解できるようにAIについて簡単にわかりやすくまとめてみました。
■目次■
AI(人工知能)とは?
ー機械学習とは?
ーディープラーニングとは?
AI(人工知能)の種類
AI(人工知能)の歴史
AI(人工知能)でできること
AI(人工知能)の主な活用方法
AI(人工知能)の最新の活用事例
ーAIによる自然な対話応答を実現する電話応対AIサービス
ー広告効果の高い人物モデルをAIで生成
ーAI技術が可能にする無人店舗
ー自動運転の実用化
ー農業×AI
AI(人工知能)の発展によって起きる未来
AI(Artificial Intelligence)は、日本語では人工知能と表されています。
AI(人工知能)の定義は、専門家の間でもまだ定まっていないのが現状です。さまざまな専門家がそれぞれの定義をしており、統一的な定義はありません。
Wikipediaによると人工知能(AI)は、「計算という概念とコンピュータという道具を用いて知能を研究する計算機科学の一分野」と説明されています。これだと少し言葉足らずな感じがしますね。専門家はどう定義しているのでしょうか。
「究極には人間と区別が付かない人工的な知能のこと」(公立はこだて未来大学・松原仁教授)、「人工的につくられた人間のような知能、ないしはそれをつくる技術。人間のように知的であるとは、“気づくことができる”コンピュータ、つまり、データの中から特徴量を生成し、現象をモデル化することのできるコンピュータという意味である」(東京大学・松尾豊教授)、「人間の頭脳活動を極限までシミュレートするシステムである」(京都大学・長尾真教授)。
どうでしょうか。少しイメージが湧いてきたかと思います。
現在我々が人工知能と指しているものの大半は機械学習(machine learning)と呼ばれるものです。
機械学習の定義もここで説明したいと思います。
機械学習も人工知能と同様に様々な定義がなされていますが、Wikipediaでは「明示的な指示を用いることなく、その代わりにパターンと推論に依存して、特定の課題を効率的に実行するためにコンピュータシステムが使用するアルゴリズムおよび統計モデルの科学研究」と紹介されています。
よく引用されている定義としてトム・M・ミッチェルの「コンピュータプログラムが、ある種のタスクTと評価尺度Pにおいて、経験Eから学習するとは、タスクTにおけるその性能をPによって評価した際に、経験Eによってそれが改善されている場合である」という定義を挙げています。
これはかなり数学的な定義なのでもう少しかみくだくと、「コンピュータに大量のデータからパターンやルールを発見させ、それをさまざまな物事に利用することで判別や予測をする技術」と説明することができます。
つまり機械学習とは、コンピュータが自ら学習していくシステムのことです。この方法では、コンピュータがどのように演算を行っていくかと、どのようなルールに従ってパラメータを修正するかだけを人間が設定し、あとは機械が大量のデータをもとに自動的にパラメータを修正していき、最適化してくれます。
学習が進むにつれコンピュータの認識率は向上していき、最終的には画像データから特徴を抽出し、正確な判断ができるようになります。ただし、コンピュータも与えたモデルが適さなかったり、データの量、質が悪いとなかなか画像の認識精度を上げることができません。そのため目的に合わせて適切なモデルとデータセットを選択する必要があります。
AIに関する記事を読むと、機械学習とともに、「ディープラーニング」という言葉も頻繁に出てきます。
「ディープラーニング」とは、人間の脳のネットワークをヒントに、データの分類基準を人間が設定しなくても、機械自らが特徴を抽出する手法です。
例えば、画像認識では畳み込みニューラルネットワークと呼ばれるネットワークモデルがよく使用されます。このモデルは、人間の脳内の神経回路網を表現したニューラルネットワークと呼ばれるネットワークモデルの発展版です。このモデルの特徴は、画像のピクセルデータを人間が抽象ベクトルに変換せず、画像データのままコンピュータに特徴抽出を行なわせることです。
畳み込みニューラルネットではまず、画像データの一部分にフィルタをかけ演算し、その領域をスライドさせて繰り返していく「畳み込み」を行い、特徴マップを生成します。この処理によって、画像が持つ局所的な特徴を抽出することができます。このようにしてコンピュータは画像の特徴を繰り返し抽出し対象物を推測し、また正解データで答え合わせをして学習しながら、画像認識の精度を高めていくのです。この多層化されたニューラルネットワークの学習の仕組みをディープラーニングと呼んでいます。
ここまでの関係を図で表すと以下のようになります。
人工知能の種類を切り分ける切り口も様々な視点があります。今回は強いAIと弱いAI、汎用人工知能と特化型人工知能の2つの視点で分けたいと思います。
強いAIと弱いAIは哲学者であるジョン・サールが1980年に作った用語です。この2種類のAIの違いはAIの振る舞いがどのように生まれているかという点です。
強いAIの場合はAI自身が私たちのような知能や意識を獲得したことで、人間と同等の振る舞いをするものを指します。対して弱いAIは知能や意識は関係なく、機械的に人間と同じように振る舞うものを指します。
つまりこの切り分け方ではAIが真に知能を持っているか否かという視点から分けていると言えると思います。
汎用人工知能と特化型人工知能の違いはAIが何でもできるか、何かはできるかという点です。まず先に特化型人工知能の説明をすると、こちらは名前の通り何かしらかに特化したAIのことを指します。
例えば囲碁のAIであれば囲碁を打つことはできますが、文字を認識することや英語から日本語へ翻訳することはできません。
つまりそのAI固有の問題は解くことはできますが、それ以外の問題には対処できないというのが特化型人工知能です。対して汎用人工知能は人間のようにあらゆる問題を解くことができるAIのことを指します。
そのため、囲碁を打つこと・文字を認識すること・英語から日本語へ翻訳することもできます。現在実用化されているAIは特化型人工知能で汎用人工知能と呼べるAIは生まれていないと思います。
しかし汎用人工知能の研究も活発に行われているので汎用人工知能と呼べるAIもこの先、生まれるかもしれません。
人工知能は2度のブームと冬の時代を経て、現在3度目のブームの最中と言われています。
最初のブームは1950年代から1970年代にかけてでした。ちょうどこの時代に人工知能という言葉も生まれました。1956年のダートマス会議で主催者であるジョン・マッカーシーによって史上初めて使われたのです。
またこの会議の発起人には人工知能の父とも呼ばれているマービン・ミンスキーや情報理論の考案者であるクロード・シャノンなどの著名な人物が名を連ねていました。
この時代は推論と探索の時代と呼ばれていて、コンピュータを用いて推論や探索ができるようになりました。これにより迷路やパズルなど特定の問題に対しては解を求めることができるようになりました。
当時も人工知能により様々な問題が解けるようになると期待されていましたが、現実の問題は研究者が思っていた以上に複雑なものでした。
その結果人工知能における重要な問題の一つであるフレーム問題や組み合わせ爆発などの問題に直面することとなりました。こうして人工知能が現実の問題には適用できないことが判明し、第一次人工知能ブームは冬の時代へと移り変わりました。
2度目のブームは1980年代から1990年代にかけて訪れました。この時代はエキスパートシステムという知識表現を活用した人工知能が流行りました。
エキスパートシステムは専門分野の知識を組み込むことで、まるで専門家であるかのように振る舞うことができるものです。例えば症状などをエキスパートシステムに伝えることで診断を行うことができました。
またこのブームの最中、1981年に日本では第五世代コンピュータプロジェクトが始まりました。570億円をかけた一大プロジェクトでした。これに海外の国々も反応し、人工知能研究への投資が活発になりました。
しかし、このブームも終わりを迎えます。
コンピュータ自身が知識を集め蓄積できなかった点やコンピュータが理解できる形に記述する必要があったことから、扱いが難しかったために再び人工知能は冬の時代を迎えることとなりました。
現在進行形である3度目のブームは2006年にジェフリー・ヒントンが発明したディープラーニングを端に発して始まりました。この技術は機械学習の手法の一つであるニューラルネットワークをよりディープにしたものでした。
この技術は人工知能において大きなブレイクスルーとなりました。ニューラルネットワークをはじめとした機械学習は特徴量をデータとして与えることで学習していました。この特徴量は人間の手で設計する必要がありました。
しかしディープラーニングでは特徴量を人工知能自身が抽出することができました。
さらにビッグデータやGPU利用による計算の高速化などにより目覚ましい発展を遂げています。例えば2012年にはILSVRCという大規模画像認識の競技会でディープラーニングを用いた手法が他の手法と比べて圧倒的な精度を叩き出しました。
また2015年にはチェスや将棋で人工知能が人間を凌駕していくなか、アマチュアの有段者レベルに留まっていた囲碁においてDeepMindが作成したAlphaGoが人間のプロ棋士に初勝利を収めました。
出典:www.asahi.com/articles/photo/AS20160310003814.html
囲碁の数千年の歴史をまったく変えてしまう事件ともいえる一手が打たれたのは、2016年3月10日、韓国ソウルのフォーシーズンズホテルでの一室のことでした。
その一手に碁盤を打つ音はありませんでした。人が打った手ではなかったからです。天才デミス・ハサビス率いるGoogle DeepMindの囲碁AI「アルファ碁」が選んだのは、人がかつて一度も打ったことのない手でした。
現在、三度目のブームを迎えた人工知能は画像処理や音声処理、自然言語処理などのあらゆる分野に適用されています。しかしまだ強いAIや汎用人工知能までの道のりは遠いと思います。もしかしたら今までのブームがそれぞれ別のアプローチをもった手法だったように機械学習やディープラーニングとは全く違ったところから次のブレイクスルーが生まれるのかもしれません。
現在の人工知能の主流であるディープラーニングは、教師あり学習・教師なし学習・強化学習の3つの学習手法を使うことで賢くなります。そして学習手法によりできることはそれぞれ違います。
まずは教師あり学習・教師なし学習・強化学習について説明し、それぞれの学習手法で人工知能は何ができるのかを説明します。
教師あり学習ではデータとして入力データと教師ラベルが必要になります。入力データは人工知能への入力となるデータのことを指します。
変わって教師ラベルは入力データに対する答えを表すものです。
この学習手法では人工知能の出力が教師ラベルに近づくように学習します。学習を重ねることで学習初期では出鱈目だった出力が徐々に改善されていきます。主に分類や回帰といった問題を解くために使用されます。
分類は入力データがどのクラスに分類されるかを予測するタスクです。例えば動物の画像を入力として与えると、どの動物であるのかを分類することができます。
ただし何に分類できるかは学習時のデータによります。犬と猫の画像データで学習させた場合、その人工知能は犬か猫の分類はできるようになりますが、ウサギなどの犬でも猫でもない画像が与えられた場合も犬か猫の分類しかできません。
そのため別の分類を行いたい場合はもう一度学習させる必要があります。
回帰は入力データを与えると何かしらかの数値を予測します。人工知能が何の数値を予測しようとするかは分類と同様に何を学習したかに依存します。
例えば体重から身長を予測したい場合は、体重を入力データとし身長を教師ラベルとして学習させることで可能になります。
教師なし学習は教師ラベルを用いずに学習することができます。大量のデータから規則性や法則を見つけ出すことができます。
従って、時には人間が見つけられなかった規則を発見することもあるそうです。この学習手法はクラスタリングや次元削除のために使用されます。
クラスタリングは大量のデータを任意の数のクラスタに分割することです。データ同士の類似度や距離を使用し、似ているデータをひとまとめにしてクラスタにし分割します。
例えば数学と英語と国語の点数からなるデータがあった場合、三教科とも得意なクラスタ、数学と英語は得意なクラスタ、英語が得意なクラスタなどに分割することができます。
この時いくつのクラスタに分割するかは人間が決めることになりますが、どんなクラスタに分割するかは決めることはできません。そのためそこにどんな規則性が見られるかは人間が判断する必要があります。
人工知能が扱うデータは得てして高次元なデータを使うことが多いです。次元削除を使うことでそういったデータの次元を削除し、低次元なデータにすることができます。
低次元にしたことでデータを圧縮することができ、高次元のため視覚化できなかったデータを人間が見える形に可視化できるようになります。
また教師あり学習の入力データに前処理として使用されることもあります。これにより計算量の削減などが可能になります。
強化学習は試行錯誤を繰り返すことで最適な方策を見つけ出す学習方法です。基本的な構成要素として環境とエージェントが存在します。
囲碁で例えると環境は囲碁の盤面を意味し、エージェントはプレイヤーとなります。エージェントは環境に対して石を打つなどの行動をとることができます。
その結果、環境(盤面)の状態は変化します。エージェントは環境から状態と報酬を観測して次の行動を決めます。
この行動をどのように決めるか(方策)を、試行錯誤を繰り返し、状態・報酬など情報を用いて改善していくのが強化学習です。
ここではAI(人工知能)を活用することでどんな問題を解決できるかの具体例を挙げていきます。
人工知能を活用することで画像内になにが写っているかを認識することができます。例えば文字を認識させることで手書き文字からテキストデータへの書き起こしを自動化させることができます。
▷関連記事:画像認識とは?仕組みやAI(人工知能)による画像処理、最新の活用事例を解説
画像から分類を行うとともに物体の位置も検出することができます。位置の検出を行うことで適切な位置に配置されているのかを画像から管理できるようになります。
また、別の画像処理を行うために余分な部分を削除する前処理として活用されることもあります。主な手法としてはFaster R-CNNやYOLO、SSDなどがあります。
線画に対して自動的に色を付けることができます。この時、完全に自動的に全ての着色を任せることができますが、色の指定など使用者がコントロールすることは可能なようです。以下のリンクが自動着色のdemo動画になります。
Demo: YouTube:pixivSketch 自動着色機能
画像に対する説明文を生成することができます。またこの類似した活用法としてキャプションから画像を生成したり、画像に対して質問を与えると答えを返したりすることもできます。
テキストまたは音声を入力として与えることで応答してくれる、つまり会話することができます。この技術は別名人工無脳とも呼ばれています。有名なサービスとしてはMicrosoftの「りんな」があります
人工知能を使うことで翻訳することもできます。Google翻訳も人工知能を活用することで精度が向上しました。手法としてはTransformerと呼ばれるものを採用しています。この手法はGoogleが出したAttention is All you Needという論文で発表されたものです。
過去の株価の情報で予測モデルを作ることで未来の株価を予測することができます。このとき具体的な株価を予測することもあるかもしれませんが、株価が前日より上がるのかまたは下がるのかを予測するのが一般的だと思います。また株価のような時間によって値が変化するようなデータのことを時系列データと言います。
推薦システムは購買者に対してお勧めの製品などを推薦することができます。このときどのように何をお勧めするのかという部分で人工知能は活用できます。
有名な手法としては協調フィルタリングがあります。これは閲覧履歴や購買履歴を利用することで類似する別の購買者と照らし合わせて推薦を行います。
囲碁や将棋などのボードゲームやポーカーのようなカードゲーム、ビデオゲームなどのあらゆるゲームで人工知能が使われています。
このように人工知能はあらゆる場面で活用されています。また何に活用したいかで必要なデータや人工知能の手法は変わってきます。
よってどういった問題がどんなデータでどんな手法で解決されているのかを理解することはとても大切なことだと思います。
最後に、AI(人工知能)を活用した最新の事例の一部をご紹介します。AI(人工知能)が私たちの生活にどのように活用されているのかがイメージしやすいと思います。
引用:https://clova.line.me/line-aicall/
LINE AiCallは、LINE CLOVAのAI技術である音声認識と音声合成および会話制御の仕組みを組み合わせ、AIによる自然な対話応答を実現する電話応対AIサービスを提供しています。
これにより、飲食店や宿泊業などでは、来店予約の電話応対を含む予約管理の自動化を実現。限られた人員で店舗運営をしなければいけない環境でも、来店されたお客様への対応時間を拡大することができます。
また、LINEバイトでは上記の技術を用いて、求人応募・問い合わせチャネルとして電話窓口を追加。新たにコンタクトセンターを構築・運営することなく、自動応対電話窓口の設立を実現しました。
LINE AiCallはコロナ禍での行政窓口対応にも力を発揮し、厚生労働省の帰国者に対する健康フォローアップ架電や神奈川県での自宅療養者に対する安否確認・健康状態確認架電にも利用されています。
参考:https://clova.line.me/line-aicall/
引用:https://www.cyberagent.co.jp/news/detail/id=26366
株式会社サイバーエージェントは、2021年6月「極予測AI人間(キワミヨソクエーアイニンゲン)」において、老若男女さまざまなAI人物モデルが使い放題となる「極予測AI人間使い放題プラン」の提供を開始しました。
GAN(敵対的生成ネットワーク)技術を用い、架空のAIモデルの大量生成と「極予測AI」の効果予測を何度も繰り返すことで、企業やブランドごとのターゲティングに適した「オリジナルのAIモデル」を生成し、AIで「広告効果の出せるAIモデル」へと育成します。コロナ禍で、人物モデルの撮影が難しいことから、ニーズが高まっているということです。
参考:https://www.cyberagent.co.jp/news/detail/id=26366
引用:https://jpn.nec.com/press/202003/20200313_01.html
米国アマゾンが展開する「Amazon Go」では、店内に入った顧客が陳列棚から商品を手に取ると、AIカメラが商品と顧客を自動で認識して両者をひも付けます。顧客が出口のゲートを通過すると、自動的に決済が行われる仕組みです。
日本国内でも、省力化や無人化を目指して様々な取り組みが行われています。NECは、セブン-イレブン・ジャパンが店舗の課題解決を目的に、2019年12月にリニューアルオープンした実験店舗「セブン-イレブン麹町駅前店」で、顔認証決済や商品案内用サイネージの実証実験を行っています。
顔認証決済(セブン‐イレブン社員限定)利用者は、専用端末を用いて事前に顔画像やクレジットカード情報、確認用コードを登録することで、セルフレジ支払い時に顔と確認用コードの2要素認証により、簡単かつセキュアに決済が可能となります。
また、2020年5月中旬より、店舗内にある商品案内用サイネージの視聴時間測定の実証実験を行います。
離れた場所から人の視線の向きを高精度に検知できる「遠隔視線推定技術」を活用することで、映像から推定した年齢・性別ごとにサイネージの視聴時間を可視化し、商品案内の注目度などの効果測定を支援します。
参考:https://jpn.nec.com/press/202003/20200313_01.html
引用:https://response.jp/article/2020/10/12/339309.html
Googleの自動運転車開発部門のウェイモは2020年10月、米国アリゾナ州において、無人の自動運転車を使ったタクシー配車サービスを一般向けに開始しました。
この配車サービスは、「ウェイモ・ワン」(Waymo One)と呼ばれるもので、サービスを利用するには、専用のアプリをスマートフォンなどにダウンロードする必要があります。
ユーザーは、このアプリを通じて、無人の自動運転タクシーを呼び出します。無人の自動運転タクシーは24時間、365日呼び出すことができ、目的地までの距離や時間に基づいて、あらかじめ料金がアプリに表示されます。
参考:https://response.jp/article/2020/10/12/339309.html
引用:https://response.jp/article/img/2018/11/14/316162/1359522.html
農業の分野でもAIの活用はめざましいものがあります。高齢化や後継者不足問題を解決し、知識やスキルをAIが学習して効率化を図る取り組みが始まっています。
ドローンとAIの画像解析技術を組み合わせ作物の生育状況を確認したり、これまで人の手によって行われていた農作業をロボットに代替させる試みが進んでいます。
ニュージーランドの農業自動化ソリューション開発のスタートアップ企業であるロボティクス・プラス社は、ロボット工学、オートメーション化および解析技術をベースとした農業分野の自動化ソリューションを開発する企業として2008年に設立。
リンゴの自動パッキング機、キウイの自動収穫機、移動型の自動授粉機、農業用UGV(無人地上車両)などの開発実績があります。
参考:https://response.jp/article/2018/11/14/316162.html
人工知能が発展することで、今よりも更に様々な商品やサービスで活用されるようになると思います。また現在私たちが生業としている作業も人工知能が代替することになるかもしれません。
その結果世の中は今よりも便利になり、定型的なタスクから今以上に開放されることになると思います。また現在抱えている様々な問題が人工知能によって解決されることになると予想されます。