TRIPLE BLOG - お役立ち情報

AI

    • 2023.07.11
    • AI
    • 画像認識の活用事例
      業界ごとの導入活用事例を徹底解説
    • [ez-toc] 1.セキュリティにおける画像認識の活用 セキュリティにおける画像認識の活用は、犯罪捜査やセキュリティシステムの強化において非常に重要です。   1-1顔認識による犯罪者の特定 顔認識技術は、犯罪捜査において重要なツールとなっています。警察やセキュリティ機関は、監視カメラや公共の場に設置されたカメラの映像から顔を認識し、犯罪者や容疑者を特定することができます。顔認識技術は、データベースに登録された犯罪者の顔データと照合し、迅速かつ正確に一致する顔を検出します。 1-2監視カメラの画像解析による不審行動の検出 監視カメラの画像解析による不審行動の検出は、セキュリティシステムの効果を高めるために利用されます。画像認識アルゴリズムは、動きのパターンや不審な挙動を検知し、監視エリア内での異常行動や不正アクセスを自動的に検出します。これにより、セキュリティスタッフに早期の警告を与え、犯罪行為の予防や対応が可能となります。 活用事例 太陽光発電施設での盗難対策にAI監視カメラを活用 https://www.3-ize.jp/information/3123/ 1-3不正アクセスの検出と防止 画像認識は、セキュリティシステムにおける不正アクセスの検出と防止にも活用されます。例えば、顔認識技術や指紋認識技術を使用して、正規のユーザー以外の人物がセキュリティエリアに侵入しようとする試みを検知することができます。これにより、不正アクセスを防止するだけでなく、セキュリティシステムの監視ログや警報システムに対して追加の情報を提供します。   これらの例は、画像認識技術がセキュリティ領域でどのように活用されているかを示しています。画像認識による高度な分析と検出は、セキュリティシステムの効果を向上させ、犯罪の予防や迅速な対応を可能にする重要なツールとなっています。   2.自動運転技術における画像認識の活用 自動運転技術における画像認識は、車両の周囲の物体検出や環境認識、交通標識の認識など、安全な自動運転を実現するための重要な要素です。以下に、画像認識が自動運転技術にどのように活用されるかについて説明します。   2-1車両の周囲の物体検出と衝突回避 自動運転車は、周囲の物体を正確に検出し、それらとの距離や速度を把握する必要があります。画像認識技術を使用することで、カメラやセンサーが取得した映像データを解析し、歩行者、自転車、車両などの障害物を検出することができます。これにより、適切な制御アルゴリズムが障害物を回避するための適切な行動を選択し、衝突を回避することが可能となります。 2-2交通標識や信号の認識 自動運転車は、交通標識や信号の認識を行い、適切な操作を行う必要があります。画像認識技術を使用することで、カメラやセンサーが取得した映像データを解析し、道路上の標識や信号を認識することができます。これにより、自動運転車は速度制限や停止信号などの交通ルールに従い、安全な運転を実現することができます。 2-3車線認識と自動車の制御 自動運転車は、車線を正確に認識し、適切な走行を行う必要があります。画像認識技術を使用することで、カメラやセンサーが取得した映像データを解析し、道路上の車線を検出することができます。これにより、自動運転車は自動的に適切な車線内で走行し、車線変更や車線逸脱を防止することができます。   活用事例 日産の自動運転化技術 https://www.nissan.co.jp/BRAND/DRIVING/   画像認識は、自動運転技術において非常に重要な要素であり、安全性と信頼性の向上に寄与しています。高度な画像認識アルゴリズムの活用により、自動運転車は周囲の状況を正確に把握し、適切な制御を行うことができます。これにより、交通事故の予防や安全な運転環境の確保が可能となります。   3.医療診断と治療支援における画像認識の活用 医療診断と治療支援における画像認識の活用は、病変の検出や解析、手術支援などの分野で重要な役割を果たしています。以下に、画像認識が医療においてどのように活用されるかについて説明します。   3-1 X線やMRI画像の解析による病変の検出 画像認識技術は、X線やMRIなどの医療画像を解析し、異常な病変や疾患を検出するのに役立ちます。例えば、乳がんや肺炎のような疾患の検出において、画像認識アルゴリズムは異常な組織パターンや特徴を自動的に検出し、医師に早期の警告を与えることができます。 3-2薬剤の識別とラベルの読み取り 画像認識技術は、薬剤の識別とラベルの読み取りにも利用されます。医療従事者は、薬剤の種類や用量を正確に把握する必要があります。画像認識を使用することで、薬剤の特徴やラベル情報を解析し、正確な識別と読み取りを行うことができます。 3-3手術中の画像ガイドと支援 手術中の画像ガイドと支援においても、画像認識技術は役立ちます。例えば、脳手術においては、画像認識アルゴリズムが脳の解剖学的構造や病変を正確に識別し、医師に手術のガイドや支援を提供します。これにより、手術の精度や安全性を向上させることができます。 3-4病理学的画像の解析と診断支援 病理学的画像の解析においても、画像認識技術は重要です。病理組織スライドや細胞画像の解析において、画像認識アルゴリズムは異常な細胞構造や病変を検出し、医師に診断支援を提供します。これにより、病理診断の正確性と効率性を向上させることができます。   活用事例 エルピクセルの病理学的画像の解析と診断支援の研究事例 https://lpixel.net/technology/research-cases/   画像認識の活用により、医療診断と治療支援の分野では、病気や病変の早期検出、正確な診断、手術の精度向上など、重要な進展が実現されています。これにより、患者の治療効果と生活の質が向上し、医療の進歩が促進されています。   4.製造業と品質管理における画像認識の活用 製造業においては、以下のように画像認識が活用されています。   4-1品質管理 製造工程において、製品の品質管理は重要な課題です。画像認識技術を使用することで、製品の外観や仕上がり状態を自動的に検査することが可能になります。不良品の検出や欠陥部位の特定などを行い、品質の一貫性と統一性を確保します。 活用事例 日立ソリューションズ・クリエイトの画像認識AIソリューション https://www.hitachi-solutions-create.co.jp/solution/feature/image_inspection/index.html?lfcpid=27663&gad=1&gclid=Cj0KCQjw7aqkBhDPARIsAKGa0oJs99aOcRQDWO1evPhUJP7oi_oqNrQ2EYSwXFLXhM_BOpmDRcwDt70aAmj1EALw_wcB 4-2パーツの識別と分類 製造ラインでは多種多様なパーツや部品を扱うことがあります。画像認識を活用することで、パーツの識別や分類を自動化することができます。例えば、同じ形状の部品でも微妙な差異がある場合や、複数のパーツを正確に組み立てる場合に役立ちます。 4-3ロボットの制御と自動化 画像認識を組み込んだロボットシステムは、製造業において自動化を促進します。ロボットが画像情報を利用して製品の位置や姿勢を把握し、正確な作業を行うことができます。例えば、製品のピッキングや組み立て、梱包作業などに応用されます。 4-4在庫管理 製造業では在庫管理が重要です。画像認識技術を使用することで、製品や部品の在庫を自動的に識別し、追跡することが可能になります。これにより在庫の正確な管理や効率的な補充を行い、生産ラインのスムーズな運営を支援します。 4-5製造プロセスの監視と改善 画像認識は製造プロセスの監視や改善にも役立ちます。例えば、製品の組み立て工程や加工工程において、画像認識を使用して作業の進捗状況やエラーの検出を行うことができます。これにより、生産プロセスの効率化や問題の早期発見、改善のためのデータ収集が可能になります。   5食品業界と農業における画像認識の活用 食品業界と農業における画像認識の活用は、品質管理、作物の健康状態の監視、農作業の効率化など、さまざまな領域で重要な役割を果たしています。以下に、具体的な活用例を説明します。   5-1品質管理と異物検出 食品業界では、画像認識技術を使用して製品の品質管理や異物の検出が行われています。例えば、食品加工工場では、カメラやセンサーが取得した食品の画像を解析し、外観の欠陥や異物(ガラス片、金属片など)の検出を行います。これにより、不良品の除去や食品の安全性の向上が可能となります。 5-2作物の健康状態の監視 農業において、画像認識技術は作物の健康状態の監視に活用されます。カメラやドローンなどのセンサーを使用して取得した作物の画像を解析し、病害虫の被害や栄養状態の異常を検出することができます。これにより、早期に問題を発見し、適切な対策を講じることができます。 5-3収穫時期の判断と品質評価 作物の収穫時期の判断や品質評価においても、画像認識技術が活用されます。作物の画像を解析し、色や形状などの特徴を評価することで、収穫のタイミングや品質を判断することができます。これにより、適切な収穫時期の選択や品質の向上が可能となります。 活用事例 葉色解析サービスいろは https://smx-iroha.com/top.html 5-4農作業の効率化と自動化 画像認識技術は、農作業の効率化と自動化にも役立ちます。例えば、果樹園や温室での果実の収穫において、画像認識アルゴリズムを使用して成熟した果実を自動的に検出し、ロボットアームなどを制御して収穫を行うことができます。これにより、労働力の削減や収穫の効率化が可能となります。   画像認識の活用により、食品業界と農業では品質管理、作物管理、労働効率化などが向上し、生産性や収益性が向上すると同時に、食品の安全性と品質の向上が促進されます。   6.オンライン商店と広告における画像認識の活用 オンライン商店と広告業界において、画像認識の活用は商品の検索、顧客のパーソナライズ、広告の効果測定など、さまざまな領域で重要な役割を果たしています。以下に、具体的な活用例を説明します。   6-1商品検索と関連商品の提案 画像認識技術は、オンライン商店における商品検索と関連商品の提案に活用されます。ユーザーが商品の画像をアップロードすると、画像認識アルゴリズムが商品の特徴を解析し、類似した商品を検索結果として提供します。また、購入履歴や閲覧履歴などの情報と組み合わせることで、個々の顧客に合わせたパーソナライズされた商品提案が可能となります。 6-2顧客のパーソナライズとターゲティング 画像認識技術は、顧客のパーソナライズと広告ターゲティングにも活用されます。顧客の画像やプロフィール写真から、年齢、性別、スタイルなどの情報を抽出し、個々の顧客に最適な広告を表示することができます。これにより、よりターゲットに合った広告を提供することができ、広告効果の向上が期待できます。 6-3広告の効果測定と改善 画像認識技術は、広告の効果測定と改善にも活用されます。広告表示時に顧客の反応や感情を画像解析によって分析し、広告の効果を評価します。また、広告クリックや購買行動といったデータと組み合わせることで、広告の効果を追跡し、改善策を見つけることができます。   活用事例 来店客の顔画像を取得し、来客数や属性をデータ化するクラウド型AIサービス「AIZE Research」 https://aize.jp/service0304/   6-4ブランド保護と偽造品の検出 画像認識技術は、オンライン商店におけるブランド保護と偽造品の検出にも利用されます。ブランド所有者は、画像認識を使用してインターネット上の画像やリストを監視し、偽造品や許可されていない販売を検出することができます。これにより、ブランドの信頼性を守るための対策を講じることができます。   画像認識の活用により、オンライン商店と広告業界では、顧客のエンゲージメントの向上、広告効果の最適化、商品の検索と提案の精度向上などが実現され、ビジネスの成果を高めることができます。   7.観光業界における画像認識の活用 観光業界において、画像認識の活用は観光体験の向上、目的地のマーケティング、安全管理など、さまざまな領域で重要な役割を果たしています。以下に、具体的な活用例を説明します。   7-1観光スポットの特徴抽出と推薦 画像認識技術を使用することで、観光スポットの画像から特徴や属性を抽出することができます。例えば、建築物のスタイル、自然の風景、食文化などを解析し、個々の観光スポットに関連する情報や推薦を提供することができます。これにより、訪問者にとって魅力的な観光スポットを推奨し、観光体験を向上させることができます。 7-2マーケティングと観光広告 画像認識技術は、目的地のマーケティングや観光広告においても活用されます。観光地の画像を解析し、魅力的な要素や特徴を抽出し、鮮やかな広告やプロモーション素材を作成することができます。また、ソーシャルメディアの画像を分析して、人気のある場所やトレンドを把握し、マーケティング戦略に活用することもできます。 7-3観光地の安全管理と監視 画像認識技術は、観光地の安全管理や監視にも重要な役割を果たしています。セキュリティカメラや映像モニタリングシステムを使用して、画像認識アルゴリズムが人物や物体の検出、不審行動の監視、危険な状況の警告などを行います。これにより、観光地の安全性を向上させ、観光客や地域の住民を保護することができます。 7-4観光体験のカスタマイズと改善 画像認識技術を活用することで、訪問者の観光体験をカスタマイズして改善することができます。例えば、顧客の画像や動画からその人の好みや嗜好を抽出し、個別の旅行プランやアクティビティの提案を行うことができます。また、顧客の反応や感情を解析して、観光体験の満足度を評価し、改善策を見つけることも可能です。   画像認識の活用により、観光業界ではより魅力的な観光体験、的確なマーケティング、安全な環境の提供などが実現され、観光業の成長と発展が促進されます。   8.不動産業界における画像認識の活用 不動産業界において、画像認識の活用は物件情報の効率化、視覚的な評価、マーケティングの強化など、さまざまな領域で重要な役割を果たしています。以下に、具体的な活用例を説明します。   8-1物件情報の効率化と自動化 画像認識技術を使用することで、物件情報の収集と整理を効率化することができます。例えば、不動産の写真や資料を自動的に解析し、物件の特徴や間取り、設備の有無などを抽出することができます。これにより、物件情報のデータベース化や検索の容易化が可能となります。 8-2視覚的な評価と仮想見学 画像認識技術を活用することで、物件の評価や視覚的な情報提供が強化されます。物件の写真やビデオから、部屋のサイズ、インテリアのスタイル、景色などを解析し、購入や賃貸の判断材料となる情報を提供することができます。また、仮想現実(VR)や拡張現実(AR)を活用した仮想見学の実現も可能です。 8-3マーケティングとターゲティング 画像認識技術は、不動産のマーケティングとターゲティングにおいても活用されます。顧客の好みや要求を解析することで、個々の顧客に合わせた物件の提案やマーケティングメッセージを作成することができます。また、不動産の画像や情報を分析して、需要のあるエリアやターゲット市場を特定し、効果的な広告キャンペーンを展開することができます。 8-4建物の安全性と保守管理 画像認識技術は、建物の安全性と保守管理にも貢献します。セキュリティカメラや監視システムを活用して、建物内外の異常や不審な行動の検出を行います。また、建物の画像やセンサーデータから、設備の故障や保守管理の必要性を早期に検知し、メンテナンススケジュールの最適化を行うことができます。   活用事例 AIによる建物管理クラウドシステム https://kanri-roid.app/   画像認識の活用により、不動産業界では物件情報の効率化、視覚的な評価の向上、マーケティングの強化、安全管理の向上などが実現され、効果的な不動産取引と顧客満足度の向上に貢献します。 資料ダウンロード  
    • 2023.07.11
    • AI
    • 画像認識とは何か?
      しくみや応用分野、利点と課題を解説
    • [ez-toc] 1.画像認識とは 1-1画像認識の基本概念 画像認識は、コンピューターシステムが与えられた画像データを解析し、画像内のオブジェクトや特定のパターンを自動的に識別するプロセスです。基本的な概念として、以下の要素があります。 画像データ 画像認識の対象となるデータであり、ビットマップやピクセルの形式で表現されます。カメラ、センサー、データベースなどから取得できます。 前処理 画像データを事前に処理して、認識アルゴリズムへの入力として適した形式に変換します。例えば、画像のリサイズ、正規化、フィルタリングなどが行われます。 特徴抽出 画像データから有益な情報を抽出する過程です。特徴は、形状、色、テクスチャなどの視覚的な属性や、エッジやコーナーなどの局所的な特徴点などを指すことがあります。 パターン認識 抽出された特徴を使用して、画像内のパターンやオブジェクトを識別する手法です。機械学習やディープラーニングアルゴリズムが一般的に使用されます。教師あり学習や教師なし学習の手法があります。 分類または検出 画像内のオブジェクトを特定のクラスに分類するか、特定のオブジェクトが存在するかどうかを検出するタスクです。例えば、犬や猫の画像を分類する場合、特定の犬や猫の種類を検出する場合などがあります。 評価と改善 画像認識の性能を評価し、精度や効率を改善するための手法です。交差検証や混同行列を使用して性能評価を行い、アルゴリズムやモデルのパラメータの調整を行います。   画像認識は、自動運転、監視カメラシステム、医療診断、顔認識などのさまざまな応用分野で利用されており、コンピュータービジョンの一部として重要な技術です。   1-2画像認識の重要性 画像認識は、現代のテクノロジーにおいて非常に重要な役割を果たしています。以下に、画像認識の重要性について説明します。 自動化と効率化 画像認識技術を活用することで、人の手作業や労力を削減し、作業プロセスの自動化と効率化を実現できます。例えば、製造業においては、製品の欠陥検出や組み立てラインの監視に画像認識が使用され、品質管理や生産性の向上が図られています。 セキュリティ強化 画像認識は、セキュリティシステムにおいて重要な役割を果たしています。顔認識や物体検出などの技術を利用することで、不正アクセスの検知や監視カメラの映像解析によるセキュリティ強化が可能です。これにより、施設やシステムの安全性が向上し、犯罪の予防や被害の最小化が図られます。 医療診断と治療支援 画像認識は、医療分野においても重要な役割を果たしています。医療画像(CTスキャン、MRI、エコーなど)の解析により、疾患の早期検出や正確な診断を支援します。さらに、手術計画や放射線療法の計画など、治療の精度と効果を向上させるためにも画像認識技術が活用されています。 ユーザーエクスペリエンスの向上 画像認識技術を利用することで、ユーザーエクスペリエンスの向上が図られます。スマートフォンやタブレットでの顔認識によるロック解除や絵文字認識、写真アプリでのオブジェクト検出などはその一例です。これにより、より直感的で便利なインタラクションが実現され、ユーザーの利便性と満足度が向上します。 ビッグデータの活用 現代のデジタル時代では、膨大な量の画像データが生成されています。画像認識技術は、ビッグデータの中から価値ある情報を抽出し、意味のある洞察や予測を行うためのツールとして活用されています。例えば、マーケティング分野では、画像認識による顧客の嗜好や反応の分析が行われ、効果的な広告や製品開発に活用されています。   以上のように、画像認識は多岐にわたる領域で重要な役割を果たしており、自動化、セキュリティ強化、医療支援、ユーザーエクスペリエンスの向上、ビッグデータの活用など、さまざまな側面で社会やビジネスに価値をもたらしています。   2.画像認識の応用分野 2-1自動運転技術 自動運転技術において、画像認識は非常に重要な役割を果たしています。以下に、画像認識の自動運転技術への貢献と役割について説明します。 障害物検知と衝突回避 自動運転車は周囲の状況を正確に把握し、安全に走行する必要があります。画像認識技術を活用することで、カメラやセンサーからの画像データを解析し、道路上の障害物(車両、歩行者、自転車など)を検知し、衝突回避のための適切な判断を行うことが可能となります。 信号検知と交差点の制御 自動運転車は交通信号や道路標識を認識し、適切な行動を取る必要があります。画像認識技術によって、赤信号や青い案内標識などを検知し、適切な速度や行動を制御することができます。また、交差点では周囲の車両や歩行者の動きを観察し、安全な交差点の通過を支援することも可能です。 車線認識と自動運転制御 自動運転車は正確に車線を認識し、適切な走行制御を行う必要があります。画像認識技術を使用することで、道路上の車線の位置や形状を把握し、車両の位置や方向を制御することができます。これにより、自動車は適切な車線上で走行し、車線変更やカーブ走行を安全かつスムーズに行うことができます。 環境認識と予測 自動運転車は周囲の環境を正確に認識し、予測能力を持つことが求められます。画像認識技術を活用することで、道路の構造や交通状況、天候条件、歩行者や自転車の動きなど、さまざまな要素を把握し、適切な判断と行動を行うことができます。これにより、事故や危険な状況の予測と回避が可能となります。   活用事例 日産の自動運転化技術 https://www.nissan.co.jp/BRAND/DRIVING/   画像認識は自動運転技術の中核的な要素であり、安全性、効率性、快適性の向上に大きく寄与しています。カメラやセンサーを通じて取得された画像データの解析により、自動運転車は正確な状況把握と適切な制御を行い、より安全で信頼性の高い移動体験を提供することが可能となります。   2-2顔認識システム 画像認識を使った活用技術の一つに顔認識があります。顔認識システムは、コンピューターシステムが与えられた画像やビデオデータから顔を検出し、その顔を特定したり特徴を解析したりする技術です。顔認識システムは、以下の手順で動作します。 顔検出 まず、画像やビデオフレームから顔の存在を検出します。この手順では、顔の位置や領域を特定するために、パターン認識アルゴリズムや機械学習アルゴリズムが使用されます。一般的な手法には、Haar-like特徴やHOG(Histogram of Oriented Gradients)などがあります。 特徴抽出 顔検出が行われた後、顔の特徴を抽出します。特徴抽出は、顔の形状、輪郭、目、鼻、口などの重要な局所的な特徴を抽出するプロセスです。これにより、個々の顔の識別や顔の表情解析など、さまざまなタスクが可能となります。 顔識別 特徴抽出された情報を使用して、顔を特定するか、あるいは既知の顔との一致を確認します。顔識別は、登録されたデータベースや学習済みのモデルとの比較を行うことで行われます。識別の手法としては、主成分分析(PCA)、線形判別分析(LDA)、サポートベクターマシン(SVM)、ディープラーニングの畳み込みニューラルネットワーク(CNN)などが一般的に使用されます。 応用 顔認識システムは、個人識別、アクセス制御、顔認証によるログイン認証、監視カメラシステム、写真アプリケーションなど、さまざまな応用分野で利用されています。また、感情解析や年齢推定などの顔の特徴解析も、顔認識システムの一部として実現されています。 活用事例 来店客の顔画像を取得し、来客数や属性をデータ化するクラウド型AIサービス「AIZE Research」 https://aize.jp/service0304/   顔認識システムは、セキュリティや個人識別、ユーザーエクスペリエンスの向上など、さまざまな領域で重要な役割を果たしています。しかし、プライバシーや倫理の観点からも注意が必要であり、適切なデータ保護と使用に対する配慮が求められます。   2-3メディカルイメージ解析 メディカルイメージ解析における画像認識は、重要な役割を果たしています。以下に、画像認識の主な役割とメディカルイメージ解析への貢献について説明します。 病変検出と分類 画像認識技術は、医療画像中の病変や異常領域の検出と分類に使用されます。例えば、脳のMRI画像から腫瘍や出血領域を検出し、肺のCTスキャンから結節や腫瘍を識別することができます。画像認識は、医師による病変の手動検出や視覚的な解析の補完として、高度な自動化と効率化をもたらします。 解剖学的構造の抽出 画像認識は、医療画像中の解剖学的構造の抽出やセグメンテーションにも使用されます。例えば、脳のMRI画像から脳領域や構造物(脳室、皮質、白質など)を抽出することができます。これにより、解剖学的情報を定量化し、病変の位置関係や影響を正確に評価することができます。 パターン認識と異常検知 画像認識は、パターン認識や異常検知の手法を応用して、医療画像中の異常なパターンや特徴を検出します。機械学習やディープラーニングアルゴリズムを使用して、正常な画像パターンを学習し、異常なパターンを検出することができます。これにより、病変や異常の早期発見や識別が可能となります。 画像解析の補完とサポート 画像認識は、医療画像解析の他の手法と組み合わせて使用されることがあります。例えば、特徴抽出やセグメンテーション、パターン分類のための事前処理として画像認識を使用することがあります。また、患者の画像データベースの管理や検索、画像の比較や相関関係の解析などにも画像認識技術が活用されます。   活用事例 エルピクセルの病理学的画像の解析と診断支援の研究事例 https://lpixel.net/technology/research-cases/   画像認識は、メディカルイメージ解析において病態の検出や診断、治療計画の立案、疾患の追跡などで重要な役割を果たしています。自動化と効率化をもたらし、医療の精度と効果を向上させると同時に、医師の意思決定をサポートする貴重なツールとなっています。   2-4製品品質管理 製品品質管理における画像認識は、製品の外観や特定の要素の評価と検査において重要な役割を果たしています。以下に、画像認識の主な役割と製品品質管理への貢献について説明します。 外観検査 製品の外観品質は顧客満足度やブランド価値に直結する重要な要素です。画像認識は、製品の外観を評価し、不良品や欠陥があるかどうかを検査するのに役立ちます。製品の画像データを解析し、異常なパターン、色の不均一性、傷、欠損などを自動的に検出することができます。これにより、高速かつ正確な外観検査が可能となります。 寸法測定 製品の寸法や形状の正確さは、製品品質の重要な要素です。画像認識を使用して、製品の画像データから寸法や形状を測定することができます。例えば、製品の長さ、幅、高さ、角度、曲率などを測定し、設計仕様や品質基準との比較を行うことができます。これにより、寸法のずれや形状の不良を検出し、品質の一貫性を確保することができます。 欠陥検出 製品には、微細な欠陥や異常なパターンが存在する場合があります。画像認識は、製品の画像データを分析し、欠陥や異常を検出するのに役立ちます。例えば、電子部品の基板上のボンディング不良やワイヤリングの誤り、製品表面のクラックや欠け、溶接部の不良などを検出することができます。これにより、製品の品質向上と不良品の削減が可能となります。 データ解析と品質改善 画像認識は、製品品質データの解析と統計的処理にも活用されます。大量の画像データからパターンや傾向を抽出し、品質の問題や改善点を特定することができます。品質データの可視化や異常値の検出、統計的プロセス制御などの手法を組み合わせることで、製品の品質管理と品質改善に寄与します。   活用事例 日立ソリューションズ・クリエイトの画像認識AIソリューション https://www.hitachi-solutions-create.co.jp/solution/feature/image_inspection/index.html?lfcpid=27663&gad=1&gclid=Cj0KCQjw7aqkBhDPARIsAKGa0oJs99aOcRQDWO1evPhUJP7oi_oqNrQ2EYSwXFLXhM_BOpmDRcwDt70aAmj1EALw_wcB   画像認識は、製品品質管理において自動化、効率化、正確性をもたらし、製品の品質を向上させると同時に生産効率を高める重要なツールとなっています。   3.画像認識の仕組み 3-1画像処理の基礎 画像認識における画像処理は、画像データを解析し、情報を抽出するための基礎的な操作を指します。以下に、画像処理の基礎について説明します。 グレースケール変換 グレースケール変換は、カラー画像を白黒の濃淡画像に変換する操作です。RGB(Red, Green, Blue)の各色成分を重み付けして組み合わせることにより、輝度情報を表現します。グレースケール変換により、画像の情報量を減らすことなく、処理の単純化や特定の特徴の強調が可能となります。 ノイズ除去 ノイズは画像に不要な情報や乱れをもたらす要因です。ノイズ除去は、画像内のノイズを減らす操作です。フィルタリング手法や統計的な手法を使用して、ノイズを抑制し、画像のクリアさと品質を向上させます。 エッジ検出 エッジとは、画像中の明暗の境界線や特徴的な輪郭を表す線です。エッジ検出は、画像内のエッジを検出する操作です。エッジ検出には、勾配(画素間の輝度変化の強さ)を計算する手法や、微分フィルタなどの手法が使用されます。エッジ情報を抽出することで、画像内の物体や形状の特徴を強調することができます。 特徴抽出 特徴抽出は、画像から意味のある情報や特徴を抽出する操作です。特徴抽出には、画像内の局所的なパターンや構造を捉えるための手法が使用されます。一般的な手法としては、テクスチャ特徴、色彩特徴、形状特徴などがあります。特徴抽出により、画像の情報をよりコンパクトに表現し、後続の処理や分類に利用することができます。 分類と認識 分類と認識は、画像内のオブジェクトやパターンを特定のクラスやカテゴリに分類する操作です。機械学習やパターン認識の手法を使用して、特徴ベクトルや識別モデルを作成し、未知の画像を分類または認識することができます。分類と認識により、画像内のオブジェクトや特定の特徴を自動的に検出し、識別することができます。   これらの基礎的な画像処理操作は、画像認識の手法やアルゴリズムの基盤となります。適切に組み合わせることで、画像データから有用な情報や特徴を抽出し、画像認識のタスクを達成することができます。   3-2特徴抽出と特徴記述 画像認識において、特徴抽出と特徴記述は重要なプロセスです。以下にそれぞれの概要と役割について説明します。 特徴抽出 特徴抽出は、画像から意味のある情報や特徴を抽出するプロセスです。画像内の局所的なパターンや構造を捉えるための手法が使用されます。特徴抽出の目的は、画像データの次元を低減し、重要な情報を保持する特徴ベクトルを生成することです。特徴抽出では、一般的にフィルタリング、勾配計算、周波数変換、テクスチャ解析などの手法が使用されます。これらの手法は、画像内のエッジ、コーナー、領域のテクスチャパターンなどの局所的な特徴を検出します。特徴抽出の結果得られる特徴は、画像内の重要な情報を保持しており、後続の処理や分類に利用されます。 特徴記述 特徴記述は、抽出された特徴を数値ディスクリプタ(記述子)として表現するプロセスです。特徴記述では、特徴抽出で得られた局所的な特徴を数値ベクトルや記述子の形式で表現します。これにより、画像間の類似性やパターンの比較が可能となります。特徴記述では、局所的な特徴を記述するために、特徴ベクトルや特徴記述子の計算手法が使用されます。例えば、SIFT(Scale-Invariant Feature Transform)、SURF(Speeded Up Robust Features)、ORB(Oriented FAST and Rotated BRIEF)などのアルゴリズムが一般的に使用されます。これらの手法は、特徴の位置、スケール、方向などの情報を含む特徴記述子を生成します。   特徴抽出と特徴記述は、画像認識のタスクにおいて重要な役割を果たします。適切な特徴抽出と特徴記述の選択と設計は、画像間の類似性やパターンの識別において精度や効果を左右する重要な要素です。   3-3機械学習アルゴリズムの適用 画像認識における機械学習アルゴリズムは、画像データから特徴を学習し、パターンやオブジェクトの認識や分類を行うために使用されます。以下に、機械学習アルゴリズムの適用について説明します。 教師あり学習 教師あり学習は、ラベル付きの訓練データを使用してモデルを学習する手法です。画像認識では、画像データとそれに対応するラベル(クラスやカテゴリ)が与えられます。代表的な教師あり学習アルゴリズムとしては、サポートベクターマシン(SVM)、決定木、ランダムフォレスト、ニューラルネットワークなどがあります。これらのアルゴリズムは、画像データの特徴を抽出し、学習データのパターンを学習して、未知の画像データの分類や認識を行います。 教師なし学習 教師なし学習は、ラベルのないデータからパターンや構造を抽出する手法です。画像認識においては、クラスタリングや次元削減などの手法が使用されます。クラスタリングは、似た特徴を持つ画像データをグループ化する手法であり、類似したパターンを持つ画像を自動的に抽出します。次元削減は、画像データの次元を減らす手法であり、高次元の特徴をより低次元の特徴に変換することでデータの表現を簡略化します。 深層学習 深層学習は、多層のニューラルネットワークを使用して画像データを学習する手法です。深層学習モデルは、階層的な特徴抽出や表現学習が可能であり、大規模な画像データセットから高度な特徴を自動的に学習することができます。代表的な深層学習モデルとしては、畳み込みニューラルネットワーク(CNN)やリカレントニューラルネットワーク(RNN)があります。これらのモデルは、画像認識のタスクにおいて非常に高い性能を発揮しています。   機械学習アルゴリズムの適用には、データの前処理、モデルの設計、ハイパーパラメータの調整などが必要となります。また、十分な量の訓練データや計算リソースが必要となることもあります。しかし、適切に選択された機械学習アルゴリズムと適切な設定により、高度な画像認識の性能や精度を実現することができます。   4.画像認識の利点と課題 画像認識は多くの利点を持ちながらも、いくつかの課題も抱えています。以下にそれぞれの詳細を説明します。   4-1画像認識の利点─効率的なデータ解析と自動化の可能性 非侵襲性 画像認識は非侵襲的な方法であり、被験者や対象物に身体的な接触を必要としません。このため、医療診断やセキュリティ監視など、様々な領域で利用されます。 高速処理 近年のハードウェアの進化と高速なアルゴリズムの開発により、画像認識はリアルタイムでの高速処理が可能となりました。これにより、自動運転、監視システム、製品品質管理など、リアルタイムの応用が実現されています。 大規模なデータ処理 画像データは非常に大量であり、画像認識は大規模なデータ処理に対応できます。機械学習アルゴリズムや深層学習モデルの利用により、大量の画像データから特徴を学習し、効果的な認識や分類を行うことができます。 4-2画像認識の課題─データ品質や倫理的な問題への対応 データの品質とバリエーション 画像データの品質やバリエーションは、画像認識の精度に影響を与える重要な要素です。画像の解像度、照明条件、視点の違いなど、さまざまな要素が画像データに影響を与える可能性があります。これらの要素に対処するためには、データの前処理やデータ拡張技術が必要となります。 クラスの不均衡 画像認識のタスクでは、クラスの不均衡が発生することがあります。つまり、特定のクラスのデータが他のクラスに比べて極端に少ない場合です。このような場合、モデルは頻繁に出現するクラスに偏って学習する傾向があります。不均衡データの扱いには、適切なサンプリング方法やクラスの重み付けが必要です。 モデルの解釈性 深層学習モデルなどの複雑なアルゴリズムは、高い認識精度を達成する一方で、その内部の仕組みや意思決定プロセスの解釈が難しい場合があります。特に医療診断や法的な証拠の提供など、解釈性が重要な場面では課題となることがあります。 プライバシーと倫理の問題 画像認識の技術は、個人のプライバシーや倫理的な問題にも関連しています。顔認識技術の普及や監視カメラの使用など、個人情報の保護や倫理的な配慮が求められる場合があります。   これらの利点と課題を考慮しながら、画像認識の技術はさまざまな分野で活用されています。   5.画像認識の将来の展望 画像認識の将来の展望は非常に興味深く、多くの可能性を秘めています。以下にいくつかの展望を紹介します。 高度な精度と汎化能力の向上 深層学習の進化により、画像認識の精度は飛躍的に向上しましたが、まだ課題が残っています。将来的には、さらなるアルゴリズムの改善やトレーニングデータの多様性に基づくモデルの改良により、さらに高い精度と汎化能力が期待されます。 リアルタイム処理の向上 現在の画像認識システムは、一般的には静止画や事前に収集されたデータに対して処理が行われます。しかし、将来的にはリアルタイムでの画像認識が求められるシナリオが増えると予想されます。例えば、自動運転車やロボットの制御など、リアルタイムの環境における高速かつ正確な画像認識が必要となります。 マルチモーダルな認識への拡張 画像認識は視覚的な情報を利用していますが、将来的には他のセンサーやデータとの統合が進むことが予想されます。例えば、音声やセンサーデータなどと組み合わせることで、より高度なマルチモーダルな認識が可能になるでしょう。 小型化と省エネルギー化 深層学習モデルは通常、大量の計算リソースを必要とするため、高性能なハードウェアが必要です。将来的には、モデルの小型化や効率化、省エネルギー化が求められます。これにより、エッジデバイスやモバイルデバイスなど、リソースが限られた環境でも画像認識の利用が広がる可能性があります。 倫理とプライバシーへの配慮 画像認識の普及に伴い、倫理的な問題やプライバシーの懸念が浮上しています。将来的には、個人情報の保護やバイアスの排除など、より公平で倫理的な画像認識システムの開発と運用が求められるでしょう。   これらの展望は、技術の進化や社会的な要求に応じて進められるものです。画像認識の発展により、私たちの生活やさまざまな産業において、より便利で効果的なソリューションが提供されることが期待されます。 資料ダウンロード
    • 2021.09.24
    • AI
    • 画像認識とは?仕組みやAI(人工知能)による画像処理、最新の活用事例を解説
    • 画像認識とは? 画像認識とは、画像から特徴をつかみ、対象物を識別するパターン認識技術の一つです。 具体的には例えば、画像に映っている物体は何であるか、という判断をコンピュータに行わせ画像を認識させます。人間は写真などの画像を見れば、どのような場所に何が映っているか、自身の経験から推測することができます。 しかしながら、コンピュータには人間のような記憶の蓄積や経験はありませんから、もしコンピュータに「猫」の画像をただ与えても、コンピュータはそれを「猫」だと認識はしてくれません。 そこで、画像認識ではコンピュータにデータベースから大量の画像を与え、対象物の特徴をコンピュータに自動的に「学習」してもらいます。すると、コンピュータは画像データから猫の特徴を「理解」し、同じ特徴を持った画像が与えられれば、それを「猫」だと推測することができます。 近年この画像認識の分野はAIにおけるディープラーニング技術の向上により、急速に発展しました。この記事では今ホットな技術領域である画像認識について、その仕組みや歴史、その活用例について、丁寧に解説していきます。 ▷関連記事:AI(人工知能)を説明できますか? ■目次■ 1.画像認識とは? 2.画像認識の仕組み ー画像認識の手法ー機械学習 ー画像認識の精度を高める「ディープラーニング(深層学習)」 ー画像認識のプログラミングに適しているPython 3.画像認識の歴史 ーもっとも古い画像認識「バーコード」 ー画像を単純に比較する「テンプレートマッチング」 ー画像認識を飛躍的に向上させた「ディープラーニング」 4.画像認識の種類と機能 ー物体認識 ー顔認識 ー文字認識 5.AIを生かした画像認識と一般的な画像認識の違い 6.画像認識の発展の理由 ーAI技術の発展 ー画像認識とディープラーニング ービッグデータの出現 ー高精度カメラデバイスの普及 7.画像認識で解決できる課題 8.画像認識を活用した最新事例 ーOsaka Metroが顔認証を用いた次世代改札機の実証実験を開始 ーヤマダ電機の顔決済 ーコミュニケーションロボットに画像認識機能を搭載 ー顔認証+検温で感染症対策 ー顔認証が進める美容チェーンにおけるDX 9.画像認識の未来 10.まとめ 画像認識の仕組み 画像認識ではコンピュータに画像から特徴量を抽出させ、その特徴量をもとにその画像が映っているものを判断してもらいます。 ただし、コンピュータの判断の仕方は人間のものとは異なります。画像を表すピクセルデータに対し何かしらの演算を行い、特徴量を算出するという数学的な方法をとります。 ここでは、どのような仕組みで画像認識ができるのか解説します。 画像認識の手法ー機械学習 コンピュータにとっての画像認識能力の向上とは、その演算方法や、演算に使用するパラメータの変更を意味します。つまり、できるだけ精度よくコンピュータに画像認識してもらいたいなら、その計算モデルやパラメータをできるだけ質の高いものにする必要があります。 そのためには何をしたらよいでしょうか? すぐ思いつく一つの方法は、良い正答率が出るまで人間が演算方法やパラメータを調整することです。しかしこれでは途方もなく労力を要し、効率的ではありません。そのため、画像認識では「機械学習」を行わせます。 機械学習とは、コンピュータが自ら学習していくシステムのことです。この方法では、コンピュータがどのように演算を行っていくかと、どのようなルールに従ってパラメータを修正するかだけを人間が設定し、あとは機械が大量のデータをもとに自動的にパラメータを修正していき、最適化してくれます。 学習が進むにつれコンピュータの認識率は向上していき、最終的には画像データから特徴を抽出し、正確な判断ができるようになります。ただし、コンピュータも与えたモデルが適さなかったり、データの量、質が悪いとなかなか画像の認識精度を上げることができません。そのため目的に合わせて適切なモデルとデータセットを選択する必要があります。 画像認識の精度を高める「ディープラーニング(深層学習)」 画像認識では畳み込みニューラルネットワークと呼ばれるネットワークモデルがよく使用されます。このモデルは、人間の脳内の神経回路網を表現したニューラルネットワークと呼ばれるネットワークモデルの発展版です。このモデルの特徴は、画像のピクセルデータを人間が抽象ベクトルに変換せず、画像データのままコンピュータに特徴抽出を行なわせることです。 畳み込みニューラルネットではまず、画像データの一部分にフィルタをかけ演算し、その領域をスライドさせて繰り返していく「畳み込み」を行い、特徴マップを生成します。この処理によって、画像が持つ局所的な特徴を抽出することができます。このようにしてコンピュータは画像の特徴を繰り返し抽出し対象物を推測し、また正解データで答え合わせをして学習しながら、画像認識の精度を高めていくのです。この多層化されたニューラルネットワークの学習の仕組みをディープラーニングと呼んでいます。 画像認識のプログラミングに適しているPython ちなみに、画像認識を含むAIのプログラミング言語として、最近ではPythonが主流になっています。皆さんも名前ぐらいは聞いたことがあるでしょう。 このPythonは、少ないコードで簡潔にプログラムを書けること、専門的なライブラリが豊富にあることが特徴として挙げられます。Pythonは、コードを書きやすく読みやすくするために生まれたプログラミング言語なので、だれが書いても同じようなコードになるようになっています。つまり汎用性があるということです。 また、Pythonはweb上に数万にも上るライブラリが存在します。既存のライブラリを有効活用することで、自分の作りたいプログラムを作成することが容易にできるのです。Pythonによって開発された代表的なWebアプリケーションとして、Instagram、YouTube、Evernote、DropBoxなどが挙げられます。 Pythonは、機械学習を用いたソフトウェアの開発の分野で広く活用されています。コードが簡潔であるだけでなく、初めて機械学習を学ぶ人にとっても習得しやすい言語であるため、機械学習を学ぶ際には基本のプログラミング言語といえます。代表的なものとして、TensorFlow(テンソルフロー)という機械学習ライブラリがディープラーニングの分野で活用されています。 ちなみにトリプルアイズ では、Python学習も含むAIエンジニア育成プログラム「AT20」を提供しております。 通信教育方式で毎週の課題をこなしながら実務で通用するAIエンジニアリングの技能を身につけるこのプログラムは、入門コースからエンジニア中級コースまで、習熟度に合わせて学習スケジュールを決められる4つのコースを設けておりますので、AI学習にご興味ある方はお問い合わせください。 AT20の公式HP 画像認識の歴史 ディープラーニングの登場によって近年話題となっている画像認識ですが、実は昔から存在し、意外にも歴史の古い技術になります。 現代では、画像認識には機械学習と呼ばれるパターン認識技術が当然のように使用され、さらにはディープラーニングの登場により、人間に近い画像認識率を示すまでに至っています。 しかし、コンピュータが画像を認識することは、照明の明るさやピントのずれなどの画像のノイズ、対象物の向きなどの影響を受けやすいといった問題も多く、そもそもは容易なことではありません。ここではその画像認識発展の歴史の一部を振り返っていきます。 もっとも古い画像認識「バーコード」 もっとも古い画像認識では1940年代の「バーコード」があります。バーコードとはバーとスペースの組み合わせにより、数字や文字を機械が読み取れる形で表現したものです。これをバーコードスキャナと呼ばれる光学認識装置を使って読み取ります。 見かけは画像と呼ぶにはシンプルすぎると感じるかもしれませんが、画像のパターンから情報を読み取っている点ではこれも立派な画像認識といえます。 画像を単純に比較する「テンプレートマッチング」 従来の画像認識ではテンプレートマッチング等が使用されてきました。これは画像に映る物体の位置を検出する画像検出と呼ばれる技術の一つです。 この方法では検出したいものの画像そのものをテンプレートとし、対象の画像の一部分との類似性を、その領域をスライドしながら単純に比較していきます。この方法によって、対象の物体が画像内のどこに映っているか、いくつ映っているかといった情報を画像から抽出することができます。 しかしこの方法は照明変化が大きい場合など、テンプレート画像からの変化が激しい場合に、認識率が大きく下がってしまう弱点があります。また認識したい対象ごとにテンプレートが必要という点に関しても、有用性に問題があります。 画像認識を飛躍的に向上させた「ディープラーニング」 2000年代になると計算機の発展により、データを高速に処理可能になりました。この変化により大量の画像データを用いた機械学習による画像認識を行うことが可能となり、画像認識技術はそれまでの人手によるルールやモデル構築からパターン認識へと移行していきます。 そして2012年、ディープラーニングが登場し世界に衝撃を与えました。画像認識コンテストILSVRCで、カナダ・トロント大学のヒントン教授らのグループが画像認識に対して初めてディープラーニングを適用し、一年前の優勝記録の誤り率から4割も削減し、圧勝しました。 ▷参考:https://www.cs.toronto.edu/~hinton/ またその一方でGoogleは同年、人が教えることなく、ディープラーニングにより、AIが自動的に猫を認識することに成功しました。このようにディープラーニングは画像認識の領域で大きな成果を上げ、その能力の高さを世の中に見せつけます。さらに2016年のアルファ碁の登場で第三次AIブームが到来し、今日では画像認識AIはすでに産業界で実用化される段階にまで到達しました。 ▷関連記事:画像認識技術の違いがわからない 画像認識の種類と機能 ひと口に画像認識技術といっても、画像の種類によって対象の形状や色、複雑さ、データの数などで差が生じます。そのため扱う画像データによって技術領域を分類することができます。ここではその代表的なものを簡単に紹介していきます。 物体認識 物体認識とは、例えばある物体と同一の物体が画像中に存在するか検証する、画像に映っている物体のカテゴリを言い当てるなど、画像に含まれている物体の情報を抽出する技術です。 この物体認識において重要となる技術として、物体検出と呼ばれる技術があり、しばしば両者は区別して使われます。 物体検出は画像中の対象物体の位置を検出する技術であり、物体認識とは実行方法が異なりますが、対象となる物体の特徴を抽出する際その物体の位置はしばしば重要となるので、併用されることがあります。 顔認識 顔認識は顔画像から目立つ特徴を抽出する技術です。顔認識を利用すれば、顔の識別、照合や似た顔の検索、顔のグループ化などが行えます。 人間の表情から感情を読み取る感情認識についても研究が進められています。また物体認識の場合と同様に顔検出と呼ばれる技術もあり、やはり併用されます。 文字認識 文字認識とは、紙に書かれた手書きの文字や、印刷文字などを判別する技術です。これにより、例えば画像内のテキストを抽出することができます。古くから研究されている分野ですが、最近では翻訳技術と合わせたシステムが実現されるなど、利用用途の多い技術でもあります。 AIを生かした画像認識と一般的な画像認識の違い ここまで画像認識やAI、ディープラーニングなどに関して書いていきましたが、改めてAIを導入した画像認識と一般的な画像認識では何が異なるのでしょうか。 そもそも人工知能(AI)とは、人間の知的なふるまいをコンピュータで模倣したシステムを指します。つまり、限定された領域であっても、人間のような知能を持っているシステムのことを意味します。ただの機械であれば、人間が与えた指示の通り情報処理を行うだけです。 ディープラーニングの登場によって、人間によるデータの特徴抽出を行わず、与えられた画像データから最初から最後まで自動的に特徴抽出してくれるようになりました。ここでは人は対象のデータセットの特徴量を定義する必要すらないのです。 そしてそれにより、大量のラベル付けさせたデータと高度なコンピュータの処理能力があれば、高いレベルの認識精度に自動的に到達していきます。ゼロからアルゴリズムを考え出す必要がない分、人間への負担も軽減されます。 これは学習能力のない、または人間が特徴量を定義する一般的な画像認識にはできないことになります。またこの進歩は人の介入を遠ざけることができるという、重要な意味も持ちます。AIの導入によって、機械の物体認識はより人間に近づき、より自律的に考えるように進歩したのです。 画像認識の発展の理由 画像認識はディープラーニングなどのAI技術と関わりながら発展してきました。ここではなぜ画像認識がAIにより発展していったのかについて背景をみていきます。 AI技術の発展 1950年代後半からコンピュータによる推論や探索が可能となり第一次AIブームが訪れて以来、AIはブームと冬の時代を交互に経験しました。 そして現在、ディープラーニングの登場をきっかけに、AI、IoT、ビッグデータをキーワードに第三次AIブームが訪れています。 第三次AIブームを巻き起こしたのは、囲碁AIの劇的な進化です。2016年3月10日、韓国ソウルのフォーシーズンズホテルで当時世界トップクラスと目されていたプロ棋士を、天才デミス・ハサビス率いるGoogle DeepMindの囲碁AI「アルファ碁」が負かしました。コンピュータが囲碁で人間を超えるのは10年以上先と見られていたので、その急速な進化に世界は驚かされたのです。 現在、三度目のブームを迎えた人工知能は画像処理や音声処理、自然言語処理などのあらゆる分野に適用されています。 トリプルアイズ では、2014年から囲碁AIの研究開発を進めてまいりました。画像認識技術の基礎研究は囲碁AIによって鍛えられると考えたからです。前述のGoogleやFacebook、テンセントなど名だたる世界企業と競い、2019年には世界大会で2位という好成績をおさめることができました。 囲碁AI開発で培った技術力が実を結び、2019年には、「画像認識プラットフォーム・AIZE」をローンチし、顔認証AI技術をビジネスや社会に提供しています。 画像認識とディープラーニング 昨今話題となっているディープラーニングですが、実は提案されたのは2006年であり、2012年のILSVRCで話題になるまで随分と時間を要しています。これは、ディープラーニングでは過学習が起こりやすいことが原因にあります。 そのためディープラーニングの適用には工夫が必要となりますが、画像認識で用いられている畳み込みニューラルネットワークでは多層にしてそのまま学習が行えるため、明らかに性質が異なります。 この相性の良さにより、ディープラーニングは画像認識領域で頻繁に使用されてきました。このことが近年の画像認識技術の大幅な進歩につながったのです。 ビッグデータの出現 画像認識おいて、コンピュータが学習するためには大量の画像データが必要になります。インターネットの普及によって、それが可能になったことで、ディープラーニングの精度が高まりました。 インターネットなしに猫の画像を集めるのは限りがありますが、インターネット上では瞬時に猫の画像を何千万枚も取得することができます。大量のデータを与えれば与えるほどAIは賢くなります。 今後、5Gによって高速大容量通信が可能になることで、ますます画像認識の技術は発達していくでしょう。 高精度カメラデバイスの普及 スマホで画像や動画を撮ることが当たり前の世の中になりました。画素数の飛躍的な増大で分かるとおり、その性能はデジタルカメラに劣ることはありません。しかも撮った画像はすぐにSNS上にアップされます。 また、カメラはスマホに限らず様々なものに搭載されるようになりました。いつでもどこでもどこからでも画像がweb上に送られる環境が整ったことで、画像認識AIの学習機能が飛躍的に高まりました。 画像認識技術の発展は、ひとえにディープラーニングのおかげと言えるでしょう。そしてディープラーニングが数年であっという間に実用化できた背景には、「ビッグデータの取得が用意になったこと」「アルゴリズムの最適化」「計算資源としてのハードウエア(PC)の高速化」が挙げられます。 顔認証の分野は、2020年から始まったコロナ感染症の世界的な流行により、大きな転機を迎えました。世界中の人々がマスクをすることによって、顔認証の精度が著しく低下してしまったためです。 そのため、国内外のAI企業は、マスク装着時の顔認証精度向上に努め、これによって顔認証の技術は1段階上のレベルへと到達する事ができました。大きな危機を迎えることによって、イノベーションが起こったのです。トリプルアイズ でも、2021年4月には顔認証マスク装着バージョンをリリースしました。詳しい開発の経緯は下記でご覧ください。 「マスクでも顔認証が可能に 〜AIエンジニアに聞くコロナ禍でのAI技術の進化」 画像認識で解決できる課題 画像認識技術が発達したことによって「コンピュータが眼を持った」と言われるようになりました。しかも、見る能力においては人の目よりも高精度であり、解析の能力においては人間を遥かに凌駕する演算能力を有しています。 この画像認識技術によって、下記のような課題が解決されると期待されています。 ①支援型:従来の人の業務を支援する 画像認識技術によって省力化、生産性向上につなげます。 顔認証によるスマホ、PCへのログイン 行政手続きにおける本人確認の簡素化 顔認証によるオフィスや工場での勤怠管理 店舗における接客業務のサポート ②代行型:従来の人の業務を代行する 画像認識技術によって無人化を進め、人手不足解消に寄与します。 防犯カメラによる各種監視 顔決済によるキャッシュレスレジの実現 顔認証による入退室管理 顔認証による空港での搭乗手続き 地下鉄、鉄道での顔認証による改札 各種eKYCのなりすまし防止 ③拡張型:人のスキルを拡張した業務を行う 画像認識技術によってこれまで人の能力では不可能だったことを実現します。 自動運転における道路状況把握 顔認証によるマーケティングデータの解析 物体検知による損傷部位検査 画像による人流測定、群衆分析 ドローンと画像分析による農業サポート 画像認識を活用した事例 画像認識技術は身近なところに使われています。ここでは、顔認証技術を用いた課題解決の実例を紹介します。 Osaka Metroが顔認証を用いた次世代改札機の実証実験を開始 引用元:https://www.osakametro.co.jp/ Osaka Metro(大阪市高速電気軌道株式会社)は、顔認証を用いた次世代改札機の導入に向けた取組みを進めており、2019年12月10日(火曜日)から御堂筋線大国町駅など4つの駅で社員を対象とした実証実験を行っています。 改札機に備えつけたカメラで顔を捉え、事前登録した顔写真データと照合・承認により改札ゲートを開閉するという仕組みです。Osaka Metroでは、2024年度には全駅で顔認証によるチケットレス改札の導入を目指しています。 ▷参考:顔認証を用いた次世代改札機の実証実験を開始します(2020年9月30日変更) ヤマダ電機の顔決済 引用元:https://www.yamada-denki.jp/ 2020年2月28日、大手家電量販店のヤマダ電機は量販店では日本で初めてとなる顔認証決済サービス「ヤマダPay」をスタートしました。 お客さんは、あらかじめスマホから自分の顔画像を登録しておくことにより、来店時にはタブレットに顔をかざすだけで買い物ができる仕組みです。財布もカードも不要な新しい消費スタイルが登場しました。この本人認証を受け持つ顔認証AIにはトリプルアイズの画像認識プラットフォーム・AIZEが採用されています。 参考:LABI カード会員「ケータイ de クレジット」に顔認証決済サービス「ヤマダ Pay」導入のお知らせ 参考:5分でわかるAIZE 参考:顔認証のAIZE・AIを使った課題解決型顔認証ソリューション コミュニケーションロボットに画像認識機能を搭載 可愛い身振りで応答するコミュニケーションロボットSota(ヴイストン社)に、新たに画像認識機能が搭載されました。目の機能を受け持つ画像認識機能はトリプルアイズの画像認識プラットフォーム・AIZEが採用されています。 受付や店頭でお客様の顔を覚えて応答することで、接客機能が大幅に向上しました。またお店の管理画面には来店客の属性がデータとして蓄積され、店舗運営に役立ちます。このAIロボットは、銀座メガネ全店に導入され活躍しています。 参考:地域密着型のメガネ店がAIZEとロボットを全店導入 顔認証+検温で感染症対策 コロナ禍において、非接触で簡単で、かつ精度が高い検温システムが求められています。顔認証と検温機能が一つになったサーモグラフィーは、飲食店や美容院、工場、学校、病院など様々なシーンで利用されています。 画像認識プラットフォーム・AIZEが搭載されたAIZE Biz+は、管理画面に顔画像と時刻、体温が表示されることから、万一感染者が発生しても、2週間前に遡ってトレースすることができます。 参考:コロナ対策だけじゃ終わらない。ビジネスの常識が変わりはじめた今こそAI導入を! 顔認証が進める美容チェーンにおけるDX 北海道から福岡まで全国21店舗を展開するシェアサロンGO TODAY SHAiRE SALONでは、タブレットでの来店受付、スマートマットでのシャンプーなどの自動発注、さらに自社アプリの開発を進め、多くの業務を自動化しています。タブレットの受付は一般企業ではよく使われるがサロンでは珍しいもの。スマートマットはホテルなどでよく使われるシャンプーの中身が空に近づくと自動で発注してくれるツールです。 さらにコロナ禍において、スマートでスムーズな感染症対策ツールとして、AIZE Biz+を導入しました。メインクルーの出退勤と検温が1台の端末で完結するとともに、お客様や関係業者を含む、店舗に出入りするすべての人の検温が1台で完結。 また、AIZE Research+を併せて導入することで、メインクルー・お客様の属性データの取得ができ、顧客管理や新サービス導入の際のマーケティングデータとしての活用が可能となりました。 シェアサロンという、美容師の働き方を大きく変えるビジネスモデルを開発した同社にとって、顔認証をはじめとするITツールはもはや欠かせないものになっています。 画像認識の未来 画像認識技術はAIの導入とともに大きく発展しました。物体認識AIは人間と互角の正答率を示し、すでに各業界で実用化が進められています。またIoT技術の発展やビッグデータの活用によって、さらに画像認識技術の活用の幅は広がっていくことが予想されます。 そして顔認識の精度向上や感情認識技術の確立などの技術的な進歩や、動画データなどに対し音声データや言語翻訳におけるAI技術と合わせた技術の開発により、さらなる盛り上がりが期待されます。 まとめ 画像認識について理解が深まったでしょうか?画像認識の技術は、すでに街中の至る所で用いられていますが、その技術はAI(人工知能)のディープラーニングの進化とインターネットによって持たらされたものです。 画像認識技術によってコンピュータが眼を持つことができました。その眼は大量のデータを高速で処理できることや精細な分析機能を持つことから、すでに人間の眼を超えていると言っていいでしょう。 顔認証技術が普及することで、本人認証がポイントとなる行政サービスや金融サービスがガラッと変わることでしょう。コンビニの決済や駅の改札も顔パスになるのはそんなに遠いことではありません。 もっと詳しく画像認識のサービスを知りたい方はこちらまで。   資料ダウンロード
    • 2020.10.21
    • AI
    • 画像認識技術の違いがわからない
    • [ez-toc] ー顔認識API各社の比較 顔認識AIでできること 顔認識システムとは何でしょうか? 顔認識システムとは「画像データや映像データ上にある人の顔から自動的に情報を読み取ることができるシステム」を指します。 つまり、カメラなどから得られる画像データ上の人の顔から情報を抽出し、年齢や性別やその時の感情など、その人を特徴づける情報を得ることができるシステムです。 人は画像上の顔を見たとき、その人が今まで出会った大勢の人の記憶をもとに、その人の性別、おおよその年齢や国籍など、その人を特徴づける情報をパターン認識で推測することができます。 この特徴抽出をコンピュータに大量の顔画像データを与え、学習させることで行わせることができます。コンピュータは学習が進むにしたがって、人の顔の特徴を次第に理解していき、目や口の数などおおざっぱな特徴から、認識した顔の特徴抽出、顔のグループ化、2つの顔が同一人物のものであるかの判断など、次第に高いレベルの認識能力を獲得していきます。 2012年にAIにおけるディープラーニング技術により、画像識別率が大きく上昇しました。2014年にFacebookが発表したDeepfaceはこの技術を顔認識に導入し、2枚の写真に映る人物が同一人物であるかどうかの判断で人間とほぼ互角の顔識別精度(97.25%)を実現ました。 このように人間と同等の識別能力を持つAIを用いれば、例えばカメラから得た顔画像と顔データベースを利用し個人を特定することができます。これは顔認証システム、つまり「顔パスシステム」を可能にし、指紋認証のように接触を行う必要のない、非接触なセキュリティシステムの実現ができます。これは例えば入出管理を要する部屋が多い病院で非接触のセキュリティ管理が可能となり、感染症対策に貢献できます。 また、カメラの顔画像から年齢・性別の情報を読み取れば、顔認識AIをマーケティングに活用することができます。例えば街頭のデジタル広告にカメラを設置すれば、どのような顧客層がどれくらいの時間どのような広告に興味を持っているかをAIに推測させることができます。 このように顔認識AIは高い識別能力を持ち、カメラから個人を特定したり、情報抽出を行えるため幅広く利用されています。   細かい技術の違い 顔認識では機械学習という技術を使い、大量のサンプルデータを用いてパターン認識を行います。 機械学習とは、学習データから特徴量を抽出し、データの正解の特徴量との差を比較しフィードバックすることで、自動的にパラメータを更新するアルゴリズムです。特徴量を定義してコンピュータに顔画像データを学習させれば、コンピュータは顔の特徴を認識してくれます。具体的にはあらかじめ大量の顔画像から学習を行わせておき、対象の画像から、輪郭、目、眉、口などの顔の部品の場所を探し、それらの配置パターンから年齢、性別、表情などを判断します。 しかしながら物体認識に対し顔認識は、顔の向き、表情、性別、人種等によって影響を受け、個人差も生じることから一般的には難しいと考えられます。仮に制限された環境下で高い認識率を示せても、汎用的な識別機を作ることは難しく、またデータの少ないマイノリティーを苦手とする傾向もあります。 しかし顔認証システムへの応用等を考える場合、顔認識の精度は十分な信頼感が得られなければなりません。顔認識を実現するために提案されたパターン認識手法は多くありましたが、AIブームが到来する以前は、実環境下での利用はまだ難しい状況でした。 2012年に登場したディープラーニングは画像認識技術を急速に発展させ、2014年には顔認識AIは人間と同等レベルの認識精度を示します。この技術的進歩により、顔認識はカメラからの画像データを用いての実環境下での利用が可能になりました。 ディープラーニングを用いた顔認識の従来のものとの大きな違いは、特徴量の定義も自動的に行うことができる点にあります。それにより人間の介入を遠ざけ、さらに多層構造を構築することでより抽象的にデータの特徴を抽出することができるのです。   顔認識APIの企業ごとでの違い 現在各企業が発表している顔認識APIにはどのような違いがあるのでしょうか。ここでは主要な顔認識APIサービスを紹介します。   IBM-Watson Visual Recognition API   画像引用元: IBM:Watson Visual Recognition API IBMが提供するWatson Visual Recognition APIは、顔検出、年齢推定、性別推定が可能です。GUI上でオリジナル画像認識AIを作ることができます。 参考サイト: IBM:Watson   Microsoft―Face API   画像引用元: Microsoft―Face API Microsoftが提供するFaceAPIは顔検出、感情推定、顔の向き、年齢推定、性別推定が可能です。個人の顔を識別し、似ている者同士をグループ化できます。 参考サイト: Microsoft:Face API   Google―Cloud Vision API   画像引用元: Google:Cloud Vision API Googleが提供するCloud Vision APIは顔検出、感情推定、顔の向きが抽出可能であり、対象の画像と似た画像をウェブ上から探すことができます。 参考サイト: Google:Cloud Vision API   トリプルアイズ―AIZE API     トリプルアイズが提供するAIZE APIは、画像内の顔と属性、感情を認識する 顔検出 や画像の顔を特定の人物と照合する 顔認証 などの機能があります。 AIZEの各サービス (AIZE Research、AIZE Biz、AIZE Securityなど) の機能をAPI経由で利用できるところが最大の特徴です。 AIZE APIサイト:API     資料ダウンロード
    • 2020.08.28
    • AI
    • AI(人工知能)を説明できますか?歴史や活用事例、機械学習についてもご紹介
    • ■目次■ AI(人工知能)とは? ー機械学習とは? ーディープラーニングとは? AI(人工知能)の種類 AI(人工知能)の歴史 AI(人工知能)でできること AI(人工知能)の主な活用方法 AI(人工知能)の最新の活用事例 ーAIによる自然な対話応答を実現する電話応対AIサービス ー広告効果の高い人物モデルをAIで生成 ーAI技術が可能にする無人店舗 ー自動運転の実用化 ー農業×AI AI(人工知能)の発展によって起きる未来 AI(人工知能)とは? AI(Artificial Intelligence)は、日本語では人工知能と表されています。 AI(人工知能)の定義は、専門家の間でもまだ定まっていないのが現状です。さまざまな専門家がそれぞれの定義をしており、統一的な定義はありません。 Wikipediaによると人工知能(AI)は、「計算という概念とコンピュータという道具を用いて知能を研究する計算機科学の一分野」と説明されています。これだと少し言葉足らずな感じがしますね。専門家はどう定義しているのでしょうか。 「究極には人間と区別が付かない人工的な知能のこと」(公立はこだて未来大学・松原仁教授)、「人工的につくられた人間のような知能、ないしはそれをつくる技術。人間のように知的であるとは、“気づくことができる”コンピュータ、つまり、データの中から特徴量を生成し、現象をモデル化することのできるコンピュータという意味である」(東京大学・松尾豊教授)、「人間の頭脳活動を極限までシミュレートするシステムである」(京都大学・長尾真教授)。 どうでしょうか。少しイメージが湧いてきたかと思います。 現在我々が人工知能と指しているものの大半は機械学習(machine learning)と呼ばれるものです。 機械学習とは? 機械学習の定義もここで説明したいと思います。 機械学習も人工知能と同様に様々な定義がなされていますが、Wikipediaでは「明示的な指示を用いることなく、その代わりにパターンと推論に依存して、特定の課題を効率的に実行するためにコンピュータシステムが使用するアルゴリズムおよび統計モデルの科学研究」と紹介されています。 よく引用されている定義としてトム・M・ミッチェルの「コンピュータプログラムが、ある種のタスクTと評価尺度Pにおいて、経験Eから学習するとは、タスクTにおけるその性能をPによって評価した際に、経験Eによってそれが改善されている場合である」という定義を挙げています。 これはかなり数学的な定義なのでもう少しかみくだくと、「コンピュータに大量のデータからパターンやルールを発見させ、それをさまざまな物事に利用することで判別や予測をする技術」と説明することができます。 つまり機械学習とは、コンピュータが自ら学習していくシステムのことです。この方法では、コンピュータがどのように演算を行っていくかと、どのようなルールに従ってパラメータを修正するかだけを人間が設定し、あとは機械が大量のデータをもとに自動的にパラメータを修正していき、最適化してくれます。 学習が進むにつれコンピュータの認識率は向上していき、最終的には画像データから特徴を抽出し、正確な判断ができるようになります。ただし、コンピュータも与えたモデルが適さなかったり、データの量、質が悪いとなかなか画像の認識精度を上げることができません。そのため目的に合わせて適切なモデルとデータセットを選択する必要があります。 ディープラーニングとは? AIに関する記事を読むと、機械学習とともに、「ディープラーニング」という言葉も頻繁に出てきます。 「ディープラーニング」とは、人間の脳のネットワークをヒントに、データの分類基準を人間が設定しなくても、機械自らが特徴を抽出する手法です。 例えば、画像認識では畳み込みニューラルネットワークと呼ばれるネットワークモデルがよく使用されます。このモデルは、人間の脳内の神経回路網を表現したニューラルネットワークと呼ばれるネットワークモデルの発展版です。このモデルの特徴は、画像のピクセルデータを人間が抽象ベクトルに変換せず、画像データのままコンピュータに特徴抽出を行なわせることです。 畳み込みニューラルネットではまず、画像データの一部分にフィルタをかけ演算し、その領域をスライドさせて繰り返していく「畳み込み」を行い、特徴マップを生成します。この処理によって、画像が持つ局所的な特徴を抽出することができます。このようにしてコンピュータは画像の特徴を繰り返し抽出し対象物を推測し、また正解データで答え合わせをして学習しながら、画像認識の精度を高めていくのです。この多層化されたニューラルネットワークの学習の仕組みをディープラーニングと呼んでいます。 ここまでの関係を図で表すと以下のようになります。 AI(人工知能)の種類 人工知能の種類を切り分ける切り口も様々な視点があります。今回は強いAIと弱いAI、汎用人工知能と特化型人工知能の2つの視点で分けたいと思います。 強いAIと弱いAIは哲学者であるジョン・サールが1980年に作った用語です。この2種類のAIの違いはAIの振る舞いがどのように生まれているかという点です。 強いAIの場合はAI自身が私たちのような知能や意識を獲得したことで、人間と同等の振る舞いをするものを指します。対して弱いAIは知能や意識は関係なく、機械的に人間と同じように振る舞うものを指します。 つまりこの切り分け方ではAIが真に知能を持っているか否かという視点から分けていると言えると思います。 汎用人工知能と特化型人工知能の違いはAIが何でもできるか、何かはできるかという点です。まず先に特化型人工知能の説明をすると、こちらは名前の通り何かしらかに特化したAIのことを指します。 例えば囲碁のAIであれば囲碁を打つことはできますが、文字を認識することや英語から日本語へ翻訳することはできません。 つまりそのAI固有の問題は解くことはできますが、それ以外の問題には対処できないというのが特化型人工知能です。対して汎用人工知能は人間のようにあらゆる問題を解くことができるAIのことを指します。 そのため、囲碁を打つこと・文字を認識すること・英語から日本語へ翻訳することもできます。現在実用化されているAIは特化型人工知能で汎用人工知能と呼べるAIは生まれていないと思います。 しかし汎用人工知能の研究も活発に行われているので汎用人工知能と呼べるAIもこの先、生まれるかもしれません。 AI(人工知能)の歴史 人工知能は2度のブームと冬の時代を経て、現在3度目のブームの最中と言われています。 第一次人工知能ブーム 最初のブームは1950年代から1970年代にかけてでした。ちょうどこの時代に人工知能という言葉も生まれました。1956年のダートマス会議で主催者であるジョン・マッカーシーによって史上初めて使われたのです。 またこの会議の発起人には人工知能の父とも呼ばれているマービン・ミンスキーや情報理論の考案者であるクロード・シャノンなどの著名な人物が名を連ねていました。 この時代は推論と探索の時代と呼ばれていて、コンピュータを用いて推論や探索ができるようになりました。これにより迷路やパズルなど特定の問題に対しては解を求めることができるようになりました。 当時も人工知能により様々な問題が解けるようになると期待されていましたが、現実の問題は研究者が思っていた以上に複雑なものでした。 その結果人工知能における重要な問題の一つであるフレーム問題や組み合わせ爆発などの問題に直面することとなりました。こうして人工知能が現実の問題には適用できないことが判明し、第一次人工知能ブームは冬の時代へと移り変わりました。 第二次人工知能ブーム 2度目のブームは1980年代から1990年代にかけて訪れました。この時代はエキスパートシステムという知識表現を活用した人工知能が流行りました。 エキスパートシステムは専門分野の知識を組み込むことで、まるで専門家であるかのように振る舞うことができるものです。例えば症状などをエキスパートシステムに伝えることで診断を行うことができました。 またこのブームの最中、1981年に日本では第五世代コンピュータプロジェクトが始まりました。570億円をかけた一大プロジェクトでした。これに海外の国々も反応し、人工知能研究への投資が活発になりました。 しかし、このブームも終わりを迎えます。 コンピュータ自身が知識を集め蓄積できなかった点やコンピュータが理解できる形に記述する必要があったことから、扱いが難しかったために再び人工知能は冬の時代を迎えることとなりました。 第三次人工知能ブーム 現在進行形である3度目のブームは2006年にジェフリー・ヒントンが発明したディープラーニングを端に発して始まりました。この技術は機械学習の手法の一つであるニューラルネットワークをよりディープにしたものでした。 この技術は人工知能において大きなブレイクスルーとなりました。ニューラルネットワークをはじめとした機械学習は特徴量をデータとして与えることで学習していました。この特徴量は人間の手で設計する必要がありました。 しかしディープラーニングでは特徴量を人工知能自身が抽出することができました。 さらにビッグデータやGPU利用による計算の高速化などにより目覚ましい発展を遂げています。例えば2012年にはILSVRCという大規模画像認識の競技会でディープラーニングを用いた手法が他の手法と比べて圧倒的な精度を叩き出しました。 また2015年にはチェスや将棋で人工知能が人間を凌駕していくなか、アマチュアの有段者レベルに留まっていた囲碁においてDeepMindが作成したAlphaGoが人間のプロ棋士に初勝利を収めました。 出典:www.asahi.com/articles/photo/AS20160310003814.html 囲碁の数千年の歴史をまったく変えてしまう事件ともいえる一手が打たれたのは、2016年3月10日、韓国ソウルのフォーシーズンズホテルでの一室のことでした。 その一手に碁盤を打つ音はありませんでした。人が打った手ではなかったからです。天才デミス・ハサビス率いるGoogle DeepMindの囲碁AI「アルファ碁」が選んだのは、人がかつて一度も打ったことのない手でした。 現在、三度目のブームを迎えた人工知能は画像処理や音声処理、自然言語処理などのあらゆる分野に適用されています。しかしまだ強いAIや汎用人工知能までの道のりは遠いと思います。もしかしたら今までのブームがそれぞれ別のアプローチをもった手法だったように機械学習やディープラーニングとは全く違ったところから次のブレイクスルーが生まれるのかもしれません。 AI(人工知能)でできること 現在の人工知能の主流であるディープラーニングは、教師あり学習・教師なし学習・強化学習の3つの学習手法を使うことで賢くなります。そして学習手法によりできることはそれぞれ違います。 まずは教師あり学習・教師なし学習・強化学習について説明し、それぞれの学習手法で人工知能は何ができるのかを説明します。 教師あり学習 教師あり学習ではデータとして入力データと教師ラベルが必要になります。入力データは人工知能への入力となるデータのことを指します。 変わって教師ラベルは入力データに対する答えを表すものです。 この学習手法では人工知能の出力が教師ラベルに近づくように学習します。学習を重ねることで学習初期では出鱈目だった出力が徐々に改善されていきます。主に分類や回帰といった問題を解くために使用されます。 分類 分類は入力データがどのクラスに分類されるかを予測するタスクです。例えば動物の画像を入力として与えると、どの動物であるのかを分類することができます。 ただし何に分類できるかは学習時のデータによります。犬と猫の画像データで学習させた場合、その人工知能は犬か猫の分類はできるようになりますが、ウサギなどの犬でも猫でもない画像が与えられた場合も犬か猫の分類しかできません。 そのため別の分類を行いたい場合はもう一度学習させる必要があります。 回帰 回帰は入力データを与えると何かしらかの数値を予測します。人工知能が何の数値を予測しようとするかは分類と同様に何を学習したかに依存します。 例えば体重から身長を予測したい場合は、体重を入力データとし身長を教師ラベルとして学習させることで可能になります。 教師なし学習 教師なし学習は教師ラベルを用いずに学習することができます。大量のデータから規則性や法則を見つけ出すことができます。 従って、時には人間が見つけられなかった規則を発見することもあるそうです。この学習手法はクラスタリングや次元削除のために使用されます。 クラスタリング クラスタリングは大量のデータを任意の数のクラスタに分割することです。データ同士の類似度や距離を使用し、似ているデータをひとまとめにしてクラスタにし分割します。 例えば数学と英語と国語の点数からなるデータがあった場合、三教科とも得意なクラスタ、数学と英語は得意なクラスタ、英語が得意なクラスタなどに分割することができます。 この時いくつのクラスタに分割するかは人間が決めることになりますが、どんなクラスタに分割するかは決めることはできません。そのためそこにどんな規則性が見られるかは人間が判断する必要があります。 次元削除 人工知能が扱うデータは得てして高次元なデータを使うことが多いです。次元削除を使うことでそういったデータの次元を削除し、低次元なデータにすることができます。 低次元にしたことでデータを圧縮することができ、高次元のため視覚化できなかったデータを人間が見える形に可視化できるようになります。 また教師あり学習の入力データに前処理として使用されることもあります。これにより計算量の削減などが可能になります。 強化学習 強化学習は試行錯誤を繰り返すことで最適な方策を見つけ出す学習方法です。基本的な構成要素として環境とエージェントが存在します。 囲碁で例えると環境は囲碁の盤面を意味し、エージェントはプレイヤーとなります。エージェントは環境に対して石を打つなどの行動をとることができます。 その結果、環境(盤面)の状態は変化します。エージェントは環境から状態と報酬を観測して次の行動を決めます。 この行動をどのように決めるか(方策)を、試行錯誤を繰り返し、状態・報酬など情報を用いて改善していくのが強化学習です。 AI(人工知能)の主な活用方法 ここではAI(人工知能)を活用することでどんな問題を解決できるかの具体例を挙げていきます。 画像認識 人工知能を活用することで画像内になにが写っているかを認識することができます。例えば文字を認識させることで手書き文字からテキストデータへの書き起こしを自動化させることができます。 ▷関連記事:画像認識とは?仕組みやAI(人工知能)による画像処理、最新の活用事例を解説 物体検出 画像から分類を行うとともに物体の位置も検出することができます。位置の検出を行うことで適切な位置に配置されているのかを画像から管理できるようになります。 また、別の画像処理を行うために余分な部分を削除する前処理として活用されることもあります。主な手法としてはFaster R-CNNやYOLO、SSDなどがあります。 自動着色 線画に対して自動的に色を付けることができます。この時、完全に自動的に全ての着色を任せることができますが、色の指定など使用者がコントロールすることは可能なようです。以下のリンクが自動着色のdemo動画になります。 Demo: YouTube:pixivSketch 自動着色機能 画像キャプション 画像に対する説明文を生成することができます。またこの類似した活用法としてキャプションから画像を生成したり、画像に対して質問を与えると答えを返したりすることもできます。 チャットボット テキストまたは音声を入力として与えることで応答してくれる、つまり会話することができます。この技術は別名人工無脳とも呼ばれています。有名なサービスとしてはMicrosoftの「りんな」があります 参考:Microsoft:りんな 翻訳 人工知能を使うことで翻訳することもできます。Google翻訳も人工知能を活用することで精度が向上しました。手法としてはTransformerと呼ばれるものを採用しています。この手法はGoogleが出したAttention is All you Needという論文で発表されたものです。 株価予測 過去の株価の情報で予測モデルを作ることで未来の株価を予測することができます。このとき具体的な株価を予測することもあるかもしれませんが、株価が前日より上がるのかまたは下がるのかを予測するのが一般的だと思います。また株価のような時間によって値が変化するようなデータのことを時系列データと言います。 推薦システム 推薦システムは購買者に対してお勧めの製品などを推薦することができます。このときどのように何をお勧めするのかという部分で人工知能は活用できます。 有名な手法としては協調フィルタリングがあります。これは閲覧履歴や購買履歴を利用することで類似する別の購買者と照らし合わせて推薦を行います。 ゲームAI 囲碁や将棋などのボードゲームやポーカーのようなカードゲーム、ビデオゲームなどのあらゆるゲームで人工知能が使われています。 このように人工知能はあらゆる場面で活用されています。また何に活用したいかで必要なデータや人工知能の手法は変わってきます。 よってどういった問題がどんなデータでどんな手法で解決されているのかを理解することはとても大切なことだと思います。 AI(人工知能)の最新の活用事例 最後に、AI(人工知能)を活用した最新の事例の一部をご紹介します。AI(人工知能)が私たちの生活にどのように活用されているのかがイメージしやすいと思います。 AIによる自然な対話応答を実現する電話応対AIサービス 引用:https://clova.line.me/line-aicall/ LINE AiCallは、LINE CLOVAのAI技術である音声認識と音声合成および会話制御の仕組みを組み合わせ、AIによる自然な対話応答を実現する電話応対AIサービスを提供しています。 これにより、飲食店や宿泊業などでは、来店予約の電話応対を含む予約管理の自動化を実現。限られた人員で店舗運営をしなければいけない環境でも、来店されたお客様への対応時間を拡大することができます。 また、LINEバイトでは上記の技術を用いて、求人応募・問い合わせチャネルとして電話窓口を追加。新たにコンタクトセンターを構築・運営することなく、自動応対電話窓口の設立を実現しました。 LINE AiCallはコロナ禍での行政窓口対応にも力を発揮し、厚生労働省の帰国者に対する健康フォローアップ架電や神奈川県での自宅療養者に対する安否確認・健康状態確認架電にも利用されています。 参考:https://clova.line.me/line-aicall/ 広告効果の高い人物モデルをAIで生成 引用:https://www.cyberagent.co.jp/news/detail/id=26366 株式会社サイバーエージェントは、2021年6月「極予測AI人間(キワミヨソクエーアイニンゲン)」において、老若男女さまざまなAI人物モデルが使い放題となる「極予測AI人間使い放題プラン」の提供を開始しました。 GAN(敵対的生成ネットワーク)技術を用い、架空のAIモデルの大量生成と「極予測AI」の効果予測を何度も繰り返すことで、企業やブランドごとのターゲティングに適した「オリジナルのAIモデル」を生成し、AIで「広告効果の出せるAIモデル」へと育成します。コロナ禍で、人物モデルの撮影が難しいことから、ニーズが高まっているということです。 参考:https://www.cyberagent.co.jp/news/detail/id=26366 AI技術が可能にする無人店舗 引用:https://jpn.nec.com/press/202003/20200313_01.html 米国アマゾンが展開する「Amazon Go」では、店内に入った顧客が陳列棚から商品を手に取ると、AIカメラが商品と顧客を自動で認識して両者をひも付けます。顧客が出口のゲートを通過すると、自動的に決済が行われる仕組みです。 日本国内でも、省力化や無人化を目指して様々な取り組みが行われています。NECは、セブン-イレブン・ジャパンが店舗の課題解決を目的に、2019年12月にリニューアルオープンした実験店舗「セブン-イレブン麹町駅前店」で、顔認証決済や商品案内用サイネージの実証実験を行っています。 顔認証決済(セブン‐イレブン社員限定)利用者は、専用端末を用いて事前に顔画像やクレジットカード情報、確認用コードを登録することで、セルフレジ支払い時に顔と確認用コードの2要素認証により、簡単かつセキュアに決済が可能となります。 また、2020年5月中旬より、店舗内にある商品案内用サイネージの視聴時間測定の実証実験を行います。 離れた場所から人の視線の向きを高精度に検知できる「遠隔視線推定技術」を活用することで、映像から推定した年齢・性別ごとにサイネージの視聴時間を可視化し、商品案内の注目度などの効果測定を支援します。 参考:https://jpn.nec.com/press/202003/20200313_01.html 自動運転の実用化 引用:https://response.jp/article/2020/10/12/339309.html Googleの自動運転車開発部門のウェイモは2020年10月、米国アリゾナ州において、無人の自動運転車を使ったタクシー配車サービスを一般向けに開始しました。 この配車サービスは、「ウェイモ・ワン」(Waymo One)と呼ばれるもので、サービスを利用するには、専用のアプリをスマートフォンなどにダウンロードする必要があります。 ユーザーは、このアプリを通じて、無人の自動運転タクシーを呼び出します。無人の自動運転タクシーは24時間、365日呼び出すことができ、目的地までの距離や時間に基づいて、あらかじめ料金がアプリに表示されます。 参考:https://response.jp/article/2020/10/12/339309.html 農業×AI 引用:https://response.jp/article/img/2018/11/14/316162/1359522.html 農業の分野でもAIの活用はめざましいものがあります。高齢化や後継者不足問題を解決し、知識やスキルをAIが学習して効率化を図る取り組みが始まっています。 ドローンとAIの画像解析技術を組み合わせ作物の生育状況を確認したり、これまで人の手によって行われていた農作業をロボットに代替させる試みが進んでいます。 ニュージーランドの農業自動化ソリューション開発のスタートアップ企業であるロボティクス・プラス社は、ロボット工学、オートメーション化および解析技術をベースとした農業分野の自動化ソリューションを開発する企業として2008年に設立。 リンゴの自動パッキング機、キウイの自動収穫機、移動型の自動授粉機、農業用UGV(無人地上車両)などの開発実績があります。 参考:https://response.jp/article/2018/11/14/316162.html AI(人工知能)の発展によって起きる未来 人工知能が発展することで、今よりも更に様々な商品やサービスで活用されるようになると思います。また現在私たちが生業としている作業も人工知能が代替することになるかもしれません。 その結果世の中は今よりも便利になり、定型的なタスクから今以上に開放されることになると思います。また現在抱えている様々な問題が人工知能によって解決されることになると予想されます。 資料ダウンロード