PythonでAI

【PythonでAI】ディープラーニングで画像認識するやり方をやさしく解説!

2020年12月13日

※ 当ページのリンクにはPRが含まれています。

 

今、「AIエンジニアになりたい!」って方が増えています。

そんな憧れの職種(?)ですが、現在私は現役AIエンジニアとしてAI関連のシステム開発(具体的にはレコメンド技術を使ったWebサービス開発)に携わっております。(まあ、こんな感じで仕事しています。(^-^))

AIエンジニアのイメージ

 

私の紹介はここまでにして、、、今回は私の好きなアニメ「攻殻機動隊」のあるシーンをPythonで再現できるか試してみたいと思います。

 

そのシーンは次のような、タチコマ(ロボット)が路面店で売られている『焼き鳥』を認識する、というシーンです。

タチコマが焼き鳥を認識するシーン

【出典】攻殻機動隊 「タチコマの家出」より

 

このシーンを再現するために、次の3ステップで取り組んでいきます。

今回の取り組みステップ

 

STEP1で、学習用の画像(焼き鳥、焼きそば、焼き芋)を集めるところから始めます。その際、学習には大量の画像が必要となりますので写真のコミュニティサイトであるFlickrを活用したいと思います。

次のSTEP2では、集めた大量の3種類の画像をAIに学習させます。今回はこのAIエンジンにディープラーニングを活用していきます。

最後STEP3では、学習したAIエンジンに新たな焼き鳥画像を入力し、焼き鳥と認識できるかどうかを確認します。

 

れんた
それでは次のような流れで説明していきますので最後までご覧くださいね。

 

もっと体系的にAIを学びたい!って方におすすめのプログラミングスクールを紹介しております。

【徹底取材】PythonでAI・機械学習が学べるプログラミングスクールおすすめ6選を比較!

つづきを見る

 

【STEP1】大量の学習用画像を集める

 

れんた
まずはSTEP1の「大量の学習用画像を集める」です。

STEP1

 

AIの認識精度を上げるためには、質の良い画像を大量にそろえる必要があります。ただ自分で手作業で集めるには限界がありますよね。

そこで今回は、写真の共有を目的としたコミュニティサイトである「Flickr」が提供する写真検索用のAPIを利用して大量の画像を集めることにします。

 

今回は、焼き鳥の写真を含む3種類(①焼き鳥、②焼きそば、③焼き芋)の画像を集めていきます。

Flickr APIを使うためのキーの取得

 

れんた
それでは、Flickrが提供する写真検索用APIを使うためのキーを取得するところから始めたいと思います。

 

まずは、FlickrのWebサイトにアクセスし、「Sign Up」ボタンをクリックします。

Flickrのトップページ

 

そして、氏名、メールアドレス、パスワードを入力し、「Sign Up」ボタンを押下します。(すぐに、登録したメールアドレスに確認メールが届きますので、メール本文の「Confirm my Flickr account」をクリックします。)

Flickrサインアップ画面

 

次にFlickr APIのページにアクセスし、画面上部にある「Create an App」リンクをクリックします。

Flickr API取得画面

 

そして、「①Get your API Key」項目の「Request an API Key」リンクをクリックし、

Flickr API取得画面

 

次の画面にある「APPLY FOR A NON-COMMERCIAL KEY」ボタンをクリックします。

Flicker API取得画面

 

そして、次の画面にて作成するアプリの名前そのアプリの情報を入力して、「SUBMIT」ボタンをクリックします。

Flickr API取得画面

 

すると、「API Key」「Secret Key」の情報が表示されますので、この2つをどこかにコピー保存しておきましょう。

Flickr API取得画面にてKeyとSecretを確認

 

これで、Flickr APIを使う準備が整いました。

 

画像のダウンロード

れんた
それでは、Flickr APIを使って画像を取得するためのPythonプログラムを書いていきます。

 

以下のPythonプログラムは、Flickrサイトから『焼き鳥』の画像(150x150ピクセルの正方形)を300枚ダウンロードし、あなたのPCに保存するプログラムとなります。

メモ

※ソースコード中のkey変数とsecret変数には、先ほど入手したAPI KeySecret Keyを書いてください。

 

 

それではこのプログラムを実行してみましょう。

無事実行できましたら、image/yakitoriフォルダに、300枚の焼き鳥画像が保存できていると思います。

 

あと、「焼きそば」と「焼き芋」の画像も集めたいと思いますので、以下の箇所を変更して再度プログラムを実行してください。

  • ソースコード中のkeywordを"焼きそば"、savedirを"./image/yakisoba"に変更
  • ソースコード中のkeywordを"焼き芋"、savedirを"./image/yakiimo"に変更

 

不要な画像の削除

れんた
次にダウンロードした画像の質を上げていきます。

 

ダウンロードした画像を眺めてもらうと分かると思いますが、関係のない画像が結構含まれていたりします。このような画像があると認識精度が落ちてしまいます。

面倒な作業になりますが関係のない画像は削除して、それぞれを150枚に厳選しておきます。

 

メモ

Windowsの例になりますが、「Ctrl」キーを押しながら画像を選択すると複数一気に削除候補を選べますので効率よく削除できますよ。

削除する画像を選択

 

画像をNumpy形式にまとめる

れんた
次に画像をPythonプログラムで扱いやすいようにNumpy形式で保存しておきます。

 

メモ

Numpyとは、Pythonで数値計算を効率的に行うためのライブラリのことです。

 

以下のPythonプログラムは、Flickrサイトからダウンロードした3種類の画像群を読み込んで各々の画像に分類ラベルを付与してNumpy形式でファイル保存するプログラムとなります。

 

れんた
無事学習用画像を準備できたところで、いよいよ画像認識に移っていきたいと思います。

 

 

【STEP2】大量の学習用画像をAIに学習させる

 

れんた
次はSTEP2の「大量の学習用画像をAIに学習させる」です。

STEP2

 

集めた大量の学習用画像をAIに学習させていきますが、今回はAIエンジンとしてディープラーニングの画像認識に関する代表的な手法である「CNN:畳み込みニューラルネットワーク」を用いたいと思います。

 

AIエンジンを作成する

それでは、さっそくAIエンジンを作っていきましょう。

まずは、CNNモデルを定義して返却するコードを作成しておきます。

〇〇層とか、最適化関数とか、聞き慣れない用語がいっぱい出てくると思いますが、とりあえず細かい説明は別の機会に行いたいと思いますので、まずはこんな書き方するのね、ぐらいで考えてもらえればと思います。(笑)

 

 

AIエンジンに画像を学習させる

次に、定義したCNNモデルに画像を学習させてみましょう。

次のコードでは、Numpy形式でファイル保存した画像データを読み出して、xに画像データを、yにその画像の分類ラベル(焼き鳥なら1、焼きそばなら2、焼き芋なら3)を入れます。

そして、それらの画像データを先ほど定義したCNNモデルに与えて画像を学習をさせ、学習したモデルをファイルに保存する、といった流れになります。(※ここでモデルをファイルに保存する理由は、学習にはかなりの時間を要するので、一度学習したモデルをすぐに再利用するためです。)

 

 

れんた
無事AIエンジンを準備できたところで、いよいよ焼き鳥の画像が無事に認識できるか確認していきたいと思います。

 

 

【STEP3】テスト用画像を学習したAIで判別できるか確認する

 

れんた
最後はSTEP3の「テスト用画像を学習したAIで判別できるか確認する」です。

STEP3

 

それでは、学習したAIエンジンに自分で撮影した「焼き鳥」の画像を与えて、無事に焼き鳥と認識できるかやってみたいと思います。(ファイル名は、"test-yakitori.jpg"としております。)

 

次のプログラムでは、先ほど保存したAIエンジン読み込み、そのAIエンジンに焼き鳥の画像を与えて認識率(%)を結果として出力するプログラムとなります。

 

最後このプログラムを実行してみると、、、パーセントは「99%」となりました。パチパチパチ。

画像の認識結果

 

以上で今回の記事は終了となります。最後までご覧いただきありがとうございました。(^^)

 

れんた
もっと体系的にAIを学びたい!って方におすすめのプログラミングスクールを紹介しております。

もっと体系的にAIを学びたい!って方におすすめのプログラミングスクールを紹介しております。

【徹底取材】PythonでAI・機械学習が学べるプログラミングスクールおすすめ6選を比較!

つづきを見る

 

まとめ

いかがでしたでしょうか?

今回は、アニメ攻殻機動隊のワンシーンである「タチコマが路面店で売られている『焼き鳥』を認識するシーン」をPythonで再現できるか確認するため、次のことにトライしました。

【今回の取り組みで試したこと】

  • Flickr APIを使って大量の画像を集める
  • AIエンジンを作成する
  • 集めた大量の画像をAIエンジンに与え、学習させる
  • 学習させたAIエンジンにテスト画像を与え、認識できるか確認する

次回また面白いユースケースを見つけて、Pythonで実現できるAIを紹介できればと考えております!

 

もっと体系的にAIを学びたい!って方におすすめのプログラミングスクールを紹介しております。

【徹底取材】PythonでAI・機械学習が学べるプログラミングスクールおすすめ6選を比較!

つづきを見る

-PythonでAI

© 2024 WEBレコ Powered by AFFINGER5