こんにちは、東京アプリケーションシステム第三ソリューション部のW.F.です。
今回は昨年度AI分科会で扱った画像解析ライブラリの紹介をします。
画像解析ライブラリ
今回紹介するのは、以下の4つのライブラリです。
画像処理や特徴抽出においてそれぞれ特徴が異なります。
1. OpenCV
OpenCVは、画像処理やコンピュータビジョンのためのオープンソースライブラリです。以下は、OpenCVの主な特徴です。
・画像の読み込み・保存
・画像のリサイズ・回転
・特定の色範囲の抽出
・特徴点検出(SIFT、SURF、ORBなど)
2. MediaPipe
MediaPipeは、Googleが開発したライブラリで、リアルタイムのメディア処理に特化しています。以下は、MediaPipeの主な特徴です。
・顔検出・姿勢推定
・手のトラッキング
・音声認識
・ジェスチャー検出
3. Dlib
Dlibは、機械学習と画像処理のためのC++ライブラリです。以下は、Dlibの主な特徴です。
・顔検出・顔認識
・物体検出
・顔の特徴点検出
・機械学習モデルのトレーニング
4. InsightFace
InsightFaceは、顔認識と顔特徴抽出のためのライブラリです。以下は、InsightFaceの主な特徴です。
・顔の特徴ベクトルの抽出
・顔の比較と類似度の計算
・顔の識別
実行結果
先ほどご紹介した、OpenCVとInsightFaceの2つを抜粋してご紹介します。
1. OpenCV
画像は人の画像から目を検出したものです。
画像の通り、目に黒枠がありますので正確に検出できていることが分かりますね。
今回は目の検出を行いましたが、メガネや笑顔なども検出することができます!
2. InsightFace
顔検出、年齢推測、性別推測を行っています。
赤枠が顔検出、赤点・緑点で目鼻口の位置も特定できていますね。
また、左上に「F.29」とある通り、性別はfemale(女性)で年齢が29才ではないかと推測結果が出ています。
画像はフリー画像のものを使用しているため実際の年齢はわかりませんが、推測結果が概ねあっていることがわかります!
最後に
最後まで読んでいただきありがとうございました。
昨年度はライブラリを用いた画像解析を行っていましたが、今度は機械学習モデルの自作をするところから挑戦したいですね。