樂実舎のブログ: Google Cloud Vision APIをまとめてみた。少しだけ。①

2017年8月9日水曜日

久しぶりにGoogle Cloud Vision APIを触ってみました。

試した写真はこれです。

実際に試したのは顔が表示されていますがとりあえず消しときました。

Google Cloud Vision APIで取得する機能のタイプが選べます。

FACE_DETECTION・・・画像内の顔を検出します。
LANDMARK_DETECTION・・・画像内の地理的ランドマークを検出します。
LOGO_DETECTION・・・画像内の企業ロゴを検出します。
LABEL_DETECTION・・・画像の内容に基づいてラベルを追加します。
TEXT_DETECTION・・・画像内のテキストに対してOCRを実行します。
DOCUMENT_TEXT_DETECTION・・・密度の高いテキストのシナリオ用に特別に調整されたモデルを使用して、ドキュメントなどの密度の高いテキスト画像にOCRを実行します。
SAFE_SEARCH_DETECTION・・・画像の画像セーフサーチプロパティを判別します。
IMAGE_PROPERTIES・・・画像の一連のプロパティ（画像のドミナントカラーなど）を計算します。
WEB_DETECTION・・・ニュース、イベント、画像内の有名人などの時事的なエンティティを検出し、Google画像検索の機能を使用してウェブ上で同様の画像を検索します。

詳細は、ここを見てください。

CROP_HINTSはGoogle Cloud Visionのドキュメントに記載があるけど、料金には書いていないのはなんでだろう？
お金がかからないのかな？

とりあえず、実行するソースは『プログラマのためのGoogle Cloud Platform入門』の第5章 219ページにあるものを使っています。

LANDMARK_DETECTIONを実行してみました。

結果

{
    "responses": [
        {}
    ]
}

なんぞこれといった感じです。

確かに使っている写真からは目印となるような建物などは見つけられないですね。

次は別機能のタイプを実践します。

樂実舎のブログ