Google Vision アクション - Read text from image (画像からのテキストの読み取り)

このアクションは、画像からテキストを読み取ります。画像は以下の2種類のいずれかを使用できます。

  • 写真 : たとえば、写真には道路標識や交通標識が含まれる場合があります。Google Vision は抽出された文字列、個々の単語、およびそれらの境界ボックスを返します。

    Abbey Road の写真

  • スキャンされたドキュメント : Google Vision は抽出されたテキストとともに、ページ、ブロック、段落、単語、および改行の情報を返します。

    スキャンされたドキュメント

入力項目

項目名説明
Image contentファイルコンテンツのデータピル、文字列、パブリック URL、または Google Cloud Storage の URI を受け付けます。
Image type選択された画像の種類 (写真またはスキャンされたドキュメント) に応じて、Google Vision は出力を最適化します。

出力項目

項目名説明
Text annotations画像から抽出された個々の単語すべてを含むリスト。
Locale抽出された単語のロケール。
Text抽出された単語。
Bounding poly画像上での単語の位置。X 座標と Y 座標が含まれます。
Full text annotation画像から抽出されたテキスト全文。
Pages幅、高さ、段落の位置といった、ページについての詳細情報が含まれます。
Full text画像から抽出されたテキスト全文。

Last updated: