Claude 3 OpusのVisionでOCRを試す
Claude 3 Opusは、Vision機能が提供されており、単純に画像解析だけではなく、文字を読み取ってくれるOCR的に利用することも可能です。今回はVision機能を使い文字の読み取りがどの程度正確なのかを試してみました。
日本語も完全に認識
プロンプト:画像内のすべての文字を抽出し、抽出された文字のみを記述してください。
自社のWEBサイトからのスクリーンショットですが、完璧に書き起こしてくれています。ここまで精度が高いと、通常の文章レベルだと実用に十分ですね。
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。