Claude 3 OpusのVisionでOCRを試す

2024年3月22日
AI BLOG Technology

Claude 生成AI

Claude 3 Opusは、Vision機能が提供されており、単純に画像解析だけではなく、文字を読み取ってくれるOCR的に利用することも可能です。今回はVision機能を使い文字の読み取りがどの程度正確なのかを試してみました。

日本語も完全に認識

プロンプト：画像内のすべての文字を抽出し、抽出された文字のみを記述してください。

自社のWEBサイトからのスクリーンショットですが、完璧に書き起こしてくれています。ここまで精度が高いと、通常の文章レベルだと実用に十分ですね。

Claude 3
https://www.anthropic.com/news/claude-3-family

Midjourneyの使い方 – 登録から実践までのガイド

MidjourneyのVary（strong / Subtle）とMake Squea機能

ComfyUIの起動用のbatファイルを作成する

ChatGPTプロンプトINDEX アクセスランキングTOP10

MagicAnimate×Midjourneyでイラストのダンスムービー検証

Midjourney （ミッドジャーニー）のパラメータChaosを試す

進化するMidjourney v7が描く次世代のAI画像生成

Claude 3.5の新機能新モデル登場とPC操作機能

Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す

Claude 3 で画像をピクセル化するプログラムを生成

Claude 3で登場人物の会話を生成する

Claude 3 でXMLタグを利用する

投稿検索
ABOUT US?

tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。

AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。

Works

Service

Contact
AI CREATIVE BASE

デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

詳細を見る
MENU
- BLOG
  - Think
  - Creative
  - Technology
    - AI
    - メタバース
- Project
  - AIアニメプロジェクト
  - どうくつたんけん
NEW POST