Claude 3 の画像の取り扱いについてまとめ
laude 3 はVision機能が搭載されており、画像や図、グラフなどを読みこんで会話が可能で「Claude 3 OpusのVision機能を試す」の記事では、実写・イラストを読み込んだテストをお伝えしましたが、今回はオフィシャルで公開されている画像についての制約をまとめてみました。
Claude.aiにアップロードできる画像の種類は?
Claude 3では以下の画像がサポートされています
・jpeg
・png
・gif
・webp
画像は最大10MB(APIリクエストの場合は5MB)、8000×8000ピクセルまでアップロードが可能で、著しく低い解像度の画像は読み込めないおそれがあり、最小解像度1000×1000ピクセル以上の大きさを推奨されています。
また、数の制限については、最大5ファイル(APIリクエストの場合は最大20個)となり、トークンの制限の両方を下回る必要があります。
参照元:Claude.aiにアップロードできる画像の種類は何ですか?
最適な画像は?
画像は鮮明で解像度が高く、ブレやボケなどがない画像が推奨されており、画像内のテキストを参照したい場合はあまりにも画像に対しての比率が小さいと不具合が起こる可能性があると言われています。
最適な画像を利用し、Vision機能の性能をフルに引き出したいですね。
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。