Claude 3 の画像の取り扱いについてまとめ
laude 3 はVision機能が搭載されており、画像や図、グラフなどを読みこんで会話が可能で「Claude 3 OpusのVision機能を試す」の記事では、実写・イラストを読み込んだテストをお伝えしましたが、今回はオフィシャルで公開されている画像についての制約をまとめてみました。
Claude.aiにアップロードできる画像の種類は?
Claude 3では以下の画像がサポートされています
・jpeg
・png
・gif
・webp
画像は最大10MB(APIリクエストの場合は5MB)、8000×8000ピクセルまでアップロードが可能で、著しく低い解像度の画像は読み込めないおそれがあり、最小解像度1000×1000ピクセル以上の大きさを推奨されています。
また、数の制限については、最大5ファイル(APIリクエストの場合は最大20個)となり、トークンの制限の両方を下回る必要があります。
参照元:Claude.aiにアップロードできる画像の種類は何ですか?
最適な画像は?
画像は鮮明で解像度が高く、ブレやボケなどがない画像が推奨されており、画像内のテキストを参照したい場合はあまりにも画像に対しての比率が小さいと不具合が起こる可能性があると言われています。
最適な画像を利用し、Vision機能の性能をフルに引き出したいですね。