ChatGPTの「GPTs」や「Assistants」で利用するKnowledgeを調査
ChatGPTに特定の情報を付与できるKnowledge。自社の情報を読み込ませたり、カスタマーサポートのマニュアルや、FAQを「GPTs」や「Assistants」と組み合わせることで、より業務にフィットしたChatGPTが利用可能です。
今回は「GPTs」や「Assistants」で利用するKnowledgeについて制限や気をつけるべきことをまとめていきます。
Knowledgeファイルの対応形式
ファイル形式は多岐に渡ります。成約としてはファイルが対応指定も、text/ MIMEタイプの場合、エンコーディングはutf-8、utf-16、asciiのいずれかでなければならないという制限があります。
対応ファイル一覧は公式の「Supported files」をご覧ください。CODE INTERPRETERが適応できるもの、RETRIEVALが適応できるものがファイル形式によって異なります。
一般的なドキュメント.csv/.docx/.html/.txt/.pdfなどは問題なく読み込むことが可能です。
Knowledgeファイルのアップロード上限
ファイルとしては20個登録時点で「Cannot upload more than 20 files」というエラーが出ます。単一ファイルか複数ファイルによる精度の違いは確認できていませんが、公式では20ファイルが上限となっています。
Knowladgeファイルのサイズ・トークン上限
最大ファイルサイズは512MBで、2,000,000トークン以下となります。おおよその目安となりますが、200万トークンは、ひらがなと感じが入り混じった文章の場合おおよそ、文章1.5万字前後となります。
Knowladgeファイルがトークン制限を超えた場合
一度に読み込めるのは文書の先頭からトークン制限に達するまでの部分となります。そのため、トークン制限を超えるKnowladgeファイルを利用する場合は分割して登録したほうが良い。
制限を理解して正しくKnowladgeファイルを準備
制限があるため、オリジナルのドキュメントを参照したChatGPTを作成したい場合、この制限を正しく理解することが非常に重要になります。
正しく理解し、制度の高いGPTs、Assistants作成を目指しましょう。
ChatGPT
https://chat.openai.com/
※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。
ChatGPT 最新情報
tazikuでは、対話型AI ChatGPTの最新情報、機能紹介、様々なTipsを発信中!ChatGPTに関するまとめ記事、記事一覧は以下のリンクからご覧ください。
生成AI・AIの導入・研修・DXの支援はtazikuへ
生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションDXAIから、ご相談・お問い合せください。