ChatGPTの「GPTs」や「Assistants」で利用するKnowledgeを調査
ChatGPTに特定の情報を付与できるKnowledge。自社の情報を読み込ませたり、カスタマーサポートのマニュアルや、FAQを「GPTs」や「Assistants」と組み合わせることで、より業務にフィットしたChatGPTが利用可能です。
今回は「GPTs」や「Assistants」で利用するKnowledgeについて制限や気をつけるべきことをまとめていきます。
Knowledgeファイルの対応形式
ファイル形式は多岐に渡ります。成約としてはファイルが対応指定も、text/ MIMEタイプの場合、エンコーディングはutf-8、utf-16、asciiのいずれかでなければならないという制限があります。
対応ファイル一覧は公式の「Supported files」をご覧ください。CODE INTERPRETERが適応できるもの、RETRIEVALが適応できるものがファイル形式によって異なります。
一般的なドキュメント.csv/.docx/.html/.txt/.pdfなどは問題なく読み込むことが可能です。
Knowledgeファイルのアップロード上限
ファイルとしては20個登録時点で「Cannot upload more than 20 files」というエラーが出ます。単一ファイルか複数ファイルによる精度の違いは確認できていませんが、公式では20ファイルが上限となっています。
Knowladgeファイルのサイズ・トークン上限
最大ファイルサイズは512MBで、2,000,000トークン以下となります。おおよその目安となりますが、200万トークンは、ひらがなと感じが入り混じった文章の場合おおよそ、文章1.5万字前後となります。
Knowladgeファイルがトークン制限を超えた場合
一度に読み込めるのは文書の先頭からトークン制限に達するまでの部分となります。そのため、トークン制限を超えるKnowladgeファイルを利用する場合は分割して登録したほうが良い。
制限を理解して正しくKnowladgeファイルを準備
制限があるため、オリジナルのドキュメントを参照したChatGPTを作成したい場合、この制限を正しく理解することが非常に重要になります。
正しく理解し、制度の高いGPTs、Assistants作成を目指しましょう。
ChatGPT
https://chat.openai.com/