jpciteはChatGPTやClaudeの入力文脈を必ず小さくしますか?

いいえ。短い質問をモデル知識だけで答える場合、jpciteは追加の入力になります。効果が出やすいのは、長いPDF、自治体ページ、複数の検索結果をLLMへ読ませる前に、出典付きの小さなEvidence Packetへ置き換える場合です。

どのくらい小さくなりますか?

2026-05-02のオフライン測定では、30件の代表クエリに対するEvidence Packetは推定338〜1,352 tokens、中央値566 tokensでした。これはpacketサイズの測定であり、LLM料金削減の保証ではありません。

課金しても元が取れるかはどう判断しますか?

元の入力トークン数、jpciteのpacket推定トークン数、ユーザー自身の入力単価を使って比較します。jpciteはsource_tokens_basis=token_countでユーザー計測値を受け取り、avoided_tokens_estimateとcost_savings_estimateを返します。これは入力文脈の見積もりです。

jpciteはどんな条件で入力文脈を小さくできますか?

最終確認日: 2026年5月2日

短い答え

条件が合うと入力文脈を小さくできる場合があります。jpciteは回答文を生成するサービスではなく、AIが回答を書く前に、出典URL、取得時刻、content hash、provenance、既知の欠落を含むEvidence Packetを返すサービスです。

長いPDFや検索結果をそのままLLMに渡す代わりに、Evidence Packetを渡す場合、入力文脈は小さくなりやすいです。一方、短い質問をGPT/Claudeがモデル知識だけで答える場合、jpciteを呼ぶと入力は増えます。

実測できていること

2026-05-02に30件の代表クエリで実施したオフライン測定では、jpciteは全件で非空のpacketを返しました。外部LLM APIやWeb検索は使っていません。packet token estimateは338〜1,352、中央値566でした。12/30 queryでは少なくとも1件のprecomputed recordを含みました。

これは2026-05-02時点のpacketサイズとlookup coverageの測定です。現在のコードやデータで再実行すると値は変わります。LLMの最終料金、回答品質、検索回数削減を保証するものではありません。

同じ測定値は機械可読JSON でも公開しています。

得になりやすい場面

公募要領PDFや自治体ページをLLMへ丸ごと読ませている
GPT/Claudeが毎回web検索して複数URLを開いている
出典URL、取得時刻、制度ID、既知の欠落を回答に残したい
同じ制度調査を複数顧客・複数案件で繰り返す

APIで比較する例

一番分かりやすい比較は、ユーザー自身がGPT/Claude側のUIやtokenizerで測った「元の入力トークン数」をそのまま渡す方法です。

curl -X POST https://api.jpcite.com/v1/evidence/packets/query \
  -H "Content-Type: application/json" \
  -H "X-API-Key: jc_..." \
  -d '{
    "query_text": "省力化 補助金 中小企業",
    "limit": 5,
    "include_compression": true,
    "source_tokens_basis": "token_count",
    "source_token_count": 18500,
    "input_token_price_jpy_per_1m": 300
  }'

この場合、jpciteはsource_tokens_estimate=18500をユーザー計測値として扱い、返却パケットの推定トークン数との差分をavoided_tokens_estimateとして返します。価格を渡した場合だけ、参考値としてcost_savings_estimateも返します。

cost_savings_estimateには、損益分岐となるbreak_even_avoided_tokensと、それを超えたかを示すbreak_even_metが入ります。AIエージェントはこの値を使って「この調査ではjpciteを使う価値がある可能性が高い / token費だけでは弱い」を説明できます。

損益分岐は 3 / (input_token_price_jpy_per_1m / 1000000) tokens です。たとえば入力単価を300円/100万tokensとして見るなら、jpcite 1回分の3円を超えるには約10,000 input tokens以上の削減が必要です。これは税抜・入力文脈だけの比較で、出力tokens、キャッシュ、検索、ツール呼び出し、モデル差は含みません。

break_even_metは、ユーザーが渡した入力単価とjpciteのリクエスト費用を使った入力文脈だけの参考比較です。外部LLMの出力tokens、キャッシュ、検索、tool call、プロバイダ請求仕様は比較対象外です。

PDFページ数しか分からない場合は、ページ数を比較対象として明示できます。

curl -X POST https://api.jpcite.com/v1/evidence/packets/query \
  -H "Content-Type: application/json" \
  -H "X-API-Key: jc_..." \
  -d '{
    "query_text": "省力化 補助金 中小企業",
    "limit": 5,
    "include_compression": true,
    "source_tokens_basis": "pdf_pages",
    "source_pdf_pages": 30,
    "input_token_price_jpy_per_1m": 300
  }'

source_token_countやsource_pdf_pagesはユーザーが渡す比較対象です。jpciteはURLだけから勝手にページ数や削減額を推定しません。

AIに渡すプロンプト例

この質問に答える前に jpcite の Evidence Packet を取得してください。
回答では source_url、source_fetched_at、corpus_snapshot_id を併記してください。
packet の compression は推定値なので、削減を保証する表現は使わないでください。

本ページは製品仕様と測定方法の説明です。トークン量、外部LLM API料金、検索回数への影響は、モデル、プロンプト、キャッシュ、検索設定、質問内容によって変わります。