jpciteはどんな条件で入力文脈を小さくできますか?
短い答え
条件が合うと入力文脈を小さくできる場合があります。jpciteは回答文を生成するサービスではなく、AIが回答を書く前に、出典URL、取得時刻、content hash、provenance、既知の欠落を含むEvidence Packetを返すサービスです。
長いPDFや検索結果をそのままLLMに渡す代わりに、Evidence Packetを渡す場合、入力文脈は小さくなりやすいです。一方、短い質問をGPT/Claudeがモデル知識だけで答える場合、jpciteを呼ぶと入力は増えます。
実測できていること
2026-05-02に30件の代表クエリで実施したオフライン測定では、jpciteは全件で非空のpacketを返しました。外部LLM APIやWeb検索は使っていません。packet token estimateは338〜1,352、中央値566でした。12/30 queryでは少なくとも1件のprecomputed recordを含みました。
これは2026-05-02時点のpacketサイズとlookup coverageの測定です。現在のコードやデータで再実行すると値は変わります。LLMの最終料金、回答品質、検索回数削減を保証するものではありません。
同じ測定値は 機械可読JSON でも公開しています。
得になりやすい場面
- 公募要領PDFや自治体ページをLLMへ丸ごと読ませている
- GPT/Claudeが毎回web検索して複数URLを開いている
- 出典URL、取得時刻、制度ID、既知の欠落を回答に残したい
- 同じ制度調査を複数顧客・複数案件で繰り返す
APIで比較する例
一番分かりやすい比較は、ユーザー自身がGPT/Claude側のUIやtokenizerで測った「元の入力トークン数」をそのまま渡す方法です。
curl -X POST https://api.jpcite.com/v1/evidence/packets/query \
-H "Content-Type: application/json" \
-H "X-API-Key: jc_..." \
-d '{
"query_text": "省力化 補助金 中小企業",
"limit": 5,
"include_compression": true,
"source_tokens_basis": "token_count",
"source_token_count": 18500,
"input_token_price_jpy_per_1m": 300
}'
この場合、jpciteはsource_tokens_estimate=18500をユーザー計測値として扱い、返却パケットの推定トークン数との差分をavoided_tokens_estimateとして返します。価格を渡した場合だけ、参考値としてcost_savings_estimateも返します。
cost_savings_estimateには、損益分岐となるbreak_even_avoided_tokensと、それを超えたかを示すbreak_even_metが入ります。AIエージェントはこの値を使って「この調査ではjpciteを使う価値がある可能性が高い / token費だけでは弱い」を説明できます。
損益分岐は 3 / (input_token_price_jpy_per_1m / 1000000) tokens です。たとえば入力単価を300円/100万tokensとして見るなら、jpcite 1回分の3円を超えるには約10,000 input tokens以上の削減が必要です。これは税抜・入力文脈だけの比較で、出力tokens、キャッシュ、検索、ツール呼び出し、モデル差は含みません。
break_even_metは、ユーザーが渡した入力単価とjpciteのリクエスト費用を使った入力文脈だけの参考比較です。外部LLMの出力tokens、キャッシュ、検索、tool call、プロバイダ請求仕様は比較対象外です。
PDFページ数しか分からない場合は、ページ数を比較対象として明示できます。
curl -X POST https://api.jpcite.com/v1/evidence/packets/query \
-H "Content-Type: application/json" \
-H "X-API-Key: jc_..." \
-d '{
"query_text": "省力化 補助金 中小企業",
"limit": 5,
"include_compression": true,
"source_tokens_basis": "pdf_pages",
"source_pdf_pages": 30,
"input_token_price_jpy_per_1m": 300
}'
source_token_countやsource_pdf_pagesはユーザーが渡す比較対象です。jpciteはURLだけから勝手にページ数や削減額を推定しません。
AIに渡すプロンプト例
この質問に答える前に jpcite の Evidence Packet を取得してください。
回答では source_url、source_fetched_at、corpus_snapshot_id を併記してください。
packet の compression は推定値なので、削減を保証する表現は使わないでください。
本ページは製品仕様と測定方法の説明です。トークン量、外部LLM API料金、検索回数への影響は、モデル、プロンプト、キャッシュ、検索設定、質問内容によって変わります。