公的情報の素材棚卸し — agent-ready asset catalogs
jpcite が公的情報から組み上げた「素材」の棚卸し
このページは、jpcite が公的情報 (法令 / 判例 / 補助金 / 適格事業者 / 法人公開情報など) を 集めて構造化した素材 (source material) の在庫を、群ごとに開示するものです。 ここで言う「素材」は完成回答ではありません。AI agent が packet を取得したり import 計画を立てたりする 前の段に参照する、整理済みの一次情報のカタログです。これらの素材は offline で組み上げて served surface (API / MCP / packet bank) に焼き込んでおり、request-time に AWS を叩く live 検索では ありません。
live_aws_dependency_used=false / canary_public_claim_allowed=false を宣言しています)。
5 つの素材カタログ群
各群が「何の素材を棚卸ししたものか」を説明します。5 群あわせて 718 件の素材を棚卸ししており、うち 717 件が public-import 可です (実数は live の agent_ready manifest の aws_asset_registry から取得できます)。
| 素材カタログ群 | 何の素材を棚卸ししたものか | 状態 |
|---|---|---|
| packet 素材カタログ packet_catalog |
公的情報を cohort / 業種 / 地域 / テーマ別に組み上げた Evidence Packet 素材の棚卸し。AI agent が後段で取得・整形する素材の在庫一覧です。各 packet には出典 URL と取得時刻が付き、未確認領域は known_gaps に残します。 |
素材在庫 (offline 生成・配膳済) |
| 検索インデックス・カタログ retrieval_index_catalog |
素材を後段で引き当てるための検索インデックス (意味検索ベクトル等) の棚卸し。どの素材族にインデックスが組まれているかの在庫です。インデックス自体は offline で構築し、served surface に焼き込んでいます。 | 素材在庫 (offline 構築済) |
| 判例本文カタログ case_law_text_catalog |
公開判決・審決の本文テキスト素材の棚卸し。一次資料 URL とともに、agent が引用候補を選ぶための本文在庫を整理しています。出典はパブリックドメインの公開判決です。 | 素材在庫 (公開一次資料) |
| ベンチマーク evidence pack benchmark_evidence_pack |
品質評価・回帰検証のために組んだ evidence (出典付き素材のセット) の棚卸し。素材がどの評価セットに紐づくかの在庫であり、評価結果そのものの公開主張ではありません。公開ベンチマークは corpus が十分に整った段階で改めて開示します。 | 素材在庫 (内部評価用) |
| Textract prefix 監査 textract_prefix_audit |
audit-only (棚卸しのみ)。 PDF 取り込み処理が触れた格納先 (prefix) とオブジェクトの在庫監査です。どこに何が置かれているかの棚卸しであり、OCR の日本語テキスト品質は本群では一切主張しません。本文テキストの扱いは個別の素材群と known_gaps 側で開示します。 |
prefix / オブジェクトの在庫監査のみ |
Textract についての注記 (audit-only)
Textract prefix 監査は、格納先 prefix とオブジェクトの棚卸しに限定します。
「日本語 PDF の OCR テキストが正確である」といった品質の主張は本ページでは行いません。
公的 PDF には CID 化フォントや stub PDF など OCR に向かない形式が含まれるため、本文の利用可否は
個別素材群と known_gaps で都度開示する設計です。本群はあくまで「何がどこに置かれているか」の
在庫監査です。
AI agent 向け: agent_ready manifest (live)
設計上、AI agent は packet 取得や import 計画を立てる前に、機械可読の
agent_ready manifest を参照して「どの素材群が利用可能か」を把握します。
この manifest は live で、素材棚卸しの実数 (asset_count=718 / public_import_allowed=717) を
aws_asset_registry として返します。
- live エンドポイント:
GET https://api.jpcite.com/v1/jpcite/agent_ready— 5 群の素材を materialized static registry として返します (status=materialized_static_registry)。 注:jpcite.com配下ではなくapi.jpcite.comです。 - manifest が宣言する制約 (そのまま遵守):
live_aws_dependency_used=false/canary_public_claim_allowed=false/live_search_or_answer_claim_requires_canary=true/static_import_allowed_without_live_canary=true/freshness_public_claim_allowed=false。 すなわち 静的インベントリの import は可ですが、 live AWS-backed search / answer は本 manifest の範囲外です。 - 他の discovery 面: agent.json / llms.txt / .well-known/agent.json も live です。 packet の発見は パケット カタログ から行えます。
注: 各群の実数 (5 群合計 718 / public-import 可 717) は live の agent_ready manifest が真値です。 本ページはその棚卸しを人間向けに qualitative に説明するものです。
関連ページ
- データソース・出典・ライセンス一覧 — 出典機関とライセンスの開示。
- データ鮮度 — 素材の鮮度の全体状況。
- 使い方 (素材 + 仕上げモデル) — 素材を agent が仕上げて完成させる流れ。
- 透明性 — 主張の根拠と免責の方針。
- ファクトシート — 引用可能な数値の正本 (確定値はここに集約)。
問い合わせ
素材カタログの追加要望・出典確認は [email protected] までお問い合わせください。