公的情報の素材棚卸し — agent-ready asset catalogs

jpcite が公的情報から組み上げた「素材」の棚卸し

このページは、jpcite が公的情報 (法令 / 判例 / 補助金 / 適格事業者 / 法人公開情報など) を 集めて構造化した素材 (source material) の在庫を、群ごとに開示するものです。 ここで言う「素材」は完成回答ではありません。AI agent が packet を取得したり import 計画を立てたりする 前の段に参照する、整理済みの一次情報のカタログです。これらの素材は offline で組み上げて served surface (API / MCP / packet bank) に焼き込んでおり、request-time に AWS を叩く live 検索では ありません。

位置づけ: これは「公的情報の素材棚卸し (inventory of public-information source material)」です。 棚卸しの総数は 718 件 (うち 717 件は public-import 可) で、live の agent_ready manifest がこの数を materialized static registry として返します。これは live な AWS-backed 検索や retrieval を提供する page ではありません (manifest 自身も live_aws_dependency_used=false / canary_public_claim_allowed=false を宣言しています)。

5 つの素材カタログ群

各群が「何の素材を棚卸ししたものか」を説明します。5 群あわせて 718 件の素材を棚卸ししており、うち 717 件が public-import 可です (実数は live の agent_ready manifestaws_asset_registry から取得できます)。

素材カタログ群 何の素材を棚卸ししたものか 状態
packet 素材カタログ
packet_catalog
公的情報を cohort / 業種 / 地域 / テーマ別に組み上げた Evidence Packet 素材の棚卸し。AI agent が後段で取得・整形する素材の在庫一覧です。各 packet には出典 URL と取得時刻が付き、未確認領域は known_gaps に残します。 素材在庫 (offline 生成・配膳済)
検索インデックス・カタログ
retrieval_index_catalog
素材を後段で引き当てるための検索インデックス (意味検索ベクトル等) の棚卸し。どの素材族にインデックスが組まれているかの在庫です。インデックス自体は offline で構築し、served surface に焼き込んでいます。 素材在庫 (offline 構築済)
判例本文カタログ
case_law_text_catalog
公開判決・審決の本文テキスト素材の棚卸し。一次資料 URL とともに、agent が引用候補を選ぶための本文在庫を整理しています。出典はパブリックドメインの公開判決です。 素材在庫 (公開一次資料)
ベンチマーク evidence pack
benchmark_evidence_pack
品質評価・回帰検証のために組んだ evidence (出典付き素材のセット) の棚卸し。素材がどの評価セットに紐づくかの在庫であり、評価結果そのものの公開主張ではありません。公開ベンチマークは corpus が十分に整った段階で改めて開示します。 素材在庫 (内部評価用)
Textract prefix 監査
textract_prefix_audit
audit-only (棚卸しのみ)。 PDF 取り込み処理が触れた格納先 (prefix) とオブジェクトの在庫監査です。どこに何が置かれているかの棚卸しであり、OCR の日本語テキスト品質は本群では一切主張しません。本文テキストの扱いは個別の素材群と known_gaps 側で開示します。 prefix / オブジェクトの在庫監査のみ

Textract についての注記 (audit-only)

Textract prefix 監査は、格納先 prefix とオブジェクトの棚卸しに限定します。 「日本語 PDF の OCR テキストが正確である」といった品質の主張は本ページでは行いません。 公的 PDF には CID 化フォントや stub PDF など OCR に向かない形式が含まれるため、本文の利用可否は 個別素材群と known_gaps で都度開示する設計です。本群はあくまで「何がどこに置かれているか」の 在庫監査です。

AI agent 向け: agent_ready manifest (live)

設計上、AI agent は packet 取得や import 計画を立てる前に、機械可読の agent_ready manifest を参照して「どの素材群が利用可能か」を把握します。 この manifest は live で、素材棚卸しの実数 (asset_count=718 / public_import_allowed=717) を aws_asset_registry として返します。

  • live エンドポイント: GET https://api.jpcite.com/v1/jpcite/agent_ready — 5 群の素材を materialized static registry として返します (status=materialized_static_registry)。 注: jpcite.com 配下ではなく api.jpcite.com です。
  • manifest が宣言する制約 (そのまま遵守): live_aws_dependency_used=false / canary_public_claim_allowed=false / live_search_or_answer_claim_requires_canary=true / static_import_allowed_without_live_canary=true / freshness_public_claim_allowed=false。 すなわち 静的インベントリの import は可ですが、 live AWS-backed search / answer は本 manifest の範囲外です。
  • 他の discovery 面: agent.json / llms.txt / .well-known/agent.json も live です。 packet の発見は パケット カタログ から行えます。

注: 各群の実数 (5 群合計 718 / public-import 可 717) は live の agent_ready manifest が真値です。 本ページはその棚卸しを人間向けに qualitative に説明するものです。

問い合わせ

素材カタログの追加要望・出典確認は [email protected] までお問い合わせください。