公的情報の素材棚卸し — agent-ready asset catalogs

jpcite が公的情報から組み上げた「素材」の棚卸し

このページは、jpcite が公的情報 (法令 / 判例 / 補助金 / 適格事業者 / 法人公開情報など) を集めて構造化した素材 (source material) の在庫を、群ごとに開示するものです。ここで言う「素材」は完成回答ではありません。AI agent が packet を取得したり import 計画を立てたりする 前の段に参照する、整理済みの一次情報のカタログです。これらの素材は offline で組み上げて served surface (API / MCP / packet bank) に焼き込んでおり、request-time に AWS を叩く live 検索ではありません。

位置づけ: これは「公的情報の素材棚卸し (inventory of public-information source material)」です。棚卸しの総数は 725 件 (うち 724 件は public-import 可) で、live の agent_ready manifest がこの数を materialized static registry として返します。これは live な AWS-backed 検索や retrieval を提供する page ではありません (manifest 自身も live_aws_dependency_used=false / canary_public_claim_allowed=false を宣言しています)。

6 つの素材カタログ群

各群が「何の素材を棚卸ししたものか」を説明します。6 群あわせて 725 件の素材を棚卸ししており、うち 724 件が public-import 可です (実数は live の agent_ready manifest の aws_asset_registry から取得できます)。

素材カタログ群	何の素材を棚卸ししたものか	状態
packet 素材カタログ packet_catalog	公的情報を cohort / 業種 / 地域 / テーマ別に組み上げた Evidence Packet 素材の棚卸し。AI agent が後段で取得・整形する素材の在庫一覧です。各 packet には出典 URL と取得時刻が付き、未確認領域は `known_gaps` に残します。	素材在庫 (offline 生成・配膳済)
検索インデックス・カタログ retrieval_index_catalog	素材を後段で引き当てるための検索インデックス (意味検索ベクトル等) の棚卸し。どの素材族にインデックスが組まれているかの在庫です。インデックス自体は offline で構築し、served surface に焼き込んでいます。	素材在庫 (offline 構築済)
判例本文カタログ case_law_text_catalog	公開判決・審決の本文テキスト素材の棚卸し。一次資料 URL とともに、agent が引用候補を選ぶための本文在庫を整理しています。出典はパブリックドメインの公開判決です。	素材在庫 (公開一次資料)
ベンチマーク evidence pack benchmark_evidence_pack	品質評価・回帰検証のために組んだ evidence (出典付き素材のセット) の棚卸し。素材がどの評価セットに紐づくかの在庫であり、評価結果そのものの公開主張ではありません。公開ベンチマークは corpus が十分に整った段階で改めて開示します。	素材在庫 (内部評価用)
商標 XML bridge trademark_xml_bridge	JPO ST.96 records から組み上げた Q211 商標 XML bridge evidence の棚卸し。Q211 bridge evidence のみを対象とする在庫であり、historical な q181_q240 pack を 60/60 にするものではありません。商標公報の構造化素材 (XML metadata) を agent の引用候補として整理した在庫です。	素材在庫 (Q211 bridge evidence)
Textract prefix 監査 textract_prefix_audit	audit-only (棚卸しのみ)。 PDF 取り込み処理が触れた格納先 (prefix) とオブジェクトの在庫監査です。どこに何が置かれているかの棚卸しであり、OCR の日本語テキスト品質は本群では一切主張しません。本文テキストの扱いは個別の素材群と `known_gaps` 側で開示します。	prefix / オブジェクトの在庫監査のみ

Textract についての注記 (audit-only)

Textract prefix 監査は、格納先 prefix とオブジェクトの棚卸しに限定します。「日本語 PDF の OCR テキストが正確である」といった品質の主張は本ページでは行いません。公的 PDF には CID 化フォントや stub PDF など OCR に向かない形式が含まれるため、本文の利用可否は個別素材群と known_gaps で都度開示する設計です。本群はあくまで「何がどこに置かれているか」の在庫監査です。

AI agent 向け: agent_ready manifest (live)

設計上、AI agent は packet 取得や import 計画を立てる前に、機械可読の agent_ready manifest を参照して「どの素材群が利用可能か」を把握します。この manifest は live で、素材棚卸しの実数 (asset_count=725 / public_import_allowed=724) を aws_asset_registry として返します。

live エンドポイント: GET https://api.jpcite.com/v1/jpcite/agent_ready — 6 群の素材を materialized static registry として返します (status=materialized_static_registry)。注: jpcite.com 配下ではなく api.jpcite.com です。
manifest が宣言する制約 (そのまま遵守): live_aws_dependency_used=false / canary_public_claim_allowed=false / live_search_or_answer_claim_requires_canary=true / static_import_allowed_without_live_canary=true / freshness_public_claim_allowed=false。すなわち 静的インベントリの import は可ですが、 live AWS-backed search / answer は本 manifest の範囲外です。
他の discovery 面: agent.json / llms.txt / .well-known/agent.json も live です。 packet の発見はパケットカタログから行えます。

注: 各群の実数 (6 群合計 725 / public-import 可 724) は live の agent_ready manifest が真値です。本ページはその棚卸しを人間向けに qualitative に説明するものです。

データソース・出典・ライセンス一覧 — 出典機関とライセンスの開示。
データ鮮度 — 素材の鮮度の全体状況。
使い方 (素材 + 仕上げモデル) — 素材を agent が仕上げて完成させる流れ。
透明性 — 主張の根拠と免責の方針。
ファクトシート — 引用可能な数値の正本 (確定値はここに集約)。

問い合わせ

素材カタログの追加要望・出典確認は [email protected] までお問い合わせください。

jpcite が公的情報から組み上げた「素材」の棚卸し

6 つの素材カタログ群

Textract についての注記 (audit-only)

AI agent 向け: agent_ready manifest (live)

関連ページ

問い合わせ