jpcite vs 自前スクレイピング (DIY): 機能・価格・データ範囲の比較 (2026)

「制度 DB は自分で 巡回取得 すれば作れるのでは」と検討中の開発者向け。技術的には作れます — 当社もそうしました。ただし、本気で本番品質に持っていく場合の工数 (ソース 1,500+ / 失効監視 / 重複除去 / ライセンス管理 / 政府サイト改修への追従)を踏まえると、買う方が早いケースが多いという 率直な比較です。

本ページは公開情報をもとに当社が作成しています。 各社価格・機能は 時点のもので、最新情報は当社 料金ページ でご確認ください (自前スクレイピング (DIY) は外部サービスではないため公式参照先はありません)。 誤りに気づいた場合は [email protected] までご連絡いただければ 48 時間以内に修正します。

機能・データ範囲・価格の比較表

「公開情報なし」と書いた行は「機能が無い」と断定するものではありません — 各社公式サイトに記載が無い、または当社が確認できなかった項目です。

比較軸 jpcite 自前スクレイピング (DIY) 補足
1. API 提供 REST + MCP を統一インターフェースで提供。OpenAPI 仕様書。 自分で Web スクレイピング + 正規化 + 重複除去 + 失効監視を実装。
2. MCP 対応 89 機能。 自分で実装する場合は MCP サーバーも自作。
3. 料金モデル ¥3/リクエスト 完全従量 (税込 ¥3.30)。 クラウド費 + 開発工数 (人件費が支配的)。
4. 国内法人カバー数 166,969 件 (gBizINFO + 適格請求書 取込済)。 自分で gBizINFO API + 国税庁 bulk を結合。出典・ライセンス管理を自前で行う必要あり。
5. 制度 DB (補助金・融資・税制・認定) 11,684 件 (47 都道府県 + 省庁 + 自治体 1,500 以上の情報源)。 1,500 以上の情報源を個別 巡回取得 + 失効監視。集約サイト (noukaweb 等) は当社で除外 — 誤情報リスク。 自前で 1,500 以上の情報源管理は実務上極めて重い。
6. 税制ルール DB 35 件 (e-Gov + 国税庁通達 + 措置法)。 e-Gov + 国税庁通達 + 国会会議録 を結合。
7. 判例 2,065 件 (裁判所公式 + 判例集)。 裁判所サイト + 法律雑誌の判例索引を結合。OCR が必要な判決も多い。
8. 適格請求書発行事業者 13,801 件 + 月次フル取込予定 (PDL v1.0)。 国税庁 bulk 月次 DL を自前で取込 — PDL v1.0 で再配布も OK。
9. 一次資料の出典付与 99% 以上に 出典 URL + 更新日時 (社内規約)。 自前で出典管理ポリシーを設計・運用。
10. 失効監視 毎晩 tier S/A 全件 + 段階的に B/C も巡回。404 即 公開保留 (二次レビュー待ち)。 自前で URL 死活監視 + 定期実行 + 通知 + DB 巡回。サイト改修ごとに パーサ 修正。
11. 重複除去 重複除去 (公募回 / 都道府県差し替え 等のパターン規則化)。 自前で名寄せルール設計。
12. 利用規約 ToS 同意で開始。 各サイトの ToS を個別確認 (集約サイト除外 等のポリシー判断が必要)。
13. 無料枠 匿名 3 リクエスト/日/IP。 自分の クラウド費 (実質的な「無料枠」はない)。
14. 初回利用までの時間 5 分 (匿名でいきなり叩ける)。 数週間〜数ヶ月 (1,500 以上の情報源の 巡回取得er を書ききるまで)。

当社を選ぶケース

jpcite が向いている

  • 5 分で動く。匿名 3 リクエスト/日/IP で即評価、API キー不要。自前の巡回取得スクリプトは 1,500 以上の情報源を書ききるまで数週間〜数ヶ月。
  • 失効監視 + 重複除去 + ライセンス管理を当社が運用。毎晩 tier S/A 全件 + 段階的に B/C も巡回し、404 即 公開保留 (二次レビュー待ち)。重複除去ロジック (公募回 / 都道府県差し替え) も内製済。
  • 89 個の MCP ツールを Claude / ChatGPT / Cursor から直呼び。自前で MCP サーバーを書く工数も不要。

自前スクレイピング (DIY) が向いている

  • 完全コントロール。データ構造・正規化方針・更新頻度を自社要件に合わせて設計可能。当社のスキーマで合わない場合、自前が選択肢。
  • 原価が下がる(規模次第)。月数十万リクエスト規模で長期運用するなら、クラウド費 + 開発工数の方が従量 ¥3/リクエスト より安くなる可能性あり (人件費を除けば)。
  • 機密性。第三者 API に検索クエリを流したくない (例: クライアント名を含む) ケースでは自前が必要。

移行 / 併用ガイド

買って始め、作るかは後で判断: まず当社 API で 試作版 を組んで需要を確かめてから、本当にデータの一部だけが必要 (例: 自社業種の補助金 50 件分だけ) と分かった段階で、そのスライスだけ自前で 巡回取得 する、という併用戦略が現実的です。当社の OpenAPI 仕様書は API リファレンス 経由で公開、MCP ツール仕様も MCP ツール一覧 で読めるため、後から自前に切り替える際の移植も比較的容易です。

ライセンスの落とし穴: 自前の巡回取得スクリプトの最大の罠は出典管理です。集約サイト (noukaweb / hojyokin-portal / biz.stayway 等) を 出典 URL にすると古い金額・終了済み制度を孫引きしてしまい、景表法 / 善管注意義務リスクが顕在化します。当社は社内規約で 集約サイト除外・政府機関一次資料限定 を強制し、全件に 出典 URL + 更新日時 + ライセンス を持たせています。この運用を自前で再現するのは技術より規律の問題で、「とりあえず動くもの」と「本番に出せるもの」の差が大きい領域です。

関連ページ

凡例: 「公開情報なし」「公開情報非公表」は、各社公式サイトに記載が確認できなかった、または当社が把握していない項目を指します。 機能の不在を断定するものではありません。各社 ToS や新規機能追加によって変わります。 また、本ページは特定商取引法 §52 に従い、誇大表現の排除と訂正義務を負います。 訂正が必要な場合は [email protected] 宛にご連絡ください。