Sagebase(政治ベース)は、日本の政治議論を構造化データとして提供するオープンデータプラットフォームです。本ページでは、提供しているデータの詳細をご紹介します。


提供データ一覧

1. 議会議論データ

国会および全国1,966の地方議会における議論を、構造化データとして提供します。

2. 議案賛否データ(準備中)

議案の詳細情報と、その議案に対する議員・政党の賛否記録を提供予定です。


議会議論データ

データの概要

**「誰が、いつ、何を発言したのか」**を、国会および全国すべての地方議会で記録しています。

単なる発言の羅列ではなく、議論の文脈を保持した構造化データとして提供することで、政治家の発言を正しく理解できる形式になっています。

提供するデータ項目

発言者情報

  • 発言者名: 議事録に記載された発言者の氏名
  • 政治家との紐付け: 実際の政治家プロフィールとの関連付け
  • 所属政党(発言時点): その発言が行われた時点での所属政党
  • 役職・肩書き: 発言時の役職(例:〇〇委員長、〇〇大臣)

発言内容

  • 発言全文: 議事録に記録された発言内容の全文
  • 発言日時: いつ発言されたのか(会議の開催日時)
  • 会議情報: どの議会のどの会議での発言か
    • 議会名(例:衆議院、東京都議会、横浜市議会)
    • 会議名(例:本会議、予算委員会)
    • 会議の種類(定例会、臨時会など)

議論の文脈情報

政治ベースでは、発言単位ではなく、議論全体の流れを把握できるデータ構造を提供しています。

  • 前後の発言: ある発言の前後にどのような発言があったのか
  • 議論の流れ: 質疑応答の一連の流れ
  • 発言順序: 会議内での発言の順番

これにより、発言を文脈から切り離さずに理解することができます。

データのカバレッジ

  • 国会: 衆議院・参議院のすべての会議
  • 都道府県議会: 47都道府県すべて
  • 市区町村議会: 1,918市区町村すべて
  • 合計: 1,966の議会

データの特徴

1. 時系列での追跡が可能

特定の政治家について、過去の発言を時系列で追跡できます。

活用例:

  • 「〇〇議員は過去に環境問題についてどのような発言をしてきたか」
  • 「△△大臣の答弁の変化を時系列で確認したい」

2. 所属政党の変遷も記録

政治家が政党を移籍した場合でも、その発言時点での所属政党を記録しています。

活用例:

  • 「A党に所属していた時期の発言と、B党に移籍した後の発言を比較したい」
  • 「政党別の政策スタンスの違いを分析したい」

3. 議論全体の文脈を保持

発言を単独で切り出すのではなく、前後の発言との関係性を保持しています。

活用例:

  • 「質問に対してどのような答弁がなされたのか」
  • 「議論がどのように展開されたのか」
  • 「ある発言が、どのような文脈で語られたのか」

議案賛否データ(準備中)

データの概要

議案の詳細情報と、誰が(どの政党が)その議案に賛成・反対したのかを記録したデータを提供予定です。

提供予定のデータ項目

議案の詳細情報

  • 議案名: 議案のタイトル
  • 議案内容: 議案の概要・詳細
  • 提出者: 誰が提出した議案か(議員名、政党名)
  • 審議経過: どのような審議を経たか
  • 採決日: いつ採決が行われたのか
  • 採決結果: 可決/否決

議員ごとの賛否記録

  • 議員名: 賛否を表明した議員の氏名
  • 所属政党(採決時点): 採決時の所属政党
  • 賛否: 賛成/反対/棄権/欠席
  • 会議情報: どの会議での採決だったか

政党ごとの賛否傾向

  • 政党別の賛否: 各政党がどのように賛否を表明したか
  • 党議拘束の有無: 党として統一した賛否だったか
  • 賛否の分かれた議案: 党内で意見が分かれた案件

データの特徴

1. 議案の全体像を把握

議案そのものの情報(内容、提出者、審議経過、可決/否決)を包括的に提供します。

活用例:

  • 「この法案はどのような内容で、誰が提出し、可決されたのか」
  • 「環境関連の議案がどれだけ提出され、何が可決されているか」

2. 議員個人の賛否履歴を追跡

特定の議員について、過去の賛否記録を一覧で確認できます。

活用例:

  • 「〇〇議員は環境関連の議案にどう賛否してきたか」
  • 「選挙公約と実際の賛否の一致度を検証したい」

3. 政党間の違いを可視化

同じ議案に対して、各政党がどのように賛否を表明したかを比較できます。

活用例:

  • 「A党とB党は同じ議案に対してどう賛否したか」
  • 「各政党の政策スタンスの違いを定量的に分析したい」

4. 議案ごとの詳細分析が可能

特定の議案について、誰が賛成し、誰が反対したのかを詳細に分析できます。

活用例:

  • 「この重要法案に対する各議員の立場はどうだったか」
  • 「党議拘束がかかっていない議案での賛否傾向を調べたい」

データへのアクセス方法

政治ベースのデータは、主要なデータプラットフォームで公開データセットとして提供します。

BigQuery Analytics Hub

Google Cloud Platform(GCP)のBigQuery Analytics Hubで、公開データセットとして提供します。

  • メリット:
    • SQLで直接クエリ可能
    • 大規模データの高速処理
    • GCPの他サービスとの連携が容易
    • 無料で利用可能(クエリ実行コストのみ)

Snowflake Marketplace

Snowflake Marketplaceで、公開データセットとして提供します。

  • メリット:
    • SQLで直接クエリ可能
    • Snowflakeユーザーは即座にアクセス可能
    • データのコピー不要(Zero-Copy Cloning)
    • エンタープライズグレードのセキュリティ

提供時期

現在、データセットの整備とプラットフォームへの公開準備を進めています。公開開始時期については、本ページで順次お知らせいたします。


お問い合わせ

データの利用方法や詳細については、お問い合わせページからご連絡ください。