Sagebase(政治ベース)は、日本の政治議論を構造化データとして提供するオープンデータプラットフォームです。本ページでは、提供しているデータの詳細をご紹介します。
提供データ一覧
1. 議会議論データ
国会および全国1,966の地方議会における議論を、構造化データとして提供します。
2. 議案賛否データ(準備中)
議案の詳細情報と、その議案に対する議員・政党の賛否記録を提供予定です。
議会議論データ
データの概要
**「誰が、いつ、何を発言したのか」**を、国会および全国すべての地方議会で記録しています。
単なる発言の羅列ではなく、議論の文脈を保持した構造化データとして提供することで、政治家の発言を正しく理解できる形式になっています。
提供するデータ項目
発言者情報
- 発言者名: 議事録に記載された発言者の氏名
- 政治家との紐付け: 実際の政治家プロフィールとの関連付け
- 所属政党(発言時点): その発言が行われた時点での所属政党
- 役職・肩書き: 発言時の役職(例:〇〇委員長、〇〇大臣)
発言内容
- 発言全文: 議事録に記録された発言内容の全文
- 発言日時: いつ発言されたのか(会議の開催日時)
- 会議情報: どの議会のどの会議での発言か
- 議会名(例:衆議院、東京都議会、横浜市議会)
- 会議名(例:本会議、予算委員会)
- 会議の種類(定例会、臨時会など)
議論の文脈情報
政治ベースでは、発言単位ではなく、議論全体の流れを把握できるデータ構造を提供しています。
- 前後の発言: ある発言の前後にどのような発言があったのか
- 議論の流れ: 質疑応答の一連の流れ
- 発言順序: 会議内での発言の順番
これにより、発言を文脈から切り離さずに理解することができます。
データのカバレッジ
- 国会: 衆議院・参議院のすべての会議
- 都道府県議会: 47都道府県すべて
- 市区町村議会: 1,918市区町村すべて
- 合計: 1,966の議会
データの特徴
1. 時系列での追跡が可能
特定の政治家について、過去の発言を時系列で追跡できます。
活用例:
- 「〇〇議員は過去に環境問題についてどのような発言をしてきたか」
- 「△△大臣の答弁の変化を時系列で確認したい」
2. 所属政党の変遷も記録
政治家が政党を移籍した場合でも、その発言時点での所属政党を記録しています。
活用例:
- 「A党に所属していた時期の発言と、B党に移籍した後の発言を比較したい」
- 「政党別の政策スタンスの違いを分析したい」
3. 議論全体の文脈を保持
発言を単独で切り出すのではなく、前後の発言との関係性を保持しています。
活用例:
- 「質問に対してどのような答弁がなされたのか」
- 「議論がどのように展開されたのか」
- 「ある発言が、どのような文脈で語られたのか」
議案賛否データ(準備中)
データの概要
議案の詳細情報と、誰が(どの政党が)その議案に賛成・反対したのかを記録したデータを提供予定です。
提供予定のデータ項目
議案の詳細情報
- 議案名: 議案のタイトル
- 議案内容: 議案の概要・詳細
- 提出者: 誰が提出した議案か(議員名、政党名)
- 審議経過: どのような審議を経たか
- 採決日: いつ採決が行われたのか
- 採決結果: 可決/否決
議員ごとの賛否記録
- 議員名: 賛否を表明した議員の氏名
- 所属政党(採決時点): 採決時の所属政党
- 賛否: 賛成/反対/棄権/欠席
- 会議情報: どの会議での採決だったか
政党ごとの賛否傾向
- 政党別の賛否: 各政党がどのように賛否を表明したか
- 党議拘束の有無: 党として統一した賛否だったか
- 賛否の分かれた議案: 党内で意見が分かれた案件
データの特徴
1. 議案の全体像を把握
議案そのものの情報(内容、提出者、審議経過、可決/否決)を包括的に提供します。
活用例:
- 「この法案はどのような内容で、誰が提出し、可決されたのか」
- 「環境関連の議案がどれだけ提出され、何が可決されているか」
2. 議員個人の賛否履歴を追跡
特定の議員について、過去の賛否記録を一覧で確認できます。
活用例:
- 「〇〇議員は環境関連の議案にどう賛否してきたか」
- 「選挙公約と実際の賛否の一致度を検証したい」
3. 政党間の違いを可視化
同じ議案に対して、各政党がどのように賛否を表明したかを比較できます。
活用例:
- 「A党とB党は同じ議案に対してどう賛否したか」
- 「各政党の政策スタンスの違いを定量的に分析したい」
4. 議案ごとの詳細分析が可能
特定の議案について、誰が賛成し、誰が反対したのかを詳細に分析できます。
活用例:
- 「この重要法案に対する各議員の立場はどうだったか」
- 「党議拘束がかかっていない議案での賛否傾向を調べたい」
データへのアクセス方法
政治ベースのデータは、主要なデータプラットフォームで公開データセットとして提供します。
BigQuery Analytics Hub
Google Cloud Platform(GCP)のBigQuery Analytics Hubで、公開データセットとして提供します。
- メリット:
- SQLで直接クエリ可能
- 大規模データの高速処理
- GCPの他サービスとの連携が容易
- 無料で利用可能(クエリ実行コストのみ)
Snowflake Marketplace
Snowflake Marketplaceで、公開データセットとして提供します。
- メリット:
- SQLで直接クエリ可能
- Snowflakeユーザーは即座にアクセス可能
- データのコピー不要(Zero-Copy Cloning)
- エンタープライズグレードのセキュリティ
提供時期
現在、データセットの整備とプラットフォームへの公開準備を進めています。公開開始時期については、本ページで順次お知らせいたします。
お問い合わせ
データの利用方法や詳細については、お問い合わせページからご連絡ください。