バラバラなファイル形式
議事録はPDF、Word、HTML、平文など、自治体や会議体ごとに異なる形式で公開されています。統一的なアクセス手段がなく、データの収集・活用が困難です。
議会・議案・政治家・選挙――日本の政治活動を網羅的に収集し、検索・分析可能な構造化データとして提供するオープンデータプラットフォーム
現在、日本の政治データには以下のような課題があり、市民が政治の動向を把握することを困難にしています。
議事録はPDF、Word、HTML、平文など、自治体や会議体ごとに異なる形式で公開されています。統一的なアクセス手段がなく、データの収集・活用が困難です。
議事録のまとめ方、表現方法、記載項目は自治体ごとに異なります。同じ情報を探すにも、それぞれの形式を理解する必要があります。
地方自治体の多くの議事録は、発言者と発言内容を機械的に分離できない形式で記録されています。「誰が何を言ったか」を把握するには、人手での読み込みが必要です。
どのような議案を誰が・どの政党が提出しているのか、また議案に誰が賛成・反対したかは、議会ごとに異なる形式で記録されています。会派単位の結果しか公開されない議会も多く、議案の提出から採決までを横断的に把握する手段がありません。
どの議員がいつどの政党・会派に所属していたのか、どの会議体に参加していたのかは体系的に記録されていません。選挙結果も選挙管理委員会のPDFや公報に散在し、当選後の議会活動と紐付いていないため、議員の活動を一気通貫で追うことができません。
国会のデータは比較的整備されていますが、地方自治体の議会・選挙データは公開形式が統一されておらず、機械的な取得が困難です。自治体ごとにWebサイトの構造や公開方法が異なり、全国横断的なデータ収集の大きな障壁となっています。
議会議論・議案・政治家・選挙まで、日本の政治活動を網羅的にデータ化。誰が何を発言し、どの議案にどう投票し、どの選挙でどう戦ったかを、一元的に検索・参照できます。
議論の文脈を保持した構造化データとして提供。発言単位ではなく、議論の流れ全体を把握できる形式で、その時点での所属政党情報も含めて提供します。
政治家の発言と議案への賛否の記録を永続的に保持することで、政治の透明性を高め、説明責任を果たすための社会的インフラとして機能します。
政治ベースは、データの正確性向上に継続的に取り組んでいます。自動処理の限界をご理解いただいた上で、皆さまと一緒により良いデータを作り上げていきます。
データの構造化にはAI(大規模言語モデル)を使用しています。そのため、100%の正確性は保証できません。発言者の特定や所属政党の紐付けなどに誤りが含まれる可能性があります。
私たちは誤りの発見と修正に継続的に取り組んでいます。AI処理の精度向上、人手によるレビュー、そしてユーザーからのフィードバックを通じて、データ品質の向上を目指します。
お寄せいただいたフィードバックを基に、必ず正しいデータに修正します。誤りを発見された場合は、お問い合わせページからご連絡ください。迅速に対応いたします。
国会の全会議を網羅し、地方議会も順次拡大中。「誰が、いつ、何を発言したのか」を構造化データとして提供します。
国会議員約6,400人のデータを完備。地方議員も5,500人以上を収録し、順次拡大しています。
国会の議案1.5万件以上の賛否データを提供中。参議院では押しボタン投票による議員個人の投票記録101万件以上を収録しています。
国政選挙のデータを提供中。地方選挙は順次拡大予定です。
政治行動の実証研究、政策分析、比較研究などに活用
ファクトチェック、調査報道、データジャーナリズムの基盤として
政治監視、エビデンスに基づく政策提言、説明責任の追及に
政治情報アプリ、検索サービス、可視化ツールの開発に
非営利法人として、中立で信頼性の高いデータを提供します。
sage-baseで提供しているデータは、日本の政治活動を透明化するために公開されている以下の情報源に支えられています。 データの整備・公開に取り組まれている全ての関係者に、深く感謝申し上げます。
これらの公開データソースが存在しなければ、このプロジェクトは成立しません。 公式サイトをそのまま参照したい場合は、各リンクからどうぞ。