バラバラなファイル形式
議事録はPDF、Word、HTML、平文など、自治体や会議体ごとに異なる形式で公開されています。統一的なアクセス手段がなく、データの収集・活用が困難です。
国会および全国1,966の地方議会における議論と議案賛否を、検索・分析可能な形式で提供するオープンデータプラットフォーム
Sagebase(政治ベース)は、日本の政治議論を構造化データとして提供するオープンデータプラットフォームです。
研究者、ジャーナリスト、市民活動家、アプリケーション開発者など、政治データを必要とするすべての方に、信頼性の高いデータソースを提供します。
現在、日本の政治議論データには以下のような課題があり、市民が政治を把握することを困難にしています。
議事録はPDF、Word、HTML、平文など、自治体や会議体ごとに異なる形式で公開されています。統一的なアクセス手段がなく、データの収集・活用が困難です。
議事録のまとめ方、表現方法、記載項目は自治体ごとに異なります。同じ情報を探すにも、それぞれの形式を理解する必要があります。
多くの議事録は、発言者と発言内容を機械的に分離できない形式で記録されています。「誰が何を言ったか」を把握するには、人手での読み込みが必要です。
Sagebaseは、これらの議事録を発言単位で構造化し、「誰が、いつ、何を発言したか」をマシンリーダブルな形式で提供します。これにより、政治議論の検索・分析・活用が初めて可能になります。
国会から全国すべての地方議会まで、日本の政治議論を網羅的にカバー。誰が、いつ、何を発言したのか、どの議案が可決・否決されたのかを、一元的に検索・参照できます。
議論の文脈を保持した構造化データとして提供。発言単位ではなく、議論の流れ全体を把握できる形式で、その時点での所属政党情報も含めて提供します。
政治家の発言と議案への賛否の記録を永続的に保持することで、政治の透明性を高め、説明責任を果たすための社会的インフラとして機能します。
政治ベースは、データの正確性向上に継続的に取り組んでいます。自動処理の限界をご理解いただいた上で、皆さまと一緒により良いデータを作り上げていきます。
データの構造化にはAI(大規模言語モデル)を使用しています。そのため、100%の正確性は保証できません。発言者の特定や所属政党の紐付けなどに誤りが含まれる可能性があります。
私たちは誤りの発見と修正に継続的に取り組んでいます。AI処理の精度向上、人手によるレビュー、そしてユーザーからのフィードバックを通じて、データ品質の向上を目指します。
お寄せいただいたフィードバックを基に、必ず正しいデータに修正します。誤りを発見された場合は、お問い合わせページからご連絡ください。迅速に対応いたします。
「誰が、いつ、何を発言したのか」を、国会および全国すべての地方議会で構造化データとして提供します。
議案の詳細情報と、誰が(どの政党が)その議案に賛成・反対したのかを記録したデータを提供予定です。
政治行動の実証研究、政策分析、比較研究などに活用
ファクトチェック、調査報道、データジャーナリズムの基盤として
政治監視、エビデンスに基づく政策提言、説明責任の追及に
政治情報アプリ、検索サービス、可視化ツールの開発に
非営利法人として、中立で信頼性の高いデータを提供します。