機能紹介

Polibaseは、日本の政治活動を追跡・分析するための多様な機能を提供しています。

1. 議事録処理

会議の議事録(PDFやテキスト)から発言を自動的に抽出します。

  • LangGraphを使用した複数ステップの処理
  • PDFからのテキスト抽出
  • 発言の構造化と保存

2. 政治家管理

政党のウェブサイトから政治家データを自動的に収集・管理します。

  • Webスクレイピングによるデータ収集
  • 政治家プロフィールの更新
  • 所属政党の追跡

3. 発言者マッチング

LLM(大規模言語モデル)を活用して、議事録中の発言者を実際の政治家に紐付けます。

  • Google Gemini APIを使用した高精度マッチング
  • ハイブリッドアプローチによる正確性の向上
  • 段階的な抽出とマッチング

4. 会議メンバー抽出

会議のメンバーを段階的に抽出し、手動レビューを可能にします。

  • ステージング機能による段階的処理
  • 手動レビューと承認
  • データ品質の確保

5. 議員団追跡

議会内の投票グループ(議員団/会派)を管理します。

  • 投票パターンの追跡
  • グループメンバーシップの管理
  • 投票行動の分析

6. データカバレッジモニタリング

日本全国1,966の自治体にわたるデータの完全性を可視化します。

  • インタラクティブダッシュボード
  • 地域別データカバレッジ
  • データ品質メトリクス

7. Web UI

Streamlitベースの使いやすいインターフェース。

  • データ管理機能
  • 視覚的なデータ表示
  • インタラクティブな操作

8. LLM処理履歴追跡

すべてのLLM処理を記録し、監査証跡を提供します。

  • 処理履歴の記録
  • プロンプトバージョン管理
  • 再現性の確保

技術的な特徴

  • クリーンアーキテクチャ: 明確なレイヤー分離
  • 型安全性: Python型ヒントとpyright
  • コード品質: Ruffによるフォーマットとリント
  • テスト: pytestによる非同期テスト
  • Docker: コンテナベースの開発環境

詳しくは、GitHubリポジトリをご覧ください。