機能紹介
Polibaseは、日本の政治活動を追跡・分析するための多様な機能を提供しています。
1. 議事録処理
会議の議事録(PDFやテキスト)から発言を自動的に抽出します。
- LangGraphを使用した複数ステップの処理
- PDFからのテキスト抽出
- 発言の構造化と保存
2. 政治家管理
政党のウェブサイトから政治家データを自動的に収集・管理します。
- Webスクレイピングによるデータ収集
- 政治家プロフィールの更新
- 所属政党の追跡
3. 発言者マッチング
LLM(大規模言語モデル)を活用して、議事録中の発言者を実際の政治家に紐付けます。
- Google Gemini APIを使用した高精度マッチング
- ハイブリッドアプローチによる正確性の向上
- 段階的な抽出とマッチング
4. 会議メンバー抽出
会議のメンバーを段階的に抽出し、手動レビューを可能にします。
- ステージング機能による段階的処理
- 手動レビューと承認
- データ品質の確保
5. 議員団追跡
議会内の投票グループ(議員団/会派)を管理します。
- 投票パターンの追跡
- グループメンバーシップの管理
- 投票行動の分析
6. データカバレッジモニタリング
日本全国1,966の自治体にわたるデータの完全性を可視化します。
- インタラクティブダッシュボード
- 地域別データカバレッジ
- データ品質メトリクス
7. Web UI
Streamlitベースの使いやすいインターフェース。
- データ管理機能
- 視覚的なデータ表示
- インタラクティブな操作
8. LLM処理履歴追跡
すべてのLLM処理を記録し、監査証跡を提供します。
- 処理履歴の記録
- プロンプトバージョン管理
- 再現性の確保
技術的な特徴
- クリーンアーキテクチャ: 明確なレイヤー分離
- 型安全性: Python型ヒントとpyright
- コード品質: Ruffによるフォーマットとリント
- テスト: pytestによる非同期テスト
- Docker: コンテナベースの開発環境
詳しくは、GitHubリポジトリをご覧ください。