データの取得・集計手法

ギジログが、どの情報源から・どのように国会の会議録データを取得し、各ページの「データ分析」をどのような基準で集計しているかを説明します。掲載している集計は、公的データを機械的に整理・集計した独自の指標であり、発言原文の単純な再掲ではありません。

最終更新: 2026-06-25

1. データの出典

会議録データは、国立国会図書館が運用する国会会議録検索システムの公開APIを情報源としています。本会議・各委員会等の会議録に含まれる発言を、発言者・会派・役職・院・会議名・日付とともに取得しています。

データの利用にあたっては、情報源である国立国会図書館の利用条件に従っています。最新かつ正確な情報は、上記の一次情報源をご確認ください。

更新は週次を目安に行っています（取得スクリプトを実行して反映する運用のため、国会会議録側の公開状況により前後することがあります）。このため、最新の発言が反映されるまでに時間差が生じる場合があります。

各ページの「データ分析」欄は、そのページに含まれる発言を対象に、次の指標を機械的に集計したものです。

集計の単位は一貫して「発言の件数」です。件数は発言の量を示すものであり、発言の重要度・質・賛否を表すものではありません。表記ゆれや同名異人などにより集計に誤差が生じる場合があるため、解釈にあたっては元データの確認を推奨します。

発言テーマ別の分析では、人手で整備したテーマ辞書を用いて発言を分類しています。各テーマには代表的なキーワード・同義語を登録し、発言本文にそれらを含むかどうかで分類します。

テーマ分類はキーワードの一致に基づく機械的な手法のため、文脈によっては過不足が生じます。辞書は継続的に見直しています。