自動ニュース作成G
2024年8月23日 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース)
https://www.ndl.go.jp/jp/news/fy2024/240823_01.html
2024-08-25 23:05:31
>国立国会図書館は、帝国議会会議録検索システム
◇
において、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)処理により作成した本文テキストデータを、新たに公開しました。
>なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い(誤字・脱字)や認識不能を意味する文字「〓(ゲタ文字)」があり、検索や表示(発言単位の切り分け)が正確に行えない場合があります。
>これらについては、公開後もデータ整備を行ってまいります。