自動ニュース作成G
熊本大学とTOPPAN、くずし字AI-OCRで未解読だった「細川家文書」約5万枚の解読に成功。検索システムも構築
https://internet.watch.impress.co.jp/docs/news/1611895.html
2024-07-29 21:37:02
>また、くずし字資料の解読システムと連動するキーワード検索システムを開発し、江戸時代前期の細川藩領国の、約90年間にわたる社会的事件や統治制度についての記述を含んだ資料を、即時に検索収集できるようになったという。
>例えば、今回解読した資料に対し「地震」「大雨」「洪水」「虫」「飢」「疫」などの災害に関するキーワードで検索したところ、300件以上の記述が発見された。その中には、いままで知られていなかった自然災害、疫病流行や飢饉など、未知の重要な記述もあり、今後研究が進められるという。
すごいな
・プロでも読めんかったんかーい。 >専門家でも解読が困難な、難易度の高いくずし字
・あれ?海外の女性が作った最初のくずし文字AIはドコにいったんだろ? 確かGoogleに勤めていたと思ったが。 > TOPPANが開発したくずし字AI-OCR
・この人 https://ledge.ai/articles/tkasasagi-interview
・自分も文字がとてつもなく汚い人に解読お願いしたら読めそう
・どんどんデータを食わせて学習精度上げていって神代文字まで読んでくれないものか
・ヴォイニッチ手稿とか読めないんか