使用ABBYY、VGG模型和Yolov5創建歷史報紙相冊
《香港早期小報》於2022年推出,收錄了二十世紀初香港出版的小報。與普通報刊相比,小報以大眾休閒娛樂市場為主,題材涵蓋政治、小說、戲曲、戲劇、漫畫、色情等。
本次研究選取的《娛樂之音》是以娛樂內容為主的小報,當中包含電影、粵劇內容,並附有大量的插圖。我們的團隊提出一種利用計算機視覺及深度學習的創新方法來構建數碼圖像相冊,並通過歷史報紙中的圖像講述故事。該研究結果會發表於2023年IEEE第六屆模式識別與人工智能國際會議論文集。
我們期望創建一系列數碼網上圖像相冊,當中的圖像皆是從報紙中自動檢測、提取和分類出來的。我們對不同模型的準確性進行了評估和比對,包括 ABBYY(商業軟件)、VGG nls-chapbook模型(基於EfficientDet的模型工具)及Yolov5(深度學習的目標檢測模型)。隨後,我們將提取的圖像分類,並為當中的人物建立個別的數碼相冊。
相關連結: