Browsing by Subject "Automatic translation"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item Open Access Osmanlıca belgelerin satırlara bölütlenmesi(IEEE, 2012-04) Adıgüzel Hande; Duygulu-Şahin, Pınar; Kalpaklı, MehmetOsmanlıca arşivler dünyanın pek çok yerinden tarihçilerin ve konuyla ilgilenen araştırmacıların ilgisini çekmektedir. Bu arşivlerin elle çevirisi için uzman kişilerin yardımı gerekmektedir ve bu işlemin zaman ve maddi açıdan uygulanabilirliği düşüktür. Bu sebeple, sayısallaştırılmış bu belgelerin otomatik çevirisi gerekmektedir. Bu çalışmada Osmanlıca el yazmalarının etkin ve kolay erişimini sağlayacak kelime erişimi sisteminin ilk aşaması olarak sayısallaştırılmış belgelerin ön işlemesi ve satırlara bölütlenmesi konusunda çalışmalar yapılmıştır. Basılı belgelerde kullanılan geleneksel satırlara bölütleme yöntemleri tarihi belgelerde çok başarılı sonuçlar getirememektedir. Bu nedenle daha gelişmiş çözümler üzerine yoğunlaşarak satır bölütlemede izdüşüm tabanlı bir yöntem geliştirilmiştir. Osmanlıca taş baskı belgelerin 120 sayfası üzerinde yapılan çalışmalarda elde edilen sonuçlar uygulanan yöntemin başarılı olduğunu göstermektedir. Many researches and historians from all around the world are interested in historical Ottoman archives. However, translation of these documents requires competent historians which is not a feasible method in terms of time and cost. Thus, automatic translation of these documents are required. In this paper, preprocessing steps of accessing the Ottoman manuscripts with a word based search engine is studied. These preprocessing steps are binarization and line segmentation of digitalized documents. The traditional line segmentation methods applied to printed documents do not yield to satisfactory results for historical and handwritten documents. Due to this fact, more complex line segmentation techniques must be used. In this study, we developed a projection profile based method for line segmentation and local binarization is used. The experiments are conducted on a 120 page Ottoman archive and the results show that the proposed system is successful.