Browsing by Subject "Handwritten document"
Now showing 1 - 2 of 2
- Results Per Page
- Sort Options
Item Open Access A hybrid approach for line segmentation in handwritten documents(2012) Adıgüzel, Hande; Şahin, Emre; Duygulu, PınarThis paper presents an approach for text line segmentation which combines connected component based and projection based information to take advantage of aspects of both methods. The proposed system finds baselines of each connected component. Lines are detected by grouping baselines of connected components belonging to each line by projection information. Components are assigned to lines according to different distance metrics with respect to their size. This study is one of the rare studies that apply line segmentation to Ottoman documents. Further, it proposes a new method, Fourier curve fitting, to detect the peaks in a projection profile. The algorithm is demonstrated on different printed and handwritten Ottoman datasets. Results show that the method manages to segment lines both from printed and handwritten documents under different writing conditions at least with 92% accuracy.Item Open Access Osmanlıca belgelerin satırlara bölütlenmesi(IEEE, 2012-04) Adıgüzel Hande; Duygulu-Şahin, Pınar; Kalpaklı, MehmetOsmanlıca arşivler dünyanın pek çok yerinden tarihçilerin ve konuyla ilgilenen araştırmacıların ilgisini çekmektedir. Bu arşivlerin elle çevirisi için uzman kişilerin yardımı gerekmektedir ve bu işlemin zaman ve maddi açıdan uygulanabilirliği düşüktür. Bu sebeple, sayısallaştırılmış bu belgelerin otomatik çevirisi gerekmektedir. Bu çalışmada Osmanlıca el yazmalarının etkin ve kolay erişimini sağlayacak kelime erişimi sisteminin ilk aşaması olarak sayısallaştırılmış belgelerin ön işlemesi ve satırlara bölütlenmesi konusunda çalışmalar yapılmıştır. Basılı belgelerde kullanılan geleneksel satırlara bölütleme yöntemleri tarihi belgelerde çok başarılı sonuçlar getirememektedir. Bu nedenle daha gelişmiş çözümler üzerine yoğunlaşarak satır bölütlemede izdüşüm tabanlı bir yöntem geliştirilmiştir. Osmanlıca taş baskı belgelerin 120 sayfası üzerinde yapılan çalışmalarda elde edilen sonuçlar uygulanan yöntemin başarılı olduğunu göstermektedir. Many researches and historians from all around the world are interested in historical Ottoman archives. However, translation of these documents requires competent historians which is not a feasible method in terms of time and cost. Thus, automatic translation of these documents are required. In this paper, preprocessing steps of accessing the Ottoman manuscripts with a word based search engine is studied. These preprocessing steps are binarization and line segmentation of digitalized documents. The traditional line segmentation methods applied to printed documents do not yield to satisfactory results for historical and handwritten documents. Due to this fact, more complex line segmentation techniques must be used. In this study, we developed a projection profile based method for line segmentation and local binarization is used. The experiments are conducted on a 120 page Ottoman archive and the results show that the proposed system is successful.