Osmanlıca belgelerin satırlara bölütlenmesi

dc.contributor.authorAdıgüzel Handeen_US
dc.contributor.authorDuygulu-Şahin, Pınaren_US
dc.contributor.authorKalpaklı, Mehmeten_US
dc.coverage.spatialMuğla, Turkeyen_US
dc.date.accessioned2016-02-08T12:13:56Z
dc.date.available2016-02-08T12:13:56Z
dc.date.issued2012-04en_US
dc.departmentDepartment of Computer Engineeringen_US
dc.departmentDepartment of Historyen_US
dc.descriptionDate of Conference: 18- 20 April, 2012
dc.description.abstractOsmanlıca arşivler dünyanın pek çok yerinden tarihçilerin ve konuyla ilgilenen araştırmacıların ilgisini çekmektedir. Bu arşivlerin elle çevirisi için uzman kişilerin yardımı gerekmektedir ve bu işlemin zaman ve maddi açıdan uygulanabilirliği düşüktür. Bu sebeple, sayısallaştırılmış bu belgelerin otomatik çevirisi gerekmektedir. Bu çalışmada Osmanlıca el yazmalarının etkin ve kolay erişimini sağlayacak kelime erişimi sisteminin ilk aşaması olarak sayısallaştırılmış belgelerin ön işlemesi ve satırlara bölütlenmesi konusunda çalışmalar yapılmıştır. Basılı belgelerde kullanılan geleneksel satırlara bölütleme yöntemleri tarihi belgelerde çok başarılı sonuçlar getirememektedir. Bu nedenle daha gelişmiş çözümler üzerine yoğunlaşarak satır bölütlemede izdüşüm tabanlı bir yöntem geliştirilmiştir. Osmanlıca taş baskı belgelerin 120 sayfası üzerinde yapılan çalışmalarda elde edilen sonuçlar uygulanan yöntemin başarılı olduğunu göstermektedir. Many researches and historians from all around the world are interested in historical Ottoman archives. However, translation of these documents requires competent historians which is not a feasible method in terms of time and cost. Thus, automatic translation of these documents are required. In this paper, preprocessing steps of accessing the Ottoman manuscripts with a word based search engine is studied. These preprocessing steps are binarization and line segmentation of digitalized documents. The traditional line segmentation methods applied to printed documents do not yield to satisfactory results for historical and handwritten documents. Due to this fact, more complex line segmentation techniques must be used. In this study, we developed a projection profile based method for line segmentation and local binarization is used. The experiments are conducted on a 120 page Ottoman archive and the results show that the proposed system is successful.en_US
dc.description.provenanceMade available in DSpace on 2016-02-08T12:13:56Z (GMT). No. of bitstreams: 1 bilkent-research-paper.pdf: 70227 bytes, checksum: 26e812c6f5156f83f0e77b261a471b5a (MD5) Previous issue date: 2012en
dc.identifier.doi10.1109/SIU.2012.6204605en_US
dc.identifier.urihttp://hdl.handle.net/11693/28198
dc.language.isoTurkishen_US
dc.publisherIEEE
dc.relation.isversionofhttp://dx.doi.org/10.1109/SIU.2012.6204605en_US
dc.source.title20th Signal Processing and Communications Applications Conference, SIU 2012en_US
dc.subjectAutomatic translationen_US
dc.subjectBinarizationsen_US
dc.subjectHandwritten documenten_US
dc.subjectLine segmentationen_US
dc.subjectPre-processing stepen_US
dc.subjectPrinted documentsen_US
dc.subjectProjection profile based methodsen_US
dc.subjectHistoryen_US
dc.subjectSearch enginesen_US
dc.subjectSignal processingen_US
dc.titleOsmanlıca belgelerin satırlara bölütlenmesien_US
dc.title.alternativeLine segmentation of Ottoman documentsen_US
dc.typeConference Paperen_US

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Line segmentation of Ottoman documents [Osmanlica belgeleri̇n satirlara bölütlenmesi̇].pdf
Size:
1.4 MB
Format:
Adobe Portable Document Format
Description:
Full printable version