Soysal, TalhaAdıgüzel HandeÖktem, AlpHaman, AlicanCan, Ethem FatihDuygulu, PınarKalpaklı, Mehmet2016-02-082016-02-082010-04http://hdl.handle.net/11693/28491Date of Conference: 22-24 April 2010Conference name: 2010 IEEE 18th Signal Processing and Communications Applications ConferenceBu çalımada Atatürk'ün el yazmalarının etkin ve kolay eriimini salayabilecek kelime tabanlı bir arama sisteminin ilk aaması olarak sayısallatırılmı belgelerin ön ilemesi ve satır ve kelimelere bölütlenmesi konusunda çalımalar yapılmıtır. Tarihi el yazması belgeler çeitli zorluklar getirmekte, basılı belgelerde kullanılan yöntemlerin uygulanması baarılı sonuçlar üretememektedir. Bu nedenle daha gelimi çözümler üzerine younlaarak satır bölütlemede Hough dönüümü [1] tabanlı bir yöntem uyarlanmı, kelime bölütlemede ise yazıların eiklii göz önüne alınmıtır. Afet nan tarafından salanan belgelerin [4] 30 sayfası üzerinde yapılan çalımalarda elde edilen sonuçlar gelecek çalımalar açısından umut vericidir. In this paper, as a first step to an easy and convenient way to access the manuscripts of Atatürk with a word based search engine, the preprocessing of digitalized documents and their line and word segmentation is studied. The techniques that are applied on printed documents may not yield satisfactory results. Due to this fact, more developed techniques are decided to be applied consisting of a technique based on Hough transform [1] for line segmentation and a technique that is based on dealing with skewness of lines for word segmentation. The results, which are acquired through studies that are conducted on the documents provided by Afet İnan and consisting of 30 pages [2], prove to be highly accurate and promising for future researches. ©2010 IEEE.TurkishLine segmentationPrinted documentsWord segmentationHough transformsSearch enginesSignal processingComputational linguisticsAtatürk'ün el yazmalarının işlenmesiProcessing the manuscripts of AtatürkConference Paper10.1109/SIU.2010.5652708