Osmanlica belgelerde kelime erişimi

dc.citation.epage529en_US
dc.citation.spage526en_US
dc.contributor.authorArifoǧlu, Damlaen_US
dc.contributor.authorDuygulu, Pınaren_US
dc.coverage.spatialAntalya, Turkey
dc.date.accessioned2016-02-08T12:19:12Z
dc.date.available2016-02-08T12:19:12Z
dc.date.issued2011-04en_US
dc.departmentDepartment of Computer Engineeringen_US
dc.descriptionDate of Conference: 20-22 April 2011
dc.descriptionConference name: IEEE 19th Signal Processing and Communications Applications Conference, SIU 2011
dc.description.abstractBu çalışmada, Osmanlıca arşivlerinin analizi amacıyla, kelime erişimi problemi iki farklı resim eşleme yöntemi ile çözülmeye çalışılmaktadır. Bu amaçla (1) Dinamik Zaman Bükmesi (DZB) tabanlı kelime eşleme yöntemi [7] ve (2) Şekil İçeriği (shape context) tanımlayıcısı [10] Osmanlıca belgeler üzerinde uyarlanmıştır. Öncelikle, verilen bir Osmanlıca belgedeki tüm alt-kelimeler bulunmuştur. Birinci yöntemde, her alt-kelime grubu için, üst ve alt kelime profili, siyah pikselden beyaz piksele geçiş sayısı ve dikey izdüşüm özniteliklerinden oluşturulmuş 4 parçalı öznitelik vektörü çıkartılmış, bu özniteliklerin birbirine olan uzaklığı DZB algoritmasıyla bulunmuştur. İkinci yöntemde ise, Şekil İçeriği tanımlayıcısı kullanılarak, alt-kelimelerin birbirine olan uzaklıkları hesaplanmıştır. Uygulanan yöntemler, Fuzuli’nin Leyla ve Mecnun divanının 10 sayfasından oluşan bir Osmanlıca veri kümesi üzerinde denenmiştir. In this paper, two image matching methods are adapted to retrieve words in Ottoman documents. The first method is based on Dynamic Time Warping (DTW) method proposed in [7], while the second method is based on the Shape Context descriptor [10]. Firstly, all sub-words in a given Ottoman document are extracted. In the first method, a 4-variant feature vector (upper and lower word profiles, background to ink transition, vertical projection) is calculated for each subword and feature vectors' distance to each other is found by DTW algorithm. In the second method, shape context descriptor is used to calculate the distances of sub-word images. The methods are tested on an Ottoman data set, which consists of 10 pages of Leyla and Mecnun Divan of Fuzuli. © 2011 IEEE.en_US
dc.description.provenanceMade available in DSpace on 2016-02-08T12:19:12Z (GMT). No. of bitstreams: 1 bilkent-research-paper.pdf: 70227 bytes, checksum: 26e812c6f5156f83f0e77b261a471b5a (MD5) Previous issue date: 2011en
dc.identifier.doi10.1109/SIU.2011.5929703en_US
dc.identifier.urihttp://hdl.handle.net/11693/28383en_US
dc.language.isoTurkishen_US
dc.publisherIEEEen_US
dc.relation.isversionofhttps://doi.org/10.1109/SIU.2011.5929703en_US
dc.source.titleIEEE 19th Signal Processing and Communications Applications Conference, SIU 2011en_US
dc.subjectData setsen_US
dc.subjectDescriptorsen_US
dc.subjectFeature vectorsen_US
dc.subjectMatching methodsen_US
dc.subjectON dynamicsen_US
dc.subjectShape contextsen_US
dc.subjectSubwordsen_US
dc.subjectVertical projectionen_US
dc.subjectWord profilesen_US
dc.subjectWord retrievalen_US
dc.subjectSignal processingen_US
dc.subjectImage matchingen_US
dc.titleOsmanlica belgelerde kelime erişimien_US
dc.title.alternativeWord retrieval in Ottoman documentsen_US
dc.typeConference Paperen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Osmanlıca_belgelerde_kelime_erişimi.pdf
Size:
1.23 MB
Format:
Adobe Portable Document Format
Description: