MPEG-7 uyumlu video veri tabanlari için önemli nesnelerin otomatik olarak bulunmasi

Date

2008-04

Editor(s)

Advisor

Supervisor

Co-Advisor

Co-Supervisor

Instructor

Source Title

2008 IEEE 16th Signal Processing, Communication and Applications Conference, SIU

Print ISSN

Electronic ISSN

Publisher

IEEE

Volume

Issue

Pages

Language

Turkish

Journal Title

Journal ISSN

Volume Title

Series

Abstract

Bu çalışma, genel olarak nesneye dayalı endekslemeyi destekleyen, özel olarak MPEG-7 uyumlu veritabanları için, videolardan önemli nesnelerin otomatik olarak çıkarılmasını saglayabilecek bir yöntem sunmaktadır. Şimdiye kadar yapılan benzer çalışmalar genellikle resimler üzerinde yoğunlaşmış ve sadece ilk bakışta dikkati çeken alanları bulmaya çalışmıştır. Önerilen yöntem ise videolar üzerinde çalışmak için tasarlanmış olup sadece ilk bakışta dikkat çeken bölgelerin değil, videonun endekslenmesi için önemli sayılabilecek bölgelerin de bulunabilmesini amaçlamaktadır. Bunun için önce video kareleri bölütlere ayrılmakta, sonra her bölüt için yerel ve genel renk, biçim, doku ve hareket bilgileri hesaplanmakta, son olarak bu özellikler kullanılarak eğitilmiş bir destek vektor makinesi (SVM) kullanılarak bölgelerin önemli olup olmadığına karar verilmektedir. İlk deney sonuçları önerilen y öntemin başarılı olduğunu ve elde edilen nesnelerin öncekilere g öre anlamsal olarak daha iyi olduğunu göstermektedir.

We describe a method to automatically extract video objects, which are important for object-based indexing of videos in an MPEG-7 compliant video database system. Most of the existing salient object detection approaches detect visually conspicuous image structures, while our method aims to find regions that may be important for indexing in a video database system. Our method works on a shot basis. We first segment each frame to obtain homogeneous regions in terms of color and texture. Then, we extract a set of local and global color, shape, texture and motion features for each region. Finally, the regions are classified as being salient or non-salient using SVMs trained on a few hundreds of example regions. Experimental results from news video segments show that the proposed method is more effective in extracting the important regions in terms of human visual perception. ©2008 IEEE.

Course

Other identifiers

Book Title

Citation