Parametrik olmayan yoğunluk tahmincileri ile ardışık anomali tespiti

Date
2019-04
Editor(s)
Advisor
Supervisor
Co-Advisor
Co-Supervisor
Instructor
Source Title
27th Signal Processing and Communications Applications Conference (SIU), 2019
Print ISSN
Electronic ISSN
Publisher
IEEE
Volume
Issue
Pages
1 - 4
Language
Turkish
Journal Title
Journal ISSN
Volume Title
Series
Abstract

Bu bildiride, gözlemlenen verideki anomalileri, gözetimsiz bir çerçevede, iki aşamalı yöntemle bulmak için anomali tespit algoritması tanıtılmıştır. İlk aşamada, ardışık olarak gözlemlenen verinin yoğunluğu çekirdek temelli özgün bir yöntemle tahmin edilmektedir. Bu amaçla, gözlem alanı bölünmekte ve her bölgede parametrik olmayan Çekirdek Yoğunluk Tahmincisi (ÇYT) veri dağılımına dair hiçbir varsayımda bulunulmadan kullanılmaktadır. Sonra, yoğunluk tahmini eşik değeriyle karşılaştırılarak verinin anomali olup olmadığına karar verilmektedir. Ayrıca, çekirdek temelli yöntemlerdeki bant genişliği seçimi problemi de verimli bir şekilde çözülmektedir. Bu amaçla, her bir bölgeye çekirdek bant genişliği seti atanmakta ve her tahmincinin ait olduğu bölgeye göre en iyi bant genişliği seçeneğine zamanla ulaşması sağlanmaktadır. Sayısal örneklerde, tanıtılan algoritmanın literatürde sıklıkla kullanılan anomali tespit metodlarına göre yüksek performans artışı elde ettiği gösterilmektedir.


In this paper, we introduce an online anomaly detection algorithm to detect the anomalies in the observed data with two step approach in an unsupervised framework. In the first step, we estimate the density of the sequentially observed data with a novel kernel based approach. To this end, we partition the observation space and use nonparametric Kernel Density Estimator (KDE) in each region on a partition such that we do not assume any underlying distribution for the data. Then, we compare the estimated density of the data with a threshold to decide whether it is anomalous. We also solve the bandwidth selection problem in kernel based approaches in an efficient way. For this, we assign a set of kernel bandwidth values to each region, and make each estimator to converge to the best bandwidth choice for the corresponding subspaces in time. In our experiments, we show that our algorithm significantly outperforms the anomaly detection algorithms, which are highly used in the literature.

Course
Other identifiers
Book Title
Citation
Published Version (Please cite this version)