Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  17,289,969
  • Công bố khoa học và công nghệ Việt Nam

Khoa học kỹ thuật và công nghệ

BB

Nguyễn Hữu Nội, Trần Nguyên Ngọc, Cao Văn Lợi(1)

HỌC ĐẶC TRƯNG BÁN GIÁM SÁT DỰA TRÊN KỸ THUẬT NÉN ĐỂ TĂNG CƯỜNG PHÁT HIỆN BẤT THƯỜNG MẠNG IoT

SHRINKAGE-BASED WEAKLY-SUPERVISED FEATURE LEARNING TO ENHANCE IoT ANOMALY DETECTION

Journal of Science and Technique: Section on Information and Communication Technology

2024

01

97

Phát hiện bất thường trong mạng IoT đang phải đối mặt với những thách thức do có nhiều khó khăn trong việc thu thập và gắn nhãn cho dữ liệu bất thường nói chung cũng như dữ liệu tấn công nói riêng. Các phương pháp gần đây dựa vào giám sát yếu, như FeaWAD và iFWAD, đã giải quyết vấn đề khó khăn này bằng cách xây dựng các bộ phát hiện từ sự kết hợp giữa dữ liệu không có nhãn và một số ít dữ liệu bất thường được gán nhãn. Tuy nhiên, những phương pháp này thiếu ràng buộc trong giai đoạn học đặc trưng để phân tách dữ liệu bình thường và bất thường. Mã hóa tự động dựa trên kỹ thuật nén (Shrink Autoencoder) có khả năng phân tách các lớp dữ liệu nàybằng cách nén dữ liệu bình thường về xung quanh gốc tọa độ, và dành phần không gian còn lại cho bất thường có thể xuất hiện trong tương lai. Lấy cảm hứng từ Shrink Autoencoder, mục tiêu nghiên cứu này giới thiệu Shrink iFWAD (gọi là sFWAD), nhúng một bộ điều chỉnh giúp nén dữ liệu vào mô hình iFWAD. Thành phần shrink giúp bộ mã hóa đặc trưng của sFWAD học cách phạt dữ liệu bình thường gần giá trị không, đồng thời kéo các dữ liệu bất thường của IoT ra xa khỏi giá trị không. Quá trình này giúp thành phần sinh điểm bất thường của sFWAD nhận dạng hiệu quả các dữ liệu bất thường của IoT. Phương pháp đề xuất này được đánh giá so với các kỹ thuật giám sát yếu hàng đầu và các phương pháp phát hiện bất thường thông thường khác sử dụng tập dữ liệu N-BaIoT. Kết quả thực nghiệm cho thấy phương pháp này thường cho kết quả tốt hơn các phương pháp học giám sát yếu gần đây cũng như các phương pháp thông thường theo hiệu suất phát hiện bất thường mạng IoT. Trong phát hiện bất thường chưa biết trước/mới, tỉ lệ phát hiện sai của sFWAD (0.008) thấp hơn đáng kể so với các phương pháp iFWAD (0.026) và RoSAS (0.015).

IoT anomaly detection faces challenges due to the rarity of IoT anomalies and the limited availability of labels. Recent weakly-supervised approaches, like Feature Encoding with AutoEncoder and Weakly-supervised Anomaly Detection (FeaWAD) and an improvement on FeaWAD (iFWAD), address this scarcity by constructing detectors from a combination of unlabeled data and a small labeled anomalous set. While effective, these methods lack constraints during the feature learning stage to delineate normal regions from anomalies. Notably, the Shrink AutoEncoder promotes clustering of normal data around the origin while preserving space for anomalies. Drawing inspiration from the Shrink AutoEncoder, the study aims to introduce Shrink iFWAD (called sFWAD), embedding a shrink regularizer into iFWAD. This term compels the feature encoder of sFWAD to learn penalizing normal data that is close to zero, while simultaneously pushing IoT anomalies further away from zero. This process facilitates the anomalous score generator of sFWAD in efficiently identifying IoT anomalies. The proposed method is evaluated against state-of-the-art weakly-supervised techniques and other common anomaly detection methods using the N-BaIoT dataset. Experimental results indicate that sFWAD often surpasses recent weakly-supervised methods as well as the common techniques in IoT anomaly detection performance. For identifying unknown/new IoT anomalies,Missed Detection Rate from sFWAD (0.008) is much lower than those from iFWAD (0.026) and RoSAS (0.015).