Các nhiệm vụ khác
liên kết website
Lượt truy cập
 Lượt truy cập :  13079543
  • Kết quả thực hiện nhiệm vụ

102.01-2016.01

2019-37T-758/KQNC

Tối ưu hóa các kỹ thuật lập chỉ mục trong đối sánh mẫu

Trường Đại học Hồng Đức

UBND Tỉnh Thanh Hóa

Quốc gia

TS. Phạm Thế Anh

PGS. TS. Đỗ Năng Toàn, TS. Roman Raveaux, ThS. Lê Văn Hào, ThS. Lê Đình Nghiệp

Khoa học máy tính

01/04/2017

01/04/2019

2019

Hà Nội

Tìm hiểu tổng quan các kỹ thuật và phương pháp lập chỉ mục vector đặc trưng trong và ngoài nước. Tập trung vào các kỹ thuật thuộc các nhóm giải pháp: các kỹ thuật băm, phân cụm, lượng tử hóa và phân hoạch không gian. Phát triển và mở rộng các ưu điểm (code nhỏ, thời gian đối sánh nhanh) của giải pháp lượng tử hóa (ví dụ: PQ, ck-means); đồng thời khai thác các thế mạnh của các kỹ thuật phân hoạch không gian để thiết kế một chiến lược phân hoạch vừa nhỏ gọn, vừa chính xác, có tính đặc trưng cao. Nghiên cứu và xây dựng các kỹ thuật bảng tra (lookups) nhằm cải tiến quá trình tính toán khoảng cách từ một truy vấn đến một vector đã được lập chỉ mục trong cơ sở dữ liệu. Đây là một vấn đề khá quan trọng vì nó được áp dụng trong bước đối sánh (online). Vì vậy, việc tính toán các độ đo và khoảng cách cần được thực hiện một cách hiệu quả và thuận tiện. Đề xuất một kỹ thuật hiệu quả nhằm xấp xỉ khoảng cách Euclidean giữa các vector đặc trưng gốc. Việc tính toán các khoảng cách xấp xỉ sẽ giúp giảm thiểu độ phức tạp tính toán. Bằng cách ước lượng các khoảng cách thông qua các vectors đã được lập chỉ mục, độ phức tạp tính toán sẽ giảm đi rất nhiều. Xây dựng một kỹ thuật mới cho phép biễu diễn hiệu quả các vectors đặc trưng nhằm tạo ra một cấu trúc dữ liệu mới hỗ trợ việc tìm kiếm các đối tượng gần nhất một cách nhanh chóng. Đồng thời, thiết kế các thuật giải tìm kiếm hiệu quả trên cấu trúc dữ liệu mới này. Nghiên cứu và phát triển một kỹ thuật thiết lập tự động các tham số của bộ chỉ mục một cách tối ưu và hiệu quả, thích hợp cho từng loại đặc trưng (trên một cơ sở dữ liệu cụ thể). Các kỹ thuật kiểm thử chéo (crossvalidation) có thể được áp dụng để đạt được mục tiêu này. Thiết kế một chiến lược tối ưu hóa các bộ chỉ mục bằng cách kết hợp sức mạnh tìm kiếm của nhiều bộ chỉ mục đơn lẻ. Các yêu cầu khi kết hợp nhiều bộ chỉ mục đó là đảm bảo không tăng nhiều chi phí về bộ nhớ lưu trữ và thời gian xử lý trên các bộ chỉ mục thành phần. Cài đặt các thuật giải đề xuất, tiến hành các thử nghiệm cần thiết và đánh giá hiệu năng của các giải thuật đề xuất; so sánh với các kỹ thuật tiên tiến khác hiện tại.

Kỹ thuật lập chỉ mục; Phương pháp lập chỉ mục vector; Bộ nhớ lưu trữ; Thời gian xử lý

24 Lý Thường Kiệt, Hà Nội

16318