Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  14,928,173

Toán học ứng dụng

Trương Thị Cẩm Mai; Nguyễn Trương Thành Hưng; Trương Thị Cẩm Mai(1)Trương Thị Cẩm Mai(2)Trương Thị Cẩm Mai(3)

Xây dựng cấu trúc phân tử bằng thuật toán kết hợp K-Nearest Neighbor và cây tìm kiếm K-Dimension

Khoa học ( Đại học Quy Nhơn)

2022

03

71-85

1859-0357

Cấu trúc phân tử; Học máy; Cây tìm kiếm; K-dimension; K-nearest neighbors

Việc xây dựng các đặc tính và cấu trúc phân tử đóng một vai trò quan trọng trong nhiều lĩnh vực khác nhau, như khoa học vật liệu, cảm biến, công nghệ nano, thiết kế và khám phá thuốc. Tuy nhiên, việc xây dựng cấu trúc phân tử trên một tập dữ liệu thô, tập dữ liệu bị nhiễu và thiếu thông tin, là một nhiệm vụ đầy thách thức nhưng rất quan trọng. Thuật toán phân loại K-Nearest Neighbors (KNN) là một thuật toán lazy learning, có xu hướng tìm kiếm các điểm gần nhất cho một mục tiêu trong toàn bộ tập huấn luyện. Tuy nhiên, quá trình dự đoán của KNN khá mất thời gian. Trong khi thuật toán cây tìm kiếm K-Dimension (K-D tree) là một cây nhị phân đa chiều, có cấu trúc lưu trữ cụ thể để biểu diễn dữ liệu huấn luyện một cách hiệu quả về mặt thời gian. Từ các khía cạnh trên, trong bài báo này, chúng tôi đã thử nghiệm và đề xuất một phương pháp gọi là thuật toán cây tìm kiếm KNN-KD để xử lý tập dữ liệu thô về cấu trúc phân tử bằng cách kết hợp các ưu điểm của KNN và cây K-D.

TTKHCNQG, CTv 179