Lọc theo danh mục
  • Năm xuất bản
    Xem thêm
  • Lĩnh vực
liên kết website
Lượt truy cập
 Lượt truy cập :  18,943,997
  • Công bố khoa học và công nghệ Việt Nam

76

Kỹ thuật và thiết bị y học

Nguyễn Ngọc Trung, Lê Gia Hoàng Linh, Trần Quang Nam, Mai Phương Thảo, Hoàng Anh Vũ, Đỗ Đức Minh

Nghiên cứu kiểm soát chất lượng bộ mẫu phân tích tương quan toàn bộ hệ gen

Quality control of samples used for genome-wide association study

Tạp chí Y dược lâm sàng 108

2023

02

161-167

1859-2872

Các nghiên cứu tương quan toàn bộ hệ gen (GWAS: Genome-wide association study) là một công cụ rất hiệu quả để nghiên cứu vai trò của yếu tố di truyền trong các bệnh lý đa nguyên nhân phức tạp. Tuy nhiên, với số lượng các điểm đa hình đơn nucleotide rất lớn được sử dụng trong các chip microarray, việc kiểm soát chất lượng dữ liệu từ các mẫu nghiên cứu là hết sức cần thiết. Thông qua nghiên cứu này, chúng tôi đã sử dụng các kỹ thuật sinh tin học để kiểm soát chất lượng các mẫu được phân tích toàn bộ hệ gen trên 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2. Đối tượng và phương pháp: 997 đối tượng nghiên cứu (bao gồm 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2) được phân tích toàn bộ hệ gen (khảo sát 644.303 điểm đa hình) bằng bộ kit Infinium Global Screening Array (GSA). Bằng cách sử dụng phần mềm GenomeStudio và PLINK, chúng tôi đã kiểm soát chất lượng cho các mẫu nghiên cứu theo chất lượng mẫu, chất lượng gọi điểm đa hình, sự phù hợp giới tính, mức độ dị hợp tử, mức độ quan hệ họ hàng. Kết quả: Với ngưỡng kiểm soát chất lượng cho mẫu là tỉ lệ gọi được biến thể (CallRate) ≥ 0,98, cho các điểm đa hình là điểm GenTrain ≥ 0,7, điểm Cluster Sep Score ≥ 0,3 và điểm Call Freq ≥ 0,95, đồng thời loại trừ các mẫu có giới tính không phù hợp, có mức độ di hợp tử cao và có khả năng có quan hệ họ hàng, chúng tôi đã loại trừ 213 mẫu và 264.390 điểm đa hình không đạt chất lượng. Kết luận: Với các ngưỡng khảo sát chất lượng nêu trên, chúng tôi đã áp dụng được các tiêu chuẩn kiểm soát chất lượng đầu vào cho các mẫu dữ liệu phân tích tương quan toàn bộ hệ gen với bộ mẫu bao gồm 494 người bình thường và 503 bệnh nhân đái tháo đường típ 2. Việc kiểm soát chất lượng này rất quan trọng để việc phân tích tương quan toàn bộ hệ gen cũng như ước tính chỉ số nguy cơ di truyền đa gen đạt được tính chính xác.

Genome-wide association study (GWAS) is a very effective tool to investigate the role of genetic contribution to the etiology of complex multifactorial diseases. However, due to the large amount of single nucleotide polymorphisms in microarray bead chip, the quality control process of the samples in GWAS is extremely necessary. In this study, bioinformatic tools were used to assess the quality of microarray samples including 503 type 2 diabetic patients and 494 controls. Subject and method: 997 subjects (494 controls and 503 type 2 diabetes cases) were genotyped using Infinium Global Screening Array (GSA) containing 644303 genetic markers. By using GenomeStudio and PLINK softwares, the standard for quality control of these samples was set for sample quality, polymorphism quality, sex-matching, heterozygousity, relationship. Result: Samples with any of the specific parameters CallRate < 0.98, GenTrain Score < 0.7, Cluster Sep Score < 0.3, Call Freq < 0.95, sex unmatching, very heterozygous, or potential relatives were considered not qualified. Finally, 213 samples and 264,390 polymorphisms were excluded from our data. Conclusion: With the quality threshold described above, we have successfully performed the quality control for GWAS study including 503 type 2 diabetic patients and 494 controls. These quality control steps are crucial for accurate genome analysis as well as polygenic risk score calculation.

TTKHCNQG, CVv 337