liên kết website
Lượt truy cập
 Lượt truy cập :  13079543
  • Kết quả thực hiện nhiệm vụ

Xây dựng hệ thống chuyển tự tự động văn bản chữ nôm sang chữ quốc ngữ

Trường ĐH Khoa học Tự nhiên – ĐHQG-HCM

UBND TP. Hồ Chí Minh

Tỉnh/ Thành phố

PGS.TS. Đinh Điền

ThS. Lương An Vinh, PGS.TS. Lê Quang Trường, TS. Bùi Thanh Tường Thụy, ThS. Nguyễn Hồng Bửu Long, Trần Thị Anh Thư, Nguyễn Thị Kim Phượng

Kỹ thuật điện, kỹ thuật điện tử, kỹ thuật thông tin không xếp vào mục nào khác

01/12/2020

01/12/2022

2022

Tp. Hồ Chí Minh

151 Tr.

Đề tài đã thu thập và xây dựng được các tài nguyên chữ Nôm, chữ Hán và chữ Quốc ngữ như sau: Xây dựng tự điển chữ Nôm gồm 22.264 mục tự. Xây dựng từ điển chữ Nôm – Quốc ngữ với 6.198 mục từ. Xây dựng tự điển Hán-Việt gồm 26.330 mục Hán tự với nghĩa tiếng Việt tương ứng. Xây dựng tự điển Hán-Việt 66.450 mục từ.  Xây dựng ngữ liệu song song Nôm - Quốc ngữ gồm 53.757 cặp câu song song với 418.935 tự, 13.304 tự khác nhau. Xây dựng ngữ liệu đơn ngữ chữ Quốc ngữ gồm hơn 822.569 câu, 8.978.807 từ và xây dựng mô hình ngôn ngữ chữ Quốc ngữ dựa trên ngữ liệu này.  Xây dựng mô hình ngôn ngữ và mô hình dịch trên những ngữ liệu thu thập được. Xây dựng website hỗ trợ chuyển tự tự động từ chữ Nôm sang chữ Quốc ngữ

Xây dựng hệ thống; Chuyển tự tự động; Văn bản; Chữ nôm; Chữ quốc ngữ

HCM-040-2023