Liên hiệp các hội khoa học và kỹ thuật Việt Nam
Thứ năm, 25/08/2005 14:34 (GMT+7)

Hai bạn trẻ với công trình ‘Xây dựng hệ tổng hợp tiếng nói tiếng Việt’

Với nghiên cứu của mình, các bạn đã chọn ra một số phương pháp và giải thuật để thực hiện việc tổng hợp tiếng nói cho tiếng Việt. Đặc biệt, các bạn đã thực hiện thành công một phần mềm có khả năng chuyển văn bản tiếng Việt thành tiếng nói. Công trình này đã đoạt giải nhất (lĩnh vực khoa học tự nhiên) của Giải thưởng sinh viên nghiên cứu khoa học - Eureka lần 6 và giải ba sinh viên nghiên cứu khoa học cấp Bộ năm 2004.

Đôi bạn trẻ Dung Nghi và Nhật Anh đều sinh năm 1981 và cùng là bạn thân học chung lớp thuộc ngành Viễn thông, Khoa Điện-điện tử của Trường Đại học Bách khoa TP Hồ Chí Minh (Chương trình đào tạo kỹ sư thiết bị cao Việt - Pháp). Cả hai cùng có sở thích chung là nghiên cứu ứng dụng viễn thông vào cuộc sống. Đặc biệt, tuy là dân ngành viễn thông nhưng cả hai đều rất thích nghiên cứu về tiếng nói... tiếng Việt.

Từ cuối năm 2003, dưới sự hướng dẫn của PGS.TS Lê Tiến Thường, Giám đốc Trung tâm Du học của trường, hai bạn đã tiến hành cùng thực hiện chung đề tài khoa học "Ứng dụng phương pháp thích hợp xây dựng hệ tổng hợp tiếng nói tiếng Việt".

Nhật Anh cho biết: "Tổng hợp tiếng nói, đó là công việc tạo ra những "máy nói" giống như con người, trước hết để giúp cho những người khuyết tật và sau đó là để mở ra những hướng phát triển mới cho lĩnh vực viễn thông - công nghệ thông tin. Sau một thời gian nghiên cứu, cho đến nay, các nhà khoa học trên thế giới đã gặt hái được nhiều kết quả khả quan và đã xây dựng thành công một số mô hình tổng hợp tiếng nói cho các ngôn ngữ Anh, Pháp, Đức, Trung Quốc...

Tuy nhiên đối với tiếng Việt, việc xây dựng các hệ thống tổng hợp tiếng nói chỉ mới ở giai đoạn đầu. Với mong muốn xây dựng được một hệ tổng hợp tiếng nói tiếng Việt bằng những giải thuật riêng, thích hợp đối với đặc điểm ngữ âm của ngôn ngữ tiếng Việt, chúng em chọn đây là đề tài để thực hiện nghiên cứu của mình".

Dung Nghi bổ sung thêm: "Tổng hợp tiếng nói tiếng Việt là một trong những hướng nghiên cứu mới. Thành công trong hướng nghiên cứu này sẽ mang lại nhiều ứng dụng hữu ích cho xã hội, nhất là trong lĩnh vực viễn thông và công nghệ thông tin. Tuy nhiên, tiếng nói là một vấn đề vô cùng phức tạp, luôn đòi hỏi các nhà khoa học phải tìm hiểu nghiên cứu không ngừng. Vì vậy mục tiêu thực hiện đề tài của chúng em là tiến hành xây dựng cơ sở lý thuyết về các đặc trưng của ngữ âm tiếng Việt, cơ sở sinh lý học bộ máy phát âm của con người và một số cơ sở trong việc xử lý tín hiệu tiếng nói; Khảo sát một số phương pháp, giải thuật đã được sử dụng trong các hệ tống hợp tiếng nói; Xây dựng giải thuật riêng để thực hiện việc tổng hợp tiếng nói tiếng Việt; Thiết kế chương trình phần mềm tổng hợp tiếng nói tiếng Việt; Thi công phần cứng trên FPGA và một số mạch phụ trợ để thực hiện việc tổng hợp tiếng nói tiếng Việt".

Để có kết quả này, trong suốt quá trình thực hiện, đôi bạn trẻ đã tham khảo và tìm hiểu khá nhiều các phương pháp, mô hình và giải thuật thực hiện việc tổng hợp tiếng nói đã được xây dựng cho các ngôn ngữ nước ngoài. Dựa trên những đặc trưng về mặt ngữ âm của tiếng nói tiếng Việt, các bạn đã chọn một số phương pháp và giải thuật, tiến hành xây dựng thử trên MATLAB, rút ra những ưu điểm và nhược điểm của từng phương pháp, giải thuật và cuối cùng là tổng hợp chúng lại để xây dựng một chương trình tổng hợp tiếng nói tiếng Việt hoàn chỉnh.

Các phương pháp và giải thuật đã được hai bạn xây dựng là Giải thuật TD-PSOLA: dùng để tổng hợp các nguyên âm đơn (không dấu hoặc có dấu); Phương pháp tổng hợp FORMANT theo mô hình Klatt: xây dựng trên SIMULINK của MATLAB, dùng để tổng hợp phụ âm, nguyên âm và âm vần dạng đơn giản. Có thể ghép nối âm và từ lại với nhau; Phương pháp tổng hợp FORMANT theo mô hình LF: dùng để tổng hợp các nguyên âm và phụ âm; Giải thuật kéo dài, thu ngắn tín hiệu âm thanh, làm trơn tín hiệu: được xây dựng dựa trên cơ sở của giải thuật TD-PSOLA, nhằm thu ngắn hoặc kéo dài âm, tạo ngữ điệu cho giọng đọc trong câu.

Đặc biệt, dựa vào những giải thuật đã xây dựng được, các bạn đã thực hiện thành công một phần mềm có khả năng chuyển văn bản tiếng Việt thành tiếng nói. Chương trình này được đặt tên là VietSound, có thể thực thi cùng với chương trình chạy trên MATLAB hay chạy độc lập như một phần mềm hoàn chỉnh, có khả năng đọc các văn bản có chiều dài không giới hạn.

Riêng đối với phần cứng, các bạn cũng thực hiện thành công trên hai kit UP1 và UP2, bao gồm phần giao tiếp bàn phím, máy tính và phần tổng hợp. Có thể xem đây như một hệ tổng hợp tiếng nói, với văn bản được nhập vào từ bàn phím sẽ hiển thị trên màn hình và sau đó tiếng nói tổng hợp được xuất ra loa.

Hiện Dung Nghi được giữ lại làm cán bộ giảng dạy bộ môn điện tử và đang theo học cao học ở trường, còn Nhật Anh thì phụ trách phòng thí nghiệm của Trung tâm Du học và sắp tới em theo học cao học ở Pháp với một học bổng vừa giành được.

Riêng về hướng phát triển của đề tài trong thời gian tới, Nhật Anh cũng cho biết: Với những kinh nghiệm thu nhặt được trong suốt quá trình thực hiện đề tài này, chúng em cũng đã đề ra những hướng phát triển tiếp theo, đó là đi sâu nghiên cứu bản chất âm học của ngôn ngữ tiếng Việt, sự ảnh hưởng giữa các âm lân cận.

Nguồn:www.nhandan.com.vn 31/5/2005  

Xem Thêm

An Giang: Anh nông dân truyền cảm hứng giáo dục STEM
Anh Nguyễn Ngọc Đệ - một nông dân chỉ học hết lớp 6, hiện sinh sống tại xã Vĩnh Hanh, huyện Châu Thành, tỉnh An Giang - đã xuất sắc đoạt giải Nhất tại Hội thi Sáng tạo Kỹ thuật tỉnh An Giang lần thứ XIV (2024-2025) với giải pháp mang tên “Mô hình Hạm đội Trường Sa phục vụ giáo dục STEM”.
GS. Nguyễn Hữu Tăng trọn đời vì khoa học, nặng lòng vì đất nước
Giáo sư, Tiến sĩ Khoa học Nguyễn Hữu Tăng, nguyên Phó Trưởng ban Khoa giáo Trung ương, nguyên Phó Chủ tịch Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam, một nhà vật lý lý thuyết hàng đầu, một nhà quản lý khoa học tâm huyết đã từ trần vào rạng sáng ngày 22/6/2025, hưởng thọ 89 tuổi. Sự ra đi của ông để lại niềm tiếc thương vô hạn cho giới khoa học và các thế hệ học trò, đồng nghiệp.
Huỳnh Thúc Kháng: Ngòi bút sắc hơn trăm vạn quân
Được biết đến là một chí sĩ yêu nước, một nhà cách mạng và một chính khách đức độ, di sản rực rỡ và truyền cảm hứng bậc nhất của cụ Huỳnh Thúc Kháng còn ở sự nghiệp báo chí nơi ngòi bút được mài sắc thành vũ khí đấu tranh cho quyền lợi của dân tộc. Tên Huỳnh Thúc Kháng cũng được đặt cho trường dạy viết báo đầu tiên ở nước ta.
Anh nông dân lớp 5 và hành trình tại Hội thi Sáng tạo kỹ thuật
Trong bối cảnh nông nghiệp ngày càng đòi hỏi sự đổi mới, thích ứng và sáng tạo để nâng cao năng suất và giảm chi phí lao động, một người nông dân tại Châu Phú, An Giang - dù chỉ học hết lớp 5 - đã chứng minh rằng: Tri thức không chỉ đến từ sách vở mà còn từ thực tiễn cần mẫn và khối óc sáng tạo không ngừng.

Tin mới

Tìm giải pháp thực hiện hiệu quả các dự án viện trợ không hoàn lại
Thủ tục hành chính thực hiện và quản lý các dự án viện trợ không hoàn lại hiện nay còn phức tạp; quy trình xét duyệt, giải ngân còn chậm, ảnh hưởng đến tiến độ và sự hài lòng của đối tác; năng lực quản lý hạn chế; một số đơn vị thành viên thiếu chuyên môn về giám sát tài chính, báo cáo theo chuẩn quốc tế; biến động kinh tế, chính trị toàn cầu khiến nguồn viện trợ không ổn định....
Chủ tịch Phan Xuân Dũng tiếp xúc cử tri tỉnh Khánh Hòa sau kì họp thứ 9, Quốc hội khóa XV
Ngày 9-10/7, Đoàn đại biểu Quốc hội tỉnh Khánh Hòa gồm ông Phan Xuân Dũng, Chủ tịch Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam, bà Đàng Thị Mỹ Hương, Phó Trưởng đoàn chuyên trách Đoàn Đại biểu Quốc hội tỉnh và ông Nguyễn Văn Thuận đã có các buổi tiếp xúc cử tri tại xã Bác Ái Tây và xã Phước Hà sau kì họp thứ 9, Quốc hội khóa XV.
Công nghệ mới trong xử lý chất thải góp phần phát triển bền vững ngành chăn nuôi Việt Nam
Ngày 3/7, Liên hiệp Hội Việt Nam phối hợp với Liên hiệp hội tỉnh Bắc Ninh và Hội Chăn nuôi Việt Nam tổ chức Hội thảo Phổ biến một số công nghệ mới có hiệu quả trong xử lý chất thải chăn nuôi. Hội thảo thu hút sự tham dự của đông đảo người sản xuất, kinh doanh, hộ chăn nuôi và doanh nghiệp trên địa bàn tỉnh.