Liên hiệp các hội khoa học và kỹ thuật Việt Nam
Thứ ba, 14/01/2014 18:54 (GMT+7)

Máy trả lời điện thoại như người

Tác giả hệ thống độc đáo này là nhóm nghiên cứu thuộc Phòng trí tuệ nhân tạo (AILab) Trường ĐH Khoa học tự nhiên (ĐHQG TP.HCM).

Hiểu được tiếng Việt ba miền

Giải nhì giải thưởng Nhân tài đất Việt

Hệ thống hỏi đáp thông tin tự động bằng nhận dạng giọng nói do nhóm nghiên cứu Phòng trí tuệ nhân tạo nghiên cứu, phát triển đã đoạt giải nhì giải thưởng Nhân tài đất Việt 2012 trong lĩnh vực công nghệ thông tin.

- Quý khách muốn kết nối đến phòng, ban nào? - Xin cho gặp phòng đào tạo - Quý khách muốn kết nối đến phòng đào tạo đúng hay sai? - Đúng rồi!” Đoạn hội thoại này chúng tôi ghi nhận được khi gọi vào số điện thoại 73089… - tổng đài của Trường ĐH Khoa học tự nhiên. Cảm nhận của người gọi là đang được một điện thoại viên trả lời ở đầu dây bên kia. Nhưng thật bất ngờ khi PGS.TS Vũ Hải Quân, trưởng phòng thí nghiệm AILab, chủ nhiệm đề tài, tiết lộ không có người nào ở đầu dây bên kia, chỉ là “người ảo” mà thôi.

Người ảo đó chính là hệ thống hỏi đáp thông tin tự động bằng nhận dạng giọng nói (VIS). Sau khi “nghe” tiếng nói từ đầu dây bên kia, “người ảo” sẽ tiếp nhận thông tin thông qua bộ phận nhận dạng giọng nói, rồi xử lý và trả lời ngay lập tức y như một con người thật sự. ThS Lê Hà Minh, thành viên nhóm nghiên cứu, cho biết để tạo được sự tương tác trực tiếp với người dùng thông qua giọng nói tiếng Việt, VIS được tích hợp hai công nghệ nhận dạng tiếng nói, tổng hợp tiếng nói trên phần mềm giao tiếp với mạng điện thoại bên ngoài. “Người ảo” này có thể “hiểu”, trả lời được người nói tiếng Việt với phương ngữ chủ yếu của ba miền tại VN: Bắc, Trung, Nam. Trong đó, lợi thế hơn cả là tiếng Sài Gòn, tiếng Hà Nội và một số địa phương ở miền Trung.

Để giúp “máy” có thể hiểu và xử lý được ngôn ngữ, nhóm nghiên cứu đã phải “tập nói, tập nghe” cho bộ xử lý. ThS Phạm Minh Nhựt, một thành viên khác của nhóm, cho biết việc làm này giống như dạy một đứa trẻ nói tiếng Việt vậy, “dạy” được càng nhiều thì hệ thống sẽ hiểu và đáp càng trôi chảy. Bộ nhớ của kho dữ liệu sẽ quyết định “trí thông minh” của hệ thống. Nhóm nghiên cứu đã làm đầy kho dữ liệu nhận dạng giọng nói bằng cách thu âm giọng nói mẫu và cập nhật vào “hạt nhân” của hệ thống.

“Chúng tôi thu mẫu giọng Sài Gòn nhiều nhất và cũng là giọng chuẩn nhất mà hệ thống có thể phục vụ ở thời điểm hiện tại. Giọng miền Bắc thì cho máy “nghe” giọng từ Đài Tiếng nói VN và cũng phải “nghe” nhiều lần máy mới “nhớ và hiểu được giọng của từng phương ngữ khác nhau” - ThS Lê Hà Minh kể.

Như đứa trẻ bắt đầu tiếp xúc với một ngôn ngữ mới, công nghệ nhận dạng giọng nói cũng bắt đầu từ các âm vị, âm tiết và từ từ mới tiến đến câu… Thế nên, nhóm nghiên cứu đã mất một thời gian dài “vật lộn” mới hoàn thành được công nghệ nhận dạng giọng nói Việt để tích hợp trên VIS. Tuy cố gắng giải quyết tối đa các phương ngữ tiếng Việt (bằng cả giọng nam và nữ), nhưng theo ThS Minh, ngoài ngôn ngữ phổ thông thì phương ngữ tiếng Việt nhiều vùng miền (đặc biệt là miền Trung và miền Tây Nam bộ) có thể là một rào cản trả lời của hệ thống.

Tổng đài thông minh

Tại nhiều nước, các hệ thống trả lời tự động bằng tiếng Anh đã được đưa vào sử dụng nhưng ở VN, một hệ thống hỏi đáp bằng tiếng Việt qua tổng đài điện thoại mới chỉ dừng lại ở các nghiên cứu lý thuyết. Một trong những lý do quan trọng mà nhóm nghiên cứu quyết đeo bám đề tài này chính là bài toán điện thoại nội bộ với quá nhiều đầu số và không có nhân viên trực tổng đài ở Trường ĐH Khoa học tự nhiên. Trường có hai cơ sở và trước đó phải sử dụng đến hơn 100 đầu số, rất tốn kém và khó ghi nhớ. Vào thời điểm tuyển sinh, số điện thoại của trường thường xuyên bị nghẽn.

Từ năm 2010, nhóm nghiên cứu bắt đầu phát triển VIS dựa trên những nghiên cứu về nhận dạng tiếng nói và tổng hợp tiếng nói mà nhóm thực hiện từ năm 2009 do ĐHQG TP.HCM, Sở KH&CN TP.HCM tài trợ. Đến cuối năm 2012, một hệ thống trả lời tự động đã chính thức được lắp đặt thử nghiệm thay thế tổng đài mà Trường ĐH Khoa học tự nhiên đã dùng trước đó. VIS có những ưu thế riêng như không cần người trực, hệ chuyển mạch riêng có thể xử lý cùng lúc nhiều cuộc gọi. Ngoài ra, người dùng cũng rất ấn tượng với chức năng “người ảo” hoàn toàn mới này.

Ứng dụng của VIS không dừng lại ở việc trở thành những “tổng đài thông minh”. VIS có thể dùng làm hạt nhân cho các phần mềm tương tác tiếng nói của AILab như ứng dụng báo nói, trợ lý du lịch, hỗ trợ người khiếm thị. Ngoài ra, VIS có thể dùng làm hệ thống bình chọn; cung cấp các loại thông tin; hỏi từ khóa; tổng hợp các thông tin về tỉ giá, sức khỏe; có thể giúp điều khiển đèn, tivi… bằng giọng nói; các hệ thống dịch vụ hàng không, ngân hàng thông qua điện thoại…

Chi phí khoảng 100 triệu đồng

ThS Lê Hà Minh cho biết với những đơn vị có quy mô như Trường ĐH Khoa học tự nhiên, để lắp đặt một tổng đài thông minh như vậy, ngoại trừ chi phí phần cứng, ứng dụng tích hợp trả lời tự động bằng công nghệ nhận dạng tiếng nói có giá khoảng 100 triệu đồng. Tùy yêu cầu của từng cơ quan, công ty và yêu cầu thiết bị, công suất khác nhau, giá một hệ thống VIS sẽ khác nhau. Điều khác biệt của VIS là sau khi có thiết bị và phần mềm, người dùng sẽ không tốn thêm các “giá trị gia tăng” theo thời gian như các sản phẩm dịch vụ khác.

Xem Thêm

Tin mới

Hương Xuân và tiếng gọi cội nguồn
Giữa nhịp chuyển mình của đất nước và những đổi thay sâu rộng của đời sống xã hội, trong lòng tôi, một người con xa quê khi mùa xuân về lại dấy lên một khoảng lặng rất riêng. Đó là lúc ký ức về làng quê, về nguồn cội trở nên rõ ràng hơn bao giờ hết, như một điểm tựa tinh thần để tự soi chiếu lại mình trước thời vận mới của dân tộc.
Cần Thơ: phát huy vai trò tập hợp trí thức chung tay xây dựng nông thôn mới, lan tỏa “Xuân gắn kết - Tết yêu thương”
Sáng 11/02, tại Ấp Hòa Thành, xã An Lạc Thôn, TP. Cần Thơ, Liên hiệp các Hội Khoa học và Kỹ thuật thành phố Cần Thơ chủ trì phối hợp cùng UBND xã An Lạc Thôn, Hội Xây dựng TP. Cần Thơ và Nhóm VK xây cầu nông thôn tổ chức Lễ Khánh thành cầu Ngã Tư Trên (VK284) gắn với Chương trình an sinh xã hội “Xuân gắn kết – Tết yêu thương”.
An Giang: Họp mặt trí thức, văn nghệ sĩ và người làm báo Xuân Bính Ngọ 2026
Ngày 11/02/2026, tại phường Rạch Giá, Ban Tuyên giáo và Dân vận Tỉnh ủy An Giang phối hợp với Liên hiệp các Hội Khoa học và Kỹ thuật tỉnh, Liên hiệp các Hội Văn học Nghệ thuật tỉnh và Hội Nhà báo tỉnh tổ chức Họp mặt đại biểu trí thức, văn nghệ sĩ, người làm báo tiêu biểu nhân dịp đầu Xuân Bính Ngọ 2026.
Lào Cai: Khai mạc Hội báo Xuân và các hoạt động trưng bày, triển lãm mừng Đảng, mừng Xuân Bính Ngọ năm 2026
Sáng ngày 12/2, tại Bảo tàng tỉnh, Ban Tổ chức những ngày lễ lớn tỉnh Lào Cai long trọng tổ chức Khai mạc Hội báo Xuân cùng các hoạt động trưng bày, triển lãm mừng Đảng, mừng Xuân Bính Ngọ năm 2026. Đây là hoạt động văn hóa thường niên đầy ý nghĩa, thể hiện niềm tự hào về những thành tựu đổi mới của Đảng bộ và Nhân dân các dân tộc trong tỉnh, khơi dậy khát vọng phát triển quê hương đất nước.
Gia Lai: Ông Cao Văn Bình được bầu giữ chức Chủ tịch Liên hiệp Hội tỉnh nhiệm kỳ 2026-2031
Trong hai ngày 5-6/2, tại Trung tâm Hội nghị tỉnh Gia Lai, Đại hội đại biểu Liên hiệp các Hội Khoa học và Kỹ thuật tỉnh Gia Lai lần thứ I, nhiệm kỳ 2026-2031 đã được tổ chức trọng thể với sự tham dự của TSKH Phan Xuân Dũng, Chủ tịch Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam cùng lãnh đạo tỉnh Gia Lai, đại diện các sở, ban, ngành, đoàn thể của tỉnh và 130 đại biểu chính thức.
Báo chí và sứ mệnh lan toả, sáng tạo văn hoá
Trong tiến trình đổi mới toàn diện và hội nhập quốc tế sâu rộng, chấn hưng văn hóa dân tộc đã trở thành một nhiệm vụ chiến lược, được Đảng và Nhà nước xác định là nền tảng tinh thần của xã hội, vừa là mục tiêu, vừa là động lực cho phát triển bền vững đất nước.
Phú Thọ: Lan toả phong trào sáng tạo khoa học kỹ thuật
Những năm gần đây, khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số từng bước trở thành động lực quan trọng thúc đẩy phát triển kinh tế - xã hội. Tại Phú Thọ, Cuộc thi Sáng tạo thanh thiếu niên, nhi đồng và Hội thi Sáng tạo kỹ thuật tỉnh năm 2025 đã trở thành “chất xúc tác” góp phần lan tỏa phong trào sáng tạo trong xã hội.