Nữ chuyên gia trong lĩnh vực Nhận dạng và công nghệ tri thức ở Việt Nam
Đến năm 2014 này, PGS.TS Lương Chi Mai, Chủ tịch Hội đồng khoa học Viện công nghệ thông tin (CNTT) đã có khoảng 50 công trình khoa học được công bố trong và ngoài nước, trong đó có hơn 20 công trình được đăng tải trên các tạp chí chuyên ngành quốc tế có uy tín, ấy là chưa kể chị còn xuất bản ba đầu sách là những tài liệu tham khảo có giá trị cho đối tượng là sinh viên đại học và học viên cao học trong lĩnh vực CNTT.
Vốn được đào tạo từ ngành toán ứng dụng tại trường Đại học Tổng hợp Kishinev (Liên Xô cũ), đầu những năm 80 của thế kỷ trước, Lương Chi Mai về làm việc tại Viện tính toán và điều khiển (sau này là Viện CNTT) thuộc Viện Hàn lâm khoa học và công nghệ Việt Nam (VAST). Chị chia sẻ: “Ngần ấy năm gắn bó với chuyên ngành ND và CNTT, tôi tập trung nghiên cứu các vấn đề như cách tiếp cận phân loại dữ liệu không gian và nhận dạng ảnh; nhận dạng ký tự quang học phục vụ nhận dạng ký tự Việt; nhận dạng tiếng nói và xử lý ngôn ngữ tự nhiên tiếng Việt”… Từ những kiến thức thu thập được trong đợt thực tập sinh khi tuổi đời còn khá trẻ cách đây gần 30 năm tại CHDC Đức, trên cơ sở ứng dụng ảnh viễn thám từ vệ tinh LANDSAT4 vùng đồng bằng Nam Bộ, PGS. Lương Chi Mai tìm cách cải tiến làm tăng tốc độ các thuật toán nhận dạng ảnh theo phương pháp Bayes dựa vào tính đồng nhất của các pixel trên cùng miền.
Cũng từ những kinh nghiệm trong thời gian làm cộng tác viên tại Phòng thí nghiệm quốc tế về trí tuệ nhân tạo thuộc Viện điều khiển học (Viện Hàn lâm khoa học Slovakia) cuối thập niên 80, chị đã tiến hành song song hóa các thủ tục tính toán của một số thuật toán nhận dạng; chẳng hạn như thuật toán phân loại Bayes và quy trình phân lớp K–means trong môi trường tính toán song song kiểu SIMD.
Phát triển hướng nghiên cứu về các dạng ảnh đường nét, tập trung vào các thuật toán biểu diễn cô đọng và chính xác đường biên của vùng ảnh, PGS Lương Chi Mai và nhóm nghiên cứu đi sâu vào các thuật toán véc-tơ hóa ảnh đường nét trên bản đồ; đồng thời phát triển phần mềm Mapscan nhằm mục đích nhập bản đồ tự động thay cho việc dùng bộ số hóa thông thường. Điều phấn khởi là phần mềm này đã được cơ quan thống kê Liên hợp quốc sử dụng cho dự án “Phần mềm máy tính trợ giúp cho các hoạt động dân số INT92/P23” cùng với hệ thống Popmap (hệ thống cơ sở dữ liệu về địa lý, dân số), phần mềm Mapscan đã được ứng dụng cho hoạt động thống kê dân số ở hơn 100 quốc gia đang phát triển.
Trong bối cảnh bước đầu phát triển công nghệ thông tin vào giữa những năm 90 của thế kỷ trước, nhu cầu ứng dụng các thành tựu của lĩnh vực này không ngừng tăng lên. Nắm bắt đòi hỏi của đời sống xã hội, PGS. Lương Chi Mai cùng nhóm cộng sự đã thiết kế và phát triển phần mềm nhận dạng chữ Việt in với tên gọi VnDOCR. Do chữ Việt có những đặc thù như nhiều chữ cái hơn so với các ngôn ngữ khác, lại có năm dấu thanh tổ hợp với các nguyên âm… bởi vậy, cần tìm ra công nghệ và giải pháp thích hợp. Với phương pháp tiếp cận tổ hợp và chứng minh được hiệu quả trong chất lượng của phần mềm của nhóm nghiên cứu do PGS. Mai chủ trì, lần đầu tiên ở Việt Nam việc máy đọc được các văn bản chữ Việt in đã được triển khai ứng dụng. Phần mềm VnDOCR không ngừng được hoàn thiện (hiện nay đã nâng lên VnDOCR 4.0) phục vụ hữu ích cho hàng nghìn cơ quan, đơn vị ở 60 tỉnh, thành phố trong cả nước.
Theo một cán bộ Viện CNTT, đến nay đã có khoảng 45 nghìn bản VnDOCR được thương mại hóa kèm theo các máy quét của Hewlet Parkard tại Việt Nam. Chẳng thế mà sản phẩm phần mềm VnDOCR đã vinh dự đoạt giải nhất Giải thưởng VIFOTEC năm 1999, và giành Huy chương vàng phần mềm đạt doanh số cao năm 2000 và 2001, do Tạp chí thế giới vi tính bình chọn.
Song, gây được dấu ấn trong sự nghiệp nghiên cứu khoa học của PGS. Lương Chi Mai, phải kể đến công trình “Nhận dạng tiếng nói và xử lý ngôn ngữ tự nhiên tiếng Việt”, đây là một vấn đề mới, phức tạp, và còn hiếm người nghiên cứu. Trên cơ sở việc phân tích đặc thù về mặt ngữ âm, thanh điệu trong tiếng Việt, PGS. Lương Chi Mai vận dụng mô hình hóa thanh điệu và ngữ điệu tiếng nói Fujisaki (Nhật Bản) vào mô hình hóa thanh điệu tiếng Việt. Mặt khác, chị cũng áp dụng thành công phương pháp tổng hợp dựa trên mô hình Markov ẩn (từ dữ liệu tham số), dễ dàng thay đổi đặc điểm giọng nói, đồng thời tạo thuận lợi trong việc áp dụng cho các ngôn ngữ khác nhau.
Trên cương vị là thành viên Tổ chức các nhà khoa học nữ của thế giới thứ ba (TWOWS), PGS. Mai có điều kiện tham gia các đề tài, dự án nghiên cứu quốc tế. Chị là “thủ lĩnh” trong nhóm nghiên cứu của Việt Nam thực hiện dự án A-STAR (gồm tám nước châu Á) nghiên cứu, xây dựng các hệ thống dịch tiếng nói sang tiếng nói thông qua mạng máy tính trong khu vực châu Á từ những năm 2008 – 2009.
Dưới sự chủ trì của Viện nghiên cứu thông tin và truyền thông Kyoto (Nhật Bản), PGS Mai cùng tập thể nghiên cứu phòng ND và CNTT, Viện CNTT (VAST) hơn bốn năm qua vẫn tiếp tục kiên trì các nghiên cứu về nhận dạng tiếng Việt liên tục, tổng hợp tiếng Việt, và dịch tự động Anh – Việt, Việt – Anh, phục vụ cho hoạt động của ngành du lịch. Cũng từ đây, hệ thống tiếng Việt được tích hợp vào hệ thống dịch tiếng nói sang tiếng nói giữa các ngôn ngữ Anh, Trung Quốc, Hàn Quốc, Nhật Bản, Thái Lan, Indonesia, Malaysia…
Với niềm say mê trong nghiên cứu (lại được những người thân trong gia đình ủng hộ, tạo điều kiện), nỗ lực hoạt động khoa học và công nghệ của PGS. Lương Chi Mai đã được đền đáp. Không ít phần thưởng đã đến với chị, như Bằng khen của Thủ tướng Chính phủ, Giải thưởng Cán bộ nữ xuất sắc trong lĩnh vực CNTT, Bằng khen của Tổng Liên đoàn lao động Việt Nam… Và vinh dự lớn lao là năm 2010, chị được trao tặng Giải thưởng Kovalevskaya vì những đóng góp khoa học xuất sắc trong lĩnh vực khoa học tự nhiên, đặc biệt là về công nghệ nhận dạng chữ viết và tiếng nói.
Được hỏi, đâu là điều tâm đắc nhất trong quãng đời nghiên cứu khoa học?, PGS. Lương Chi Mai tâm sự: “Hơn 30 năm hoạt động nghiên cứu, tôi chỉ đam mê và kiên trì đi theo một mạch là Nhận dạng chữ viết và tiếng nói của ngôn ngữ Việt. Điều phấn khởi là các nghiên cứu của mình không bị “đắp chiếu” mà được đưa ra ứng dụng một cách thiết thực cho thực tế cuộc sống”. Vâng, bởi thế, giờ đây tuy đã thôi cương vị Phó Viện trưởng Viện CNTT (VAST) nhưng chị - nữ chuyên gia đi tiên phong trong lĩnh vực Nhận dạng và CNTT ở Việt Nam vẫn đang tiếp tục chủ trì hoặc tham gia một số đề tài các cấp. Chị cũng đang dồn sức phấn đấu trong năm 2014 này hoàn thành nghiệm thu đề tài cấp Nhà nước “Nghiên cứu phát triển hệ thống dịch tiếng nói hai chiều Việt – Anh, Anh – Việt có định hướng lĩnh vực”, và xuất bản cuốn sách “Các kỹ thuật học máy và ứng dụng” phục vụ cho đối tượng học viên sau đại học ngành CNTT…