Từ địa chỉ, tìm được nhiều thông tin liên quan
Địa chỉ là một cách thức mã hoá thông dụng để mô tả vị trí một đối tượng trên bề mặt trái đất và được sử dụng rất rộng rãi. Khi biết địa chỉ của một đối tượng, người ta có thể hình dung được vị trí tương đối của đối tượng đó. Trong cơ sở dữ liệu của hầu hết các công ty hay tổ chức thường lưu trữ vị trí của khách hàng hay những đối tượng quan tâm ở dạng địa chỉ. Tuy nhiên, hình dung ra được từng địa chỉ của từng đối tượng riêng lẻ không giúp nhà quản lý hình dung được sự phân bố của một tập hợp các đối tượng trong một khu vực, đặc biệt khi số lượng các đối tượng quan tâm lớn.
Trong trường hợp cơ sở dữ liệu đầy đủ về vị trí của từng thửa đất, từng căn nhà với địa chỉ đầy đủ của nó thì việc xác định vị trí của đối tượng trên bản đồ tương đối dễ dàng, thông qua các bài toán truy vấn tìm kiếm thông tin. Tuy nhiên, rất nhiều trường hợp các công ty, tổ chức thường không có một cơ sở dữ liệu đầy đủ mà chỉ có dữ liệu rất cơ bản, ví dụ dữ liệu về giao thông và có dữ liệu địa chỉ của khách hàng hoặc đối tượng quan tâm. Trong những trường hợp hạn chế về dữ liệu, một phương pháp có thể được sử dụng để chuyển đổi địa chỉ thành các điểm có tọa độ x, y trên bản đồ là phương pháp mã hóa địa chỉ, gọi bằng thuật ngữ tiếng Anh chuyên ngành là Geocoding. Phương pháp này thực hiện phân tiùch và so sánh địa chỉ đối tượng với các mẫu địa chỉ thiết kế sẵn, cũng như so sánh với các thành phần tương ứng trong dữ liệu bản đồ giao thông tham chiếu để từ đó xác định được vị trí của các đối tượng trên bản đồ.
Phần mềm ArcGIS của ESRI (Mỹ) được sử dụng rộng rãi ở Việt Nam có hỗ trợ công cụ giúp thực hiện quá trình mã hóa địa chỉ này. Vấn đề gặp phải là khi áp dụng phương pháp geocoding, sử dụng các mẫu địa chỉ thiết kế sẵn của ArcGIS thì tỉ lệ địa chỉ của Việt Nam được mã hóa thành công thành các điểm trên bản đồ đạt được thấp. Điều này là do địa chỉ ở Việt Nam khác so với các nước trên thế giới. Ở thành phố, trong địa chỉ có thể có sự xuất hiện của hẻm; các ký tự pha trộn giữa chữ và số, phường và quận thì khi là chữ khi là số… Còn ở nông thôn, dữ liệu địa chỉ thì có thể không có tên đường,…. Sử dụng các mẫu địa chỉ có sẵn của ArcGIS để chuyển địa chỉ thành vị trí lại không thành công. Do vậy bài toán đặt ra là cần phải tìm hiểu và tìm ra cách thức để mã hóa thành công dữ liệu địa chỉ của Việt Nam - sử dụng chức năng geocode của ArcGIS - thành các vị trí trên bản đồ.
Để giải quyết vấn đề, một khuôn mẫu địa chỉ mới - VN_address - đã được nhóm nghiên cứu xây dựng nhằm giải quyết vấn đề chuyển các địa chỉ dạng đầy đủ và không đầy đủ ở Việt Nam thành các vị trí điểm trên bản đồ. Kết quả thực nghiệm cho thấy: đối với địa chỉ đầy đủ, khuôn mẫu được tạo ra đã giúp chuyển đổi toàn bộ các địa chỉ sử dụng thành các điểm trên bản đồ; đối với loại địa chỉ không đầy đủ, công cụ được phát triển cũng hoàn toàn thực hiện tốt việc tạo các điểm trên bản đồ. Ngoài ra, toàn bộ dữ liệu thuộc tính, nếu có, đi kèm với địa chỉ cũng được bảo toàn cùng với vị trí trên bản đồ. Kết quả thực nghiệm chứng tỏ sự ưu việt của khuôn mẫu địa chỉ VN_address so với các khuôn mẫu có sẵn trong ArcGIS.