Wednesday, December 11, 2013

Import shapefile vào Oracle


Quách Đồng Thắng 
Trung tâm Ứng dụng GIS Tp.HCM

1.     GIỚI THIỆU

    Hệ quản trị CSDL Oracle là một trong những lựa chọn hàng đầu trong các hệ thống thông tin, đặc biệt đối với các hệ thống lớn. Oracle hiện hỗ trợ rất tốt trong việc quản lý dữ liệu vector, raster, 3D, point cloud (dữ liệu LiDAR),...
    Mở đầu trong loạt bài về vấn đề quản lý dữ liệu không gian trong Oracle, bài viết trình bày cách import shapefile vào Oracle bằng 02 cách:
    -     Sử dụng SQL Loader với sự hỗ trợ của công cụ shp2sdo.
    -     Sử dụng GeoRaptor plugin trong Oracle SQL Developer.

    2.     THỬ NGHIỆM

      2.1     Cài đặt các công cụ cần thiết

      -     Cài đặt Oracle SQL Developer để quản trị CSDL Oracle.
      -     Cài đặt tiện ích shp2sdo để chuyển đổi shapefile vào CSDL Oracle.
      -     Cài đặt plugin GeoRaptor để tương tác với dữ liệu không gian trong SQL Developer.
      -     Cài đặt phần mềm QGIS để kiểm tra kết quả.

      2.2     Sử dụng công cụ shp2sdo

      Oracle cung cấp hai công cụ để làm việc với CSDL Oracle là SQL*Plus (giao diện dòng lệnh) và công cụ giao diện đồ họa SQL Developer. Chúng ta sẽ sử dụng SQL Developer để thử nghiệm.
      -     Khởi động SQL Developer, đăng nhập với tài khoản system (với password được thiết lập ở bước cài đặt SQL Developer).

      -     Để sử dụng database hr (CSDL human resource - được xây dựng sẵn), sau khi đăng nhập thành công, vào Other Users --> hr --> chọn edit user, đặt password cho user hr (giả sử password cũng là ‘hr’), uncheck Password expired và Account is Locked. 

      -     Sau khi đăng nhập lại bằng user hr sẽ thấy các table mô phỏng một CSDL quản lý nhân sự như departments, employees,… đã được tạo sẵn. Chúng ta sẽ thử nghiệm trên database mẫu này.

      -     Để import shapefile vào database hr, thực thi shp2sdo.exe (trong giao diện cmd), nhập vào các thông tin cần thiết, quan trọng là tên shapefile (ví dụ rt_q1), tên table cần tạo và SRID (ví dụ ở đây chọn SRID 32648)

      -     Kết quả có 03 file được tạo ra:
      rt_q1.sql: chứa lệnh sql tạo table rt_q1.
      rt_q1.ctl:  control file phục vụ load dữ liệu từ shapefile vào table rt_q1 bằng công cụ SQL Loader.
      rt_q1.dat: chứa dữ liệu thuộc tính và không gian của shapefile rt_q1. 

      -     Chạy file rt_q1.sql trong SQL Developer để tạo table rt_q1

        -     Quan trọng: dể bảo toàn unicode tiếng Việt, không bị lỗi font, thêm dòng “CHARACTERSET UTF8” vào sau dòng LOAD DATA trong file rt_q1.ctl:

        -     Tiếp theo, ở giao diện cmd, thực thi lệnh sql loader để load dữ liệu vào table rt_q1 vừa tạo.
        >sqlldr hr/hr@localhost control=rt_q1.ctl
        (cấu trúc câu lệnh là sqlldr username/password@DBhost   control=control file)
        -     Nếu dữ liệu dạng polygon, chạy dòng lệnh sau trong SQL Developer:
        EXECUTE SDO_MIGRATE.TO_CURRENT('RT_Q1','GEOM');
        -     Kết quả sau khi load data (Trong SQL Developer, vào menu View --> Map View để hiển thị dữ liệu không gian): 

        -     Kết nối với CSDL Oracle từ QGIS: vào menu Layer --> Add Oracle Spatial Layer, nhập các thông số kết nối:

        -     Kết quả:


        2.3     Sử dụng công cụ GeoRaptor

        -     Ở giao diện SQL Developer, vào View --> GeoRaptor --> Load shapefile, nhập các thông số cần thiết:

        -     Tuy nhiên, công cụ GeoRaptor không hỗ trợ tốt unicode tiếng Việt. 

        -     Để giải quyết vấn đề lỗi font, chúng ta có thể sử dụng “mẹo” như sau:    

        Đầu tiên, tạo một phiên bản shapefile với chỉ một record (rt_q1) và sử dụng GeoRaptor load       Shapefile này vào database. Mục đích để tạo table có thể quản lý dữ liệu không gian và giảm thời gian load dữ liệu.
        Sau đó sử dụng QGIS để kết nối đến table rt_q1 vừa tạo, đồng thời load shapefile rt_q1. Tiếp theo bật chế độ edit cho table rt_q1 và dùng chức năng copy & paste dữ liệu từ shapefile sang table.

                  3.     KẾT LUẬN

                    Bài viết đã trình bày cách load shapefile vào CSDL Oracle theo hai cách tiếp cận khác nhau. Kết quả thử nghiệm cho thấy, GeoRaptor hỗ trợ giao diện đồ họa thuận tiện hơn so với shp2sdo, nhưng có nhược điểm là người dùng khó can thiệp vào các tham số khi chuyển đổi, dẫn đến mất thời gian giải quyết như vấn đề unicode tiếng Việt đã đề cập ở trên.