Networks Business Online Việt Nam & International VH2

Một số vấn đề cơ sở dữ liệu không gian – Tài liệu text

Đăng ngày 26 October, 2022 bởi admin

Một số vấn đề cơ sở dữ liệu không gian

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.16 MB, 119 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
ĐẠI HỌC KHOA HỌC TỰ NHIÊN

NGUYỄN BÍCH HẰNG

MỘT SỐ VẤN ĐỀ CƠ SỞ DỮ LIỆU KHÔNG GIAN

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

Người hướng dẫn: PGS.TS Đặng Văn Đức

HÀ NỘI

ĐẠI HỌC QUỐC GIA HÀ NỘI
ĐẠI HỌC KHOA HỌC TỰ NHIÊN

NGUYỄN BÍCH HẰNG

MỘT SỐ VẤN ĐỀ CƠ SỞ DỮ LIỆU KHÔNG GIAN

Mã số : 1.01.10

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

HÀ NỘI

MỤC LỤC
Lời cảm ơn Error! Bookmark not defined.
Danh mục các ký hiệu, chữ viết tắt 1
Mở đầu 2
Chương 1 – Giới thiệu chung về cơ sở dữ liệu không gian 4
1.1 Giới thiệu chung về cơ sở dữ liệu 4
1.1.1 Mô hình quan hệ 5
1.1.2 Mô hình hướng đối tượng 6
1.1.3 Mô hình đối tượng-quan hệ 6
1.2 Giới thiệu về GIS (Geographic information system) 6
1.3 Mô hình cơ sở dữ liệu không gian 10

1.3.1 Giới thiệu 10
1.3.2 Sử dụng mô hình cơ sở dữ liệu quan hệ 11
1.3.3 Sử dụng kiến trúc song song. 12
1.3.4 Tích hợp trên cơ sở mở rộng hệ quản trị cơ sở dữ liệu 14
1.4 Kết luận 14
Chương 2 – Mô hình dữ liệu, mối quan hệ và ràng buộc không gian. 15
2.1 Giới thiệu 15
2.2 Mô hình dữ liệu không gian 16
2.2.1 Mô hình dữ liệu raster 17
2.2.2 Mô hình dữ liệu Vectơ 20

2.2.3 Mô hình dữ liệu không gian trên có sở các ràng buộc 25
2.3 Mối quan hệ không gian 31
2.3.1 Quan hệ tôpô 31
2.4 Các ràng buộc không gian 38
2.4.1 Ràng buộc toàn vẹn tôpô 40
2.4.2 Ràng buộc ngữ nghĩa 41
2.4.3 Các ràng buộc do người dùng tự định nghĩa 42
Chương 3 – Cấu trúc dữ liệu không gian, các thuật toán cơ sở và
phương thức xâm nhập. 43
3.1 Giới thiệu. 43
3.2 Cấu trúc dữ liệu dữ liệu không gian 44
3.3 Một số thuật toán cơ sở cho các đối tượng không gian 49
3.3.1 Kiểm tra điểm có nằm trong đa giác hay không? 49
3.3.2 Giao của các polyline 51
3.3.3 Giao của hai đa giác 57
3.3.4 Bài toán windowing 58
3.3.5 Bài toán Clipping 60
3.3.6 Tính diện tích của đa giác và các toán tử liên quan 63
3.4 Các phương thức truy cập không gian và xử lý truy vấn 64

3.4.1 Các phương thức truy cập không gian 64
3.4.2 Xử lý truy vấn 79

Chương 4 – Khảo sát hệ quản trị cơ sở dữ liệu không gian thương mại
và phát triển chương trình ứng dụng 92
4.1 Giới thiệu chung 92
4.2 Oracle spatial 94
4.3 Phát triển ứng dụng thử nghiệm 101
4.3.1 Phát biểu bài toán 101
4.3.2 Công cụ, phương pháp sử dụng phát triển 101
4.3.3 Kết quả đạt được 104
Kết luận 111
Tài liệu tham khảo 113

1
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
Ký hiệu
Tên đầy đủ
Ý nghĩa
ADT
Astract data type
Kiểu dữ liệu trừu tượng
DBMS
Database Management System
Hệ quản trị cơ sở dữ liệu
DB
Database
Cơ sở dữ liệu
GIS

Geographic information
system
Hệ thống thông tin địa lý
JDBC
Java Database Connectivity
Kết nối cơ sở dữ liệu với
Java
LRU
Least Recently Used
Phương pháp thay thế các
thành phần ít được sử dụng
gần nhất
Mmb
Minimal bounding box
Hình chữ nhật nhỏ nhất bao
quanh đối tượng
OODBMS
Object-oriented database
management system
Hệ quản trị cơ sở dữ liệu
hướng đối tượng
QEP
Query Execution Plan
Chiến lược xử lý truy vấn
SDB
Spatial databasse
Cơ sở dữ liệu không gian
SDBMS
Spatial database management
system

Hệ quản trị cơ sở dữ liệu
không gian
SAM
Spatial access method
Phương thức truy cập không
gian

2
MỞ ĐẦU
Hệ thống thông tin địa lý (GIS – Geographic information system ) đã được
nghiên cứu và ứng dụng rộng rãi trên thế giới. Từ vài năm gần đây, Việt Nam
đang có nhiều cố gắng đưa hệ thống thông tin địa lý vào ứng dụng thực tế vì lợi
ích to lớn của chúng trong việc hỗ trợ ra quyết định, lập kế hoạch trong nhiều
lĩnh vực khác nhau. Tuy nhiên, vấn đề nghiên cứu về lĩnh vực này ở Việt Nam
còn rất nhiều hạn chế. Việc hiểu biết sâu sắc về GIS sẽ giúp ta ứng dụng một
cách hiệu quả các hệ thống GIS có sẵn cũng như cho khả năng xây dựng các hệ
thống GIS phù hợp với đặc thù của Việt Nam.
GIS không chỉ là công cụ tạo ra các bản đồ mà còn lưu trữ dữ liệu địa lý,
cung cấp các công cụ phân tích, mô phỏng ở nhiều bề mặt khác giúp các nhà
chuyên môn tổ chức công việc một cách hiệu quả ở nhiều lĩnh vực ví dụ như:
quản lý mạng lưới giao thông, các ứng dụng phục vụ cho quân đội hay các hệ
thống thông tin về môi trường … Một trong những công việc chính của GIS đó
là quản lý một cách hiệu quả cơ sở dữ liệu với khối lượng lớn các thông tin phức
tạp, được tích hợp vào hệ quản trị cơ sở dữ liệu (DBMS).
Luận văn với chủ đề “Một số vấn đề về cơ sở dữ liệu không gian”, em chủ
yếu tập trung vào nghiên cứu những đặc trưng của cơ sở dữ liệu (Spatial
database), một số khái niệm, công nghệ và thuật toán cơ bản đã được phát triển
xung quanh vấn đề quản lý cơ sở dữ liệu, bao gồm:
Chương 1: Giới thiệu chung về cơ sở dữ liệu không gian. Chương này tập

trung vào giới thiệu hệ quản trị cơ sở dữ liệu DBMS, trên cơ sở đó phát triển và
quản trị dữ liệu không gian.

3
Chương 2. Mô hình hóa dữ liệu, các mối quan hệ không gian và ràng
buộc toàn vẹn dữ liệu. Chương này tập trung giới thiệu cách xây dựng mô hình
dữ liệu và biểu diễn các mối quan hệ không gian. Dữ liệu không gian tích hợp
trong cơ sở dữ liệu cần duy trì tính nhất quán điều này được thể hiện ở ràng buộc
toàn vẹn dữ liệu không gian.
Chương 3. Cấu trúc dữ liệu không gian, các thuật toán cơ sở và phương
thức xâm nhập dữ liệu. Chương này giới thiệu cấu trúc dữ liệu không gian, các
thuật toán hình học được phát triển để thao tác với dữ liệu không gian và phương
thức xâm nhập dữ liệu không gian
Chương 4. Khảo sát hệ quản trị cơ sở dữ liệu không gian thương mại và
phát triển ứng dụng

4
Chương 1 – Giới thiệu chung về cơ sở dữ liệu không gian
1.1 Giới thiệu chung về cơ sở dữ liệu
Cơ sở dữ liệu (Database) là tập dữ liệu có mối quan hệ tương quan nhau
và lưu trữ trong môi trường máy tính, Database có thể được xem như một hoặc
vài file lưu trữ trên một số thiết bị nhớ ngoài. Hệ quản trị cơ sở dữ liệu
(Database Management System – DBMS) là tập các phần mềm quản lý cấu trúc
cơ sở dữ liệu và điều khiển truy nhập (minh họa hình 1.1) bao gồm:
 Định nghĩa cơ sở dữ liệu (Chỉ ra các kiểu dữ liệu, cấu trúc và các ràng
buộc),
 Thao tác, Truy vấn và Cập nhật cơ sở dữ liệu.

Người sử dụng/người lập trình
Chương trình ứng dụng /Truy vấn
Phần mềm xử lý truy vấn
Phần mềm truy cập dữ liệu
Lưu trữ DB
Lưu trữ định nghĩa DB
(metadata)
Hình 1.1. Môi trường hệ thống cơ sở dữ liệu đơn giản

5
Phần mềm của hệ quản trị cơ sở dữ liệu bao gồm hai phần, phần trên làm
nhiệm vụ xử lý các truy vấn của người sử dụng, phần dưới cho phép truy nhập
vào dữ liệu lưu trữ trên máy tính.
Hệ quản trị cơ sở dữ liệu thường được xây dựng trên cơ sở mô hình dữ
liệu sử dụng, trước kia có mô hình dữ liệu phân cấp (hierarchical) và mô hình dữ
liệu mạng (network). Ngày nay, ba mô hình cơ sở dữ liệu đang được phát triển
và sử dụng rộng rãi đó là mô hình cơ sở dữ liệu quan hệ (relational), hướng đối
tượng (object-oriented), đối tượng-quan hệ (object-relational).
 Mô hình dữ liệu phân cấp ngày nay đã quá lỗi thời, hệ quản trị cơ sở dữ
liệu phân cấp (hierarchical DBMS) giả sử rằng dữ liệu có mối quan hệ thứ
bậc cha và con. Cấu trúc dữ liệu bắt buộc phải xây dựng phù hợp với mô
hình này để thực hiện được lợi ích và hiệu quả trong quản lý.
 Hệ quản trị cơ sở dữ liệu mạng (network DBMS) cho phép các cấu trúc dữ
liệu phức tạp được xây dựng nhưng không có tính mềm dẻo và đòi hỏi
thiết kế phải hết sức cẩn thận, tuy nhiên lợi ích của mô hình này là nhanh
và hiệu quả.
1.1.1 Mô hình quan hệ
Cơ sở dữ liệu quan hệ phát triển trên cơ sở mô hình quan hệ, ở đó dữ liệu
tổ chức vào các quan hệ hay các bảng. Một lược đồ quan hệ bao gồm tập các tên

thuộc tính và chúng được ánh xạ tới miền giá trị, lược đồ quan hệ chỉ ra cấu trúc
của quan hệ chứ không chứa dữ liệu. Quan hệ là tập các bản ghi lưu dữ liệu của
các tập thuộc tính trong lược đồ quan hệ.

6
Hệ quản trị cơ sở dữ liệu quan hệ được sử dụng một cách áp đảo so với
các hệ quản trị cơ sở dữ liệu khác bởi lợi ích nhanh chóng và tin cậy. Tuy nhiên,
với những ứng dụng lớn nó tỏ ra chậm chạp vì relation DBMS phải sử dụng rất
nhiều bảng cho hàng loạt các quy tắc
1.1.2 Mô hình hướng đối tượng
Hệ quản trị cơ sở dữ liệu hướng đối tượng OODBMS (Object-oriented
database management system) tích hợp giữa hướng đối tượng và cơ sở dữ liệu.
Cơ sở dữ liệu hướng đối tượng được đặc trưng bởi mô hình dữ liệu hướng đối
tượng và ngôn ngữ lập trình hướng đối tượng, ở đó các đơn vị dữ liệu là các đối
tượng cơ sở. Các đối tượng này có định danh, thuộc tính và hành vi được định
nghĩa qua phương thức, tất cả được bao gói trong chính đối tượng đó.
1.1.3 Mô hình đối tượng-quan hệ
Mô hình Object-relational được mở rộng từ mô hình dữ liệu quan hệ, mô
hình này là sự thỏa hiệp giữa hai khái niệm hướng đối tượng và quan hệ. Ở đó
các đặc trưng hướng đối tượng được tích hợp trong cơ sở dữ liệu quan hệ nhằm
sử dụng sức mạnh của mô hình hướng đối tượng trong khi đó vẫn duy trì đầy đủ
các chức năng trong mô hình quan hệ
1.2 Giới thiệu về GIS (Geographic information system)
Có rất nhiều định nghĩa về GIS, một cách dễ hiểu có thể hình dung GIS là
hệ thống thông tin địa lý, về khía cạnh bản đồ học thì GIS là kết hợp của lập bản
đồ và công nghệ cơ sở dữ liệu, GIS không chỉ là công cụ tạo bản đồ mà còn lưu
trữ và biểu diễn dữ liệu. Sau đây là một số định nghĩa về GIS hay được sử dụng
[1].

7
Định nghĩa của dự án The Geographer’s Craft, Khoa Địa lý, Trường
Đại học Texas
GIS là cơ sở dữ liệu số chuyên dụng trong đó hệ trục tọa độ không gian là
phương tiện tham chiếu chính. GIS bao gồm các công cụ để thực hiện các công
việc sau đây:
 Nhập dữ liệu từ bản đồ giấy, ảnh vệ tinh, ảnh máy bay, số liệu điều tra và
các nguồn khác.
 Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu
 Biến đổi dữ liệu, phân tích, mô hình hóa, bao gồm cả dữ liệu thống kê và
dữ liệu không gian.
 Lập báo cáo, bao gồm bản đồ chuyên đề, các bảng biểu, biểu đồ và kế
hoạch.
Từ định nghĩa trên thấy rõ ba vấn đề sau của GIS.
 Thứ nhất, GIS có quan hệ với ứng dụng cơ sở dữ liệu. Toàn bộ thông tin
trong GIS đều liên kết với tham chiếu không gian như phương tiện chính
để lưu trữ và xâm nhập thông tin.
 Thứ hai, GIS là công nghệ tích hợp. Hệ GIS đầy đủ có đầy đủ khả năng
phân tích, bao gồm phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập mô
hình thống kê, vẽ bản đồ Cuối cùng, GIS được xem như tiến trình không
chỉ là phần cứng, phần mềm rời rạc mà GIS còn được sử dụng vào trợ
giúp quyết định. Cách thức nhập, lưu trữ, phân tích dữ liệu trong GIS phải
phản ánh đúng cách thức thông tin sẽ được sử dụng trong công việc lập
quyết định hay nghiên cứu cụ thể.

8
Định nghĩa của Viện Nghiên cứu Hệ thống Môi trường ESRI, Mỹ
GIS là công cụ trên cơ sở máy tính để lập bản đồ và phân tích những cái

đang tồn tại và các sự kiện xảy ra trên Trái đất. Công nghệ GIS tích hợp các thao
tác cơ sở dữ liệu như truy vấn và phân tích thống kê với lợi thế quan sát và phân
tích thống kê bản đồ. Các khả năng này sẽ phân biệt GIS với các hệ thông tin
khác. Có rất nhiều chương trình máy tính sử dụng dữ liệu không gian như
AutoCAD và các chương trình thống kê, nhưng chúng không phải là GIS vì
chúng không có khả năng thực hiện các thao tác không gian.
Định nghĩa của David Cowen, NCGIA, Mỹ
GIS là hệ thống phần cứng, phần mềm và các thủ tục được thiết kế để thu
thập, quản lý, xử lý, phân tích, mô hình hóa và hiển thị các dữ liệu qui chiếu
không gian để giải quyết các vấn đề quản lý và lập kế hoạch phức tạp.
Độ phức tạp của thế giới thực là không giới hạn. Càng quan sát thế giới
gần hơn càng thấy được chi tiết hơn. Con người mong mỏi lưu trữ, quản lý đầy
đủ các dữ liệu về thế giới thực. Nhưng sẽ dẫn đến phải có cơ sở dữ liệu lớn vô
hạn để lưu trữ mọi thông tin chính xác về chúng. Do vậy, để lưu trữ được dữ
liệu không gian của thế giới thực vào máy tính thì phải giảm số lượng dữ liệu
đến mức có thể quản lý được bằng tiến trình đơn giản hóa hay trừu tượng hóa
(hình 1.2).

9

Ý nghĩa chủ yếu của tin học hóa thông tin địa lý là khả năng tích hợp các
kiểu và nguồn dữ liệu khác biệt. Mục tiêu của GIS là cung cấp cấu trúc một cách
hệ thống để quản lý các thông tin địa lý khác nhau và phức tạp, đồng thời cung
cấp các công cụ, các thao tác hiển thị, truy vấn, mô phỏng

GIS lưu trữ thông tin thế giới thực thành các tầng (layer) bản đồ chuyên
đề mà chúng có khả năng liên kết địa lý với nhau (hình 1.3). Mỗi nhóm người sử
dụng sẽ quan tâm nhiều hơn đến một hay vài loại thông tin. Thí dụ, Sở Giao
thông công chính sẽ quan tâm nhiều đến hệ thống đường phố. Sở Nhà đất quan

Thế giới thực
Hình 1.2 Hệ thông tin địa lý

C
SDL
Phần
mềm
công
cụ
Người sử dụng
Kết quả
Trừu tượng hóa
đơn giản hóa
1.1.1.1.1.1.6 G
I
S
Hình 1.3 Tầng bản đồ
Tầng Nhà ở
Tầng Đường
quốc lộ

hố
Tầng Khách
hàng
Tầng
Biên

h
ành
chính

10
tâm nhiều đến các khu dân cư và công sở. Sở Thương mại quan tâm nhiều đến
phân bổ khách hàng trong vùng. Tư tưởng tách bản đồ thành tầng tuy đơn giản
nhưng khá mềm dẻo và hiệu quả, giúp giải quyết rất nhiều vấn đề về thế giới
thực.
1.3 Mô hình cơ sở dữ liệu không gian
1.3.1 Giới thiệu
Như phần trên đã giới thiệu thì dữ liệu GIS cần phải được lưu trữ và quản
lý cả dữ liệu không gian và dữ liệu số và được điều khiển trực tiếp bởi ứng dụng
hoặc hệ quản trị cơ sở dữ liệu. Hệ thống ứng dụng GIS có thể điều khiển dữ liệu
trực tiếp từ file, tuy nhiên điều này dẫn đến mất đi tính độc lập, bảo mật và sự
thống nhất trong điều khiển dữ liệu do những đặc trưng sau [2]:
 Cấu trúc dữ liệu không gian rất phức tạp. Một đối tượng có thể chỉ đơn
thuần là một điểm nhưng cũng có thể được tạo nên từ hàng nghìn đa giác
phân bố tuỳ ý trong không gian. Việc lưu trữ tập dữ liệu như thế không thể
sử dụng một bảng quan hệ với các bản ghi kích thước cố định mà đòi hỏi
phải xây dựng cấu trúc dữ liệu khác phù hợp
 Dữ liệu không gian luôn có sự thay đổi, do đó cần phải linh hoạt trong tổ
chức dữ liệu, hỗ trợ các thao tác bổ sung, loại bỏ, cập nhật với thời gian
đáp ứng nhanh nhất.
 Dữ liệu không gian thường có dung lượng rất lớn. Việc lưu các bản đồ địa
lý có thể cần đến hàng gigabyte bộ nhớ
Với những lý do này thì hệ quản trị cơ sở dữ liệu, cần phải tích hợp, biểu
diễn và tháo tác với thông tin địa lý cùng với dữ liệu truyền thống tại mức logic

11
và hỗ trợ một cách hiệu quả ở mức vật lý để lưu trữ và xử lý thông tin về không
gian. Sau đây là các yêu cầu cần thiết cho việc xây dựng cơ sở dữ liệu không
gian (Spatial database – SDB -).
 Trước hết, đó phải là một hệ cơ sở dữ liệu,
 Các kiểu dữ liệu không gian phải được cung cấp trong các mô hình dữ liệu
và ngôn ngữ truy vấn, các phép toán truy vấn quan hệ như phép nối, chọn,
… Có thể được sử dụng ở Hệ quản trị cơ sở dữ liệu không gian (SDBMS-
Spatial database management system- ). Cần thiết xây dựng thêm một số
phép toán mới với các kiểu dữ liệu hình học,
 Biểu diễn dữ liệu logic phải được mở rộng tới dữ liệu kiểu hình học và
thoả mãn tính độc lập dữ liệu, duy trì tính đơn giản nhất có thể và tính
đóng đối với người sử dụng,
 Ngôn ngữ truy vấn phải tích hợp với các hàm nhằm hỗ trợ xây dựng ứng
một cách phong phú các đối tượng hình học,
 Có thể biểu diễn vật lý một cách hiệu quả dữ liệu không gian,
 Truy nhập dữ liệu không gian một cách hiệu quả, hiện nay, B-tree không
còn là tiếp cận với truy nhập dữ liệu không gian. Và theo đó chúng ta cần
xây dựng cấu trúc mới cho việc đánh chỉ mục cơ sở dữ liệu không gian.
Xuất phát từ những yêu cầu trên, có ba cách tiếp cận khi xây dựng hệ quản
trị cơ sở dữ liệu không gian Relational DBMS.
1.3.2 Sử dụng mô hình cơ sở dữ liệu quan hệ
Sử dụng hệ quản trị cơ sở dữ liệu quan hệ để quản lý GIS có những đặc
trưng chính như:

12
 Biểu diễn các đối tượng bằng các quan hệ (bảng). Mỗi hàng thể hiện
một đối tượng, mỗi cột là thuộc tính mô tả đối tượng đó,

 Thuộc tính có kiểu alphanumeric (ví dụ như Strinh hay real),
 Truy vấn dựa vào SQL,
Đây là cách tiếp cận xoay quanh chuẩn SQL, nhưng khi điều khiển các
ứng dụng về không gian địa lý có những hạn chế sau:
 Vi phạm nguyên lý độc lập dữ liệu, các truy vấn trên đối tượng đòi hỏi có
hiểu biết về cấu trúc các đối tượng không gian. sự thay đổi cấu trúc dẫn
đến phải tổ chức lại cơ sở dữ liệu và thay đổi công thức truy vấn,
 Cần đến số lượng lớn các dòng dữ liệu thể hiện dữ liệu không gian,
 Cuối cùng là thiếu đi sự thân thiện với người sử dụng. Rất khó định nghĩa
kiểu không gian mới, đặc biệt là khó kiểm tra các phép toán cơ bản.
1.3.3 Sử dụng kiến trúc song song.
Hiện nay rất nhiều hệ đã được biết đến khi xây dựng các ứng dụng GIS
như: ArcInfo (ESRI), MGE và TIGISs sử dụng cách tiếp cận này. Kiến trúc này
tách riêng việc quản lý dữ liệu mô tả (dữ liệu dạng alphanumeric) với quản lý dữ
liệu không gian, gồm hai hệ thống cùng xuất hiện hình 1.4.

13

Bao gồm:
 Hệ quản trị cơ sở dữ liệu quan hệ và một số thành phần ở đó mô tả dữ
liệu kiểu alphanumeric,
 Các chức năng cho việc quản lý dữ liệu không gian.
Tuy nhiên tiếp cận này cũng có mặt hạn chế như:
 Hai thành phần trên xuất hiện cùng nhau mà mô hình dữ liệu của
chúng lại không đồng nhất, do vậy khi mô hình phải sử dụng kết hợp
những thực thi khác nhau,
 Mất một phần chức năng cơ bản của Hệ quản trị cơ sở dữ liệu như:
Phục hồi, sao lưu dữ liệu, truy vấn và tối ưu dữ liệu.
Các chương trình ứng dụng

Hệ quản trị cơ sở dữ liệu
quan hệ (SQL chuẩn)
Các xử lý hình học
DB
file
Hình 1.4. Kiến trúc song song

14
1.3.4 Tích hợp trên cơ sở mở rộng hệ quản trị cơ sở dữ liệu
Mô hình này đã nhận được sự quan tâm rất lớn từ nhiều năm trước đó ở
nhiều ứng dụng và được phát triển trên cơ sở thêm các kiểu, các toán tử mới vào
hệ thống cơ sở dữ liệu quan hệ như sau:
 Ngôn ngữ truy vấn SQL được mở rộng để thực thi dữ liệu không
gian. Toán tử không gian được điều khiển trên cơ sở các kiểu dữ liệu
alphanumeric,
 Một số chức năng khác của cơ sở dữ liệu như tối ưu hoá truy vấn,
được sửa đổi nhằm thích nghi với các dữ liệu không gian một cách
hiệu quả.
Hầu hết các hệ quản trị cơ sở dữ liệu có sẵn đều sử dụng cách tiếp cận mở
rộng không gian ví dụ như Oracle (Bắt đầu từ phiên bản 8i) và PostgreSQL.
1.4 Kết luận
Xây dựng và phát triển cơ sở dữ liệu không gian hiệu quả sử dụng mô
hình object-relational hay có thể nói tích hợp dữ liệu không gian vào cơ sở dữ
liệu quan hệ trên cơ sở mở rộng hệ quản trị cơ sở dữ liệu, như vậy sẽ tận dụng
được sức mạnh của hướng đối tượng mà vẫn duy trì được các chức năng quan
trọng trong cơ sở dữ liệu quan hệ. Tích hợp dữ liệu không gian như thế nào? Sẽ
được đề cập ở chương 3. Cấu trúc dữ liệu không gian, các thuật toán cơ sở và
phương thức xâm nhập.

15
Chương 2 – Mô hình dữ liệu, mối quan hệ và ràng buộc
không gian
2.1 Giới thiệu
Mô hình hóa dữ liệu không gian là vô cùng quan trọng trong việc tích hợp
và biểu diễn dữ liệu không gian trong cơ sở dữ liệu. Các mối quan hệ không gian
cũng rất cần thiết bởi các lý do sau:
 Cho việc thực thi các truy vấn không gian. Truy vấn trong cơ sở dữ liệu
không gian hay GIS thường được thực hiện trên cơ sở các mối quan hệ
giữa các đối tượng không gian. Ví dụ, lấy toàn bộ lô đất kề với lô đất A,
truy vấn này liên quan đến các điều kiện mà ngôn ngữ SQL thông thường
không đáp ứng được. Các mối quan hệ không gian là cần thiết cho cả công
thức truy vấn và các mức xử lý,
 Thỏa mãn tính nhất quán của cơ sở dữ liệu. Các mối quan hệ không gian
cũng được sử dụng để tính toán các ràng buộc trong cơ sở dữ liệu không
gian. Ví dụ kiểm tra ràng buộc “Hai lô đất phải chồng lên nhau” trong cơ
sở dữ liệu địa chính chẳng hạn. Các mối quan hệ không gian cung cấp ý
nghĩa trong việc định nghĩa và điều khiển các ràng buộc trong cơ sở dữ
liệu do đó các công thức cơ sở cho các mối quan hệ không gian được
thành lập và là thành phần quan trọng trong việc phát triển GIS.
Các ràng buộc toàn vẹn và thống nhất dữ liệu là điều kiện cần cho việc
điều khiển và thống nhất dữ liệu trong cơ sở dữ liệu sao cho nó thỏa mãn tính
nhất quán, hợp lệ và dễ sử dụng.

16
Các phần dưới đây sẽ trình bày kĩ hơn về mô hình dữ liệu không gian, mối

quan hệ và ràng buộc không gian.
2.2 Mô hình dữ liệu không gian
Cơ sở dữ liệu không gian cho phép quản lý dữ liệu không gian trong mô
hình dữ liệu và ngôn ngữ truy vấn, vấn đề rất quan trọng cần quan tâm là làm thế
nào để mô hình hóa các đối tượng không gian. Có hai vấn đề mà cần được biểu
diễn đó là: (i) Đối tượng trong không gian, là các đối tượng thực trong tự nhiên
được mô tả bởi hình dáng của nó như: sông, thành phố, rừng và (ii) không gian.
Nói một cách khác hai vấn đề này có thể được xem như: (i) Các đối tượng đơn lẻ
và (ii) Tập các đối tượng không gian.
Các đối tượng độc lập được biểu diễn một cách trừu tượng bởi điểm, đọan
thẳng và miền (minh họa hình 2.1).

Hình 2.1. Các kiểu cơ bản: Điểm, đoạn thẳng và miền
Tập các đối tượng có hai vấn đề đó phân cắt và mạng, phân cắt được xem
như tập các đối tượng (miền) không giao nhau, các miền này phân chia vùng
thành nhiều vùng con (hình 2.2), mạng có các đặc trưng như nút và tập đọan
thẳng mô tả các cạnh, chi tiết sẽ được thể hiện ở phần sau.

17

Hình 2.2. Phân cắt và mạng
Dữ liệu không gian được tổ chức theo những cách khác nhau và được
minh họa như hình 2.3. Gồm mô hình raster và vectơ, chúng thường được xem
như mô hình field-based hay object-based. Biểu diễn raster sử dụng tessellations
cho việc mô hình hóa tập dữ liệu và biểu diễn vectơ thì đối tượng là đơn vị cơ
sở, đồng thời có hai cấu trúc thể hiện tập các đối tượng đó là: Có cấu trúc (như
tôpô, network) và phi cấu trúc (spagetti). Mô hình tôpô tương đối phổ biến, nó
ko đơn giản như cấu trúc spagetti.
Raster

Field-base
Vector
Object-base hay
Entity base
Tessellation
Lưới đều
Mô hình dữ liệu
không gian

Tessellation
Lưới không đều
Có cấu trúc
Tôpô, Network
Không cấu trúc
Spagetti

Hình 2.3. Các mô hình dữ liệu không gian
2.2.1 Mô hình dữ liệu raster
Phương pháp biểu diễn các đặc trưng địa lý bằng các điểm ảnh được gọi là
phương pháp raster hay mô hình dữ liệu raster. Tiến trình xây dựng lưới tế bào
được thực hiện như sau:

18
Giả sử phủ một lưới trên bản đồ gốc, dữ liệu raster được lập bằng cách mã
hóa mỗi tế bào bằng một giá trị dựa theo các đặc trưng trên bản đồ (hình 2.4).
Trong thí dụ này, đặc trưng “đường” được mã hóa là 2, đặc trưng “điểm” được
mã hóa là 1 còn đặc trưng “vùng” được mã hóa là 3. Kiểu dữ liệu của tế bào
trong lưới phụ thuộc vào thực thể được mã hóa; Có thể sử dụng số nguyên, số
thực, ký tự hay tổ hợp chúng để làm giá trị. Độ chính xác của mô hình này phụ

thuộc vào kích thước hay độ phân giải của các tế bào lưới. Một điểm có thể là
một tế bào, một đường là vài tế bào kề nhau, một vùng là tập hợp nhiều tế bào.
Mỗi đặc trưng là tập tế bào đánh số như nhau (có cùng giá trị).

Hình dạng hình học bao phủ toàn bộ mặt phẳng được gọi là “khảm”
(tessellation). Minh họa hình 2.5.
Đ
iểm
V
ùng
Đ
ường
H
àng
C
ột
Bản đồ gốc
Lưới
Ma trận lưu trữ
Hình 2.4 Biểu diễn raster

19

Biểu diễn raster phù hợp với mô hình dữ liệu field-based bởi đối với kiểu
dữ liệu entity-base thì đối tượng không gian trong không gian hai chiều được
biểu diễn bởi tập các điểm nằm trong nó, mỗi điểm được coi như một điểm ảnh,
vị trí của nó chính là địa chỉ của điểm ảnh và việc thể hiện đối tượng một cách
trung thực là một điều vô cùng quan trọng nhưng mỗi đối tượng chiếm một
không gian bộ nhớ khá lớn, ngoài ra còn có thêm các toán tử trên các đối tượng.

Đây chính là điểm hạn chế dẫn đến phải có cách biểu diễn khác với mô hình dữ
liệu entity base tuy nhiên, thông tin đôi khi có thể được nén.
Đối với dữ liệu field-base thì thực tế phương pháp này có thể gặp ở trong
các ứng dụng xử lý ảnh chụp từ xa (ảnh vệ tinh), dự báo thời tiết hoặc ô nhiễm
môi trường. Do vậy dữ liệu field- base thể hiện hàm từ không gian tới phạm vi
như nhiệt độ hoặc là độ cao so với mặt biển. Tuy nhiên miền các hàm này không
còn là tập giới hạn các điểm nữa mà là tập vô hạn các điểm. Nói một cách khác
không gian không được coi như trường liên tục nữa mà rời rạc khi biểu diễn dữ
liệu.
Tóm lại, Lợi thế lớn nhất của hệ thống raster là dữ liệu hình thành nên bản
đồ trong bộ nhớ máy tính, các thao tác kiểu như so sánh lưới tế bào được thực
hiện dễ dàng. Tuy nhiên hệ thống raster sẽ không thuận tiện cho việc biểu diễn
Hình 2.5 “Khảm” mặt phẳng
Tế bào chữ nhật
Tế bào lục giác
Tế bào tam giác

20
đường, điểm vì mỗi loại là tập các tế bào trong lưới. Đường thẳng có thể bị đứt
đoạn hay rộng hơn.
2.2.2 Mô hình dữ liệu Vectơ
Trong phương pháp này, các đối tượng được cấu trúc chính từ các thành
phần cơ sở như: điểm, đọan thẳng (danh sách các điểm) và bề mặt của đối tượng
(danh sách các các cạnh). Hình 2.6 là minh họa cho phương pháp này. Trái với
biểu diễn raster, biểu diễn vector không tốn bộ nhớ.

Như vậy, mô hình dữ liệu vectơ sử dụng các đoạn thẳng hay điểm rời rạc
để nhận biết các vị trí của thế giới thực (hình 2.7).
Kiểu thành

phần sơ cấp
Biểu diễn bằng đồ họa
Biểu diễn số
Điểm
Đường
Vùng
Bề mặt
Khối
Tọa độ (x,y) trong
2D
và (x,y,z) trong
3D
1. Danh sách tọa độ
2. Hàm toán học
1. Đường có điểm đầu và cuối trùng
nhau
2. Tập các đường nếu vùng có lỗ hổng
1. Ma trận điểm 2. Tập các tam giác
3. Hàm toán học 4. Đường bình độ
Tập bề mặt
Hình 2.6 Các thành phần hình học cơ sở
HÀ NỘIĐẠI HỌC QUỐC GIA HÀ NỘIĐẠI HỌC KHOA HỌC TỰ NHIÊNNGUYỄN BÍCH HẰNGMỘT SỐ VẤN ĐỀ CƠ SỞ DỮ LIỆU KHÔNG GIANMã số : 1.01.10 LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TINHÀ NỘIMỤC LỤCLời cảm ơn Error ! Bookmark not defined. Danh mục những ký hiệu, chữ viết tắt 1M ở đầu 2C hương 1 – Giới thiệu chung về cơ sở dữ liệu không gian 41.1 Giới thiệu chung về cơ sở dữ liệu 41.1.1 Mô hình quan hệ 51.1.2 Mô hình hướng đối tượng người tiêu dùng 61.1.3 Mô hình đối tượng-quan hệ 61.2 Giới thiệu về GIS ( Geographic information system ) 61.3 Mô hình cơ sở dữ liệu không gian 101.3.1 Giới thiệu 101.3.2 Sử dụng quy mô cơ sở dữ liệu quan hệ 111.3.3 Sử dụng kiến trúc song song. 121.3.4 Tích hợp trên cơ sở lan rộng ra hệ quản trị cơ sở dữ liệu 141.4 Kết luận 14C hương 2 – Mô hình dữ liệu, mối quan hệ và ràng buộc không gian. 152.1 Giới thiệu 152.2 Mô hình dữ liệu không gian 162.2.1 Mô hình dữ liệu raster 172.2.2 Mô hình dữ liệu Vectơ 202.2.3 Mô hình dữ liệu không gian trên có sở những ràng buộc 252.3 Mối quan hệ không gian 312.3.1 Quan hệ tôpô 312.4 Các ràng buộc không gian 382.4.1 Ràng buộc toàn vẹn tôpô 402.4.2 Ràng buộc ngữ nghĩa 412.4.3 Các ràng buộc do người dùng tự định nghĩa 42C hương 3 – Cấu trúc dữ liệu không gian, những thuật toán cơ sở vàphương thức xâm nhập. 433.1 Giới thiệu. 433.2 Cấu trúc dữ liệu dữ liệu không gian 443.3 Một số thuật toán cơ sở cho những đối tượng người tiêu dùng không gian 493.3.1 Kiểm tra điểm có nằm trong đa giác hay không ? 493.3.2 Giao của những polyline 513.3.3 Giao của hai đa giác 573.3.4 Bài toán windowing 583.3.5 Bài toán Clipping 603.3.6 Tính diện tích quy hoạnh của đa giác và những toán tử tương quan 633.4 Các phương pháp truy vấn không gian và giải quyết và xử lý truy vấn 643.4.1 Các phương pháp truy vấn không gian 643.4.2 Xử lý truy vấn 79C hương 4 – Khảo sát hệ quản trị cơ sở dữ liệu không gian thương mạivà tăng trưởng chương trình ứng dụng 924.1 Giới thiệu chung 924.2 Oracle spatial 944.3 Phát triển ứng dụng thử nghiệm 1014.3.1 Phát biểu bài toán 1014.3.2 Công cụ, chiêu thức sử dụng tăng trưởng 1014.3.3 Kết quả đạt được 104K ết luận 111T ài liệu tìm hiểu thêm 113DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮTKý hiệuTên đầy đủÝ nghĩaADTAstract data typeKiểu dữ liệu trừu tượngDBMSDatabase Management SystemHệ quản trị cơ sở dữ liệuDBDatabaseCơ sở dữ liệuGISGeographic informationsystemHệ thống thông tin địa lýJDBCJava Database ConnectivityKết nối cơ sở dữ liệu vớiJavaLRULeast Recently UsedPhương pháp sửa chữa thay thế cácthành phần ít được sử dụnggần nhấtMmbMinimal bounding boxHình chữ nhật nhỏ nhất baoquanh đối tượngOODBMSObject-oriented databasemanagement systemHệ quản trị cơ sở dữ liệuhướng đối tượngQEPQuery Execution PlanChiến lược giải quyết và xử lý truy vấnSDBSpatial databasseCơ sở dữ liệu không gianSDBMSSpatial database managementsystemHệ quản trị cơ sở dữ liệukhông gianSAMSpatial access methodPhương thức truy vấn khônggianMỞ ĐẦUHệ thống thông tin địa lý ( GIS – Geographic information system ) đã đượcnghiên cứu và ứng dụng thoáng đãng trên quốc tế. Từ vài năm gần đây, Việt Namđang có nhiều cố gắng nỗ lực đưa mạng lưới hệ thống thông tin địa lý vào ứng dụng thực tiễn vì lợiích to lớn của chúng trong việc tương hỗ ra quyết định hành động, lập kế hoạch trong nhiềulĩnh vực khác nhau. Tuy nhiên, yếu tố điều tra và nghiên cứu về nghành này ở Việt Namcòn rất nhiều hạn chế. Việc hiểu biết thâm thúy về GIS sẽ giúp ta ứng dụng mộtcách hiệu suất cao những mạng lưới hệ thống GIS có sẵn cũng như cho năng lực kiến thiết xây dựng những hệthống GIS tương thích với đặc trưng của Nước Ta. GIS không chỉ là công cụ tạo ra những map mà còn tàng trữ dữ liệu địa lý, phân phối những công cụ nghiên cứu và phân tích, mô phỏng ở nhiều mặt phẳng khác giúp những nhàchuyên môn tổ chức triển khai việc làm một cách hiệu suất cao ở nhiều nghành nghề dịch vụ ví dụ như : quản trị mạng lưới giao thông vận tải, những ứng dụng ship hàng cho quân đội hay những hệthống thông tin về thiên nhiên và môi trường … Một trong những việc làm chính của GIS đólà quản trị một cách hiệu suất cao cơ sở dữ liệu với khối lượng lớn những thông tin phứctạp, được tích hợp vào hệ quản trị cơ sở dữ liệu ( DBMS ). Luận văn với chủ đề “ Một số yếu tố về cơ sở dữ liệu không gian ”, em chủyếu tập trung chuyên sâu vào điều tra và nghiên cứu những đặc trưng của cơ sở dữ liệu ( Spatialdatabase ), một số ít khái niệm, công nghệ tiên tiến và thuật toán cơ bản đã được phát triểnxung quanh yếu tố quản trị cơ sở dữ liệu, gồm có : Chương 1 : Giới thiệu chung về cơ sở dữ liệu không gian. Chương này tậptrung vào trình làng hệ quản trị cơ sở dữ liệu DBMS, trên cơ sở đó tăng trưởng vàquản trị dữ liệu không gian. Chương 2. Mô hình hóa dữ liệu, những mối quan hệ không gian và ràngbuộc toàn vẹn dữ liệu. Chương này tập trung chuyên sâu trình làng cách kiến thiết xây dựng mô hìnhdữ liệu và trình diễn những mối quan hệ không gian. Dữ liệu không gian tích hợptrong cơ sở dữ liệu cần duy trì tính đồng điệu điều này được bộc lộ ở ràng buộctoàn vẹn dữ liệu không gian. Chương 3. Cấu trúc dữ liệu không gian, những thuật toán cơ sở và phươngthức xâm nhập dữ liệu. Chương này ra mắt cấu trúc dữ liệu không gian, cácthuật toán hình học được tăng trưởng để thao tác với dữ liệu không gian và phươngthức xâm nhập dữ liệu không gianChương 4. Khảo sát hệ quản trị cơ sở dữ liệu không gian thương mại vàphát triển ứng dụngChương 1 – Giới thiệu chung về cơ sở dữ liệu không gian1. 1 Giới thiệu chung về cơ sở dữ liệuCơ sở dữ liệu ( Database ) là tập dữ liệu có mối quan hệ đối sánh tương quan nhauvà tàng trữ trong thiên nhiên và môi trường máy tính, Database hoàn toàn có thể được xem như một hoặcvài file tàng trữ trên 1 số ít thiết bị nhớ ngoài. Hệ quản trị cơ sở dữ liệu ( Database Management System – DBMS ) là tập những ứng dụng quản trị cấu trúccơ sở dữ liệu và tinh chỉnh và điều khiển truy nhập ( minh họa hình 1.1 ) gồm có :  Định nghĩa cơ sở dữ liệu ( Chỉ ra những kiểu dữ liệu, cấu trúc và những ràngbuộc ),  Thao tác, Truy vấn và Cập nhật cơ sở dữ liệu. Người sử dụng / người lập trìnhChương trình ứng dụng / Truy vấnPhần mềm giải quyết và xử lý truy vấnPhần mềm truy vấn dữ liệuLưu trữ DBLưu trữ định nghĩa DB ( metadata ) Hình 1.1. Môi trường mạng lưới hệ thống cơ sở dữ liệu đơn giảnPhần mềm của hệ quản trị cơ sở dữ liệu gồm có hai phần, phần trên làmnhiệm vụ giải quyết và xử lý những truy vấn của người sử dụng, phần dưới được cho phép truy nhậpvào dữ liệu tàng trữ trên máy tính. Hệ quản trị cơ sở dữ liệu thường được kiến thiết xây dựng trên cơ sở quy mô dữliệu sử dụng, trước kia có quy mô dữ liệu phân cấp ( hierarchical ) và quy mô dữliệu mạng ( network ). Ngày nay, ba quy mô cơ sở dữ liệu đang được phát triểnvà sử dụng thoáng rộng đó là quy mô cơ sở dữ liệu quan hệ ( relational ), hướng đốitượng ( object-oriented ), đối tượng-quan hệ ( object-relational ).  Mô hình dữ liệu phân cấp ngày này đã quá lỗi thời, hệ quản trị cơ sở dữliệu phân cấp ( hierarchical DBMS ) giả sử rằng dữ liệu có mối quan hệ thứbậc cha và con. Cấu trúc dữ liệu bắt buộc phải thiết kế xây dựng tương thích với môhình này để triển khai được quyền lợi và hiệu suất cao trong quản trị.  Hệ quản trị cơ sở dữ liệu mạng ( network DBMS ) được cho phép những cấu trúc dữliệu phức tạp được thiết kế xây dựng nhưng không có tính mềm dẻo và đòi hỏithiết kế phải rất là cẩn trọng, tuy nhiên quyền lợi của quy mô này là nhanhvà hiệu suất cao. 1.1.1 Mô hình quan hệCơ sở dữ liệu quan hệ tăng trưởng trên cơ sở quy mô quan hệ, ở đó dữ liệutổ chức vào những quan hệ hay những bảng. Một lược đồ quan hệ gồm có tập những tênthuộc tính và chúng được ánh xạ tới miền giá trị, lược đồ quan hệ chỉ ra cấu trúccủa quan hệ chứ không chứa dữ liệu. Quan hệ là tập những bản ghi lưu dữ liệu củacác tập thuộc tính trong lược đồ quan hệ. Hệ quản trị cơ sở dữ liệu quan hệ được sử dụng một cách áp đảo so vớicác hệ quản trị cơ sở dữ liệu khác bởi quyền lợi nhanh gọn và an toàn và đáng tin cậy. Tuy nhiên, với những ứng dụng lớn nó tỏ ra lừ đừ vì relation DBMS phải sử dụng rấtnhiều bảng cho hàng loạt những quy tắc1. 1.2 Mô hình hướng đối tượngHệ quản trị cơ sở dữ liệu hướng đối tượng người tiêu dùng OODBMS ( Object-orienteddatabase management system ) tích hợp giữa hướng đối tượng người tiêu dùng và cơ sở dữ liệu. Cơ sở dữ liệu hướng đối tượng người tiêu dùng được đặc trưng bởi quy mô dữ liệu hướng đốitượng và ngôn từ lập trình hướng đối tượng người dùng, ở đó những đơn vị chức năng dữ liệu là những đốitượng cơ sở. Các đối tượng người tiêu dùng này có định danh, thuộc tính và hành vi được địnhnghĩa qua phương pháp, tổng thể được bao gói trong chính đối tượng người dùng đó. 1.1.3 Mô hình đối tượng-quan hệMô hình Object-relational được lan rộng ra từ quy mô dữ liệu quan hệ, môhình này là sự thỏa hiệp giữa hai khái niệm hướng đối tượng người dùng và quan hệ. Ở đócác đặc trưng hướng đối tượng người dùng được tích hợp trong cơ sở dữ liệu quan hệ nhằmsử dụng sức mạnh của quy mô hướng đối tượng người tiêu dùng trong khi đó vẫn duy trì đầy đủcác tính năng trong quy mô quan hệ1. 2 Giới thiệu về GIS ( Geographic information system ) Có rất nhiều định nghĩa về GIS, một cách dễ hiểu hoàn toàn có thể tưởng tượng GIS làhệ thống thông tin địa lý, về góc nhìn map học thì GIS là phối hợp của lập bảnđồ và công nghệ tiên tiến cơ sở dữ liệu, GIS không chỉ là công cụ tạo map mà còn lưutrữ và màn biểu diễn dữ liệu. Sau đây là một số ít định nghĩa về GIS hay được sử dụng [ 1 ]. Định nghĩa của dự án Bất Động Sản The Geographer’s Craft, Khoa Địa lý, TrườngĐại học TexasGIS là cơ sở dữ liệu số chuyên sử dụng trong đó hệ trục tọa độ không gian làphương tiện tham chiếu chính. GIS gồm có những công cụ để triển khai những côngviệc sau đây :  Nhập dữ liệu từ map giấy, ảnh vệ tinh, ảnh máy bay, số liệu tìm hiểu vàcác nguồn khác.  Lưu trữ dữ liệu, khai thác, truy vấn cơ sở dữ liệu  Biến đổi dữ liệu, nghiên cứu và phân tích, quy mô hóa, gồm có cả dữ liệu thống kê vàdữ liệu không gian.  Lập báo cáo giải trình, gồm có map chuyên đề, những bảng biểu, biểu đồ và kếhoạch. Từ định nghĩa trên thấy rõ ba yếu tố sau của GIS.  Thứ nhất, GIS có quan hệ với ứng dụng cơ sở dữ liệu. Toàn bộ thông tintrong GIS đều link với tham chiếu không gian như phương tiện đi lại chínhđể tàng trữ và xâm nhập thông tin.  Thứ hai, GIS là công nghệ tiên tiến tích hợp. Hệ GIS khá đầy đủ có khá đầy đủ khả năngphân tích, gồm có nghiên cứu và phân tích ảnh máy bay, ảnh vệ tinh hay tạo lập môhình thống kê, vẽ map Cuối cùng, GIS được xem như tiến trình khôngchỉ là phần cứng, ứng dụng rời rạc mà GIS còn được sử dụng vào trợgiúp quyết định hành động. Cách thức nhập, tàng trữ, nghiên cứu và phân tích dữ liệu trong GIS phảiphản ánh đúng phương pháp thông tin sẽ được sử dụng trong việc làm lậpquyết định hay điều tra và nghiên cứu đơn cử. Định nghĩa của Viện Nghiên cứu Hệ thống Môi trường ESRI, MỹGIS là công cụ trên cơ sở máy tính để lập map và nghiên cứu và phân tích những cáiđang sống sót và những sự kiện xảy ra trên Trái đất. Công nghệ GIS tích hợp những thaotác cơ sở dữ liệu như truy vấn và nghiên cứu và phân tích thống kê với lợi thế quan sát và phântích thống kê map. Các năng lực này sẽ phân biệt GIS với những hệ thông tinkhác. Có rất nhiều chương trình máy tính sử dụng dữ liệu không gian nhưAutoCAD và những chương trình thống kê, nhưng chúng không phải là GIS vìchúng không có năng lực triển khai những thao tác không gian. Định nghĩa của David Cowen, NCGIA, MỹGIS là mạng lưới hệ thống phần cứng, ứng dụng và những thủ tục được thiết kế để thuthập, quản trị, giải quyết và xử lý, nghiên cứu và phân tích, quy mô hóa và hiển thị những dữ liệu qui chiếukhông gian để xử lý những yếu tố quản trị và lập kế hoạch phức tạp. Độ phức tạp của quốc tế thực là không số lượng giới hạn. Càng quan sát thế giớigần hơn càng thấy được cụ thể hơn. Con người mong mỏi tàng trữ, quản trị đầyđủ những dữ liệu về quốc tế thực. Nhưng sẽ dẫn đến phải có cơ sở dữ liệu lớn vôhạn để tàng trữ mọi thông tin đúng mực về chúng. Do vậy, để tàng trữ được dữliệu không gian của quốc tế thực vào máy tính thì phải giảm số lượng dữ liệuđến mức hoàn toàn có thể quản trị được bằng tiến trình đơn giản hóa hay trừu tượng hóa ( hình 1.2 ). Ý nghĩa hầu hết của tin học hóa thông tin địa lý là năng lực tích hợp cáckiểu và nguồn dữ liệu độc lạ. Mục tiêu của GIS là cung ứng cấu trúc một cáchhệ thống để quản trị những thông tin địa lý khác nhau và phức tạp, đồng thời cungcấp những công cụ, những thao tác hiển thị, truy vấn, mô phỏngGIS tàng trữ thông tin quốc tế thực thành những tầng ( layer ) map chuyênđề mà chúng có năng lực link địa lý với nhau ( hình 1.3 ). Mỗi nhóm người sửdụng sẽ chăm sóc nhiều hơn đến một hay vài loại thông tin. Thí dụ, Sở Giaothông công chính sẽ chăm sóc nhiều đến mạng lưới hệ thống đường phố. Sở Nhà đất quanThế giới thựcHình 1.2 Hệ thông tin địa lýSDLPhầnmềmcôngcụNgười sử dụngKết quảTrừu tượng hóađơn giản hóa1. 1.1.1. 1.1.6 GHình 1.3 Tầng bản đồTầng Nhà ởTầng Đườngquốc lộhốTầng KháchhàngTầngBiênànhchính10tâm nhiều đến những khu dân cư và văn phòng. Sở Thương mại chăm sóc nhiều đếnphân bổ người mua trong vùng. Tư tưởng tách map thành tầng tuy đơn giảnnhưng khá mềm dẻo và hiệu suất cao, giúp xử lý rất nhiều yếu tố về thế giớithực. 1.3 Mô hình cơ sở dữ liệu không gian1. 3.1 Giới thiệuNhư phần trên đã ra mắt thì dữ liệu GIS cần phải được tàng trữ và quảnlý cả dữ liệu không gian và dữ liệu số và được điều khiển và tinh chỉnh trực tiếp bởi ứng dụnghoặc hệ quản trị cơ sở dữ liệu. Hệ thống ứng dụng GIS hoàn toàn có thể điều khiển và tinh chỉnh dữ liệutrực tiếp từ file, tuy nhiên điều này dẫn đến mất đi tính độc lập, bảo mật thông tin và sựthống nhất trong tinh chỉnh và điều khiển dữ liệu do những đặc trưng sau [ 2 ] :  Cấu trúc dữ liệu không gian rất phức tạp. Một đối tượng người dùng hoàn toàn có thể chỉ đơnthuần là một điểm nhưng cũng hoàn toàn có thể được tạo nên từ hàng nghìn đa giácphân bố tuỳ ý trong không gian. Việc tàng trữ tập dữ liệu như vậy không thểsử dụng một bảng quan hệ với những bản ghi kích cỡ cố định và thắt chặt mà đòi hỏiphải thiết kế xây dựng cấu trúc dữ liệu khác tương thích  Dữ liệu không gian luôn có sự biến hóa, do đó cần phải linh động trong tổchức dữ liệu, tương hỗ những thao tác bổ trợ, vô hiệu, update với thời gianđáp ứng nhanh nhất.  Dữ liệu không gian thường có dung tích rất lớn. Việc lưu những map địalý hoàn toàn có thể cần đến hàng gigabyte bộ nhớVới những nguyên do này thì hệ quản trị cơ sở dữ liệu, cần phải tích hợp, biểudiễn và tháo tác với thông tin địa lý cùng với dữ liệu truyền thống lịch sử tại mức logic11và tương hỗ một cách hiệu suất cao ở mức vật lý để tàng trữ và giải quyết và xử lý thông tin về khônggian. Sau đây là những nhu yếu thiết yếu cho việc thiết kế xây dựng cơ sở dữ liệu khônggian ( Spatial database – SDB – ).  Trước hết, đó phải là một hệ cơ sở dữ liệu,  Các kiểu dữ liệu không gian phải được phân phối trong những quy mô dữ liệuvà ngôn từ truy vấn, những phép toán truy vấn quan hệ như phép nối, chọn, … Có thể được sử dụng ở Hệ quản trị cơ sở dữ liệu không gian ( SDBMS-Spatial database management system – ). Cần thiết kiến thiết xây dựng thêm một sốphép toán mới với những kiểu dữ liệu hình học,  Biểu diễn dữ liệu logic phải được lan rộng ra tới dữ liệu kiểu hình học vàthoả mãn tính độc lập dữ liệu, duy trì tính đơn thuần nhất hoàn toàn có thể và tínhđóng so với người sử dụng,  Ngôn ngữ truy vấn phải tích hợp với những hàm nhằm mục đích tương hỗ kiến thiết xây dựng ứngmột cách phong phú và đa dạng những đối tượng hình học,  Có thể trình diễn vật lý một cách hiệu suất cao dữ liệu không gian,  Truy nhập dữ liệu không gian một cách hiệu suất cao, lúc bấy giờ, B-tree khôngcòn là tiếp cận với truy nhập dữ liệu không gian. Và theo đó tất cả chúng ta cầnxây dựng cấu trúc mới cho việc đánh chỉ mục cơ sở dữ liệu không gian. Xuất phát từ những nhu yếu trên, có ba cách tiếp cận khi thiết kế xây dựng hệ quảntrị cơ sở dữ liệu không gian Relational DBMS. 1.3.2 Sử dụng quy mô cơ sở dữ liệu quan hệSử dụng hệ quản trị cơ sở dữ liệu quan hệ để quản trị GIS có những đặctrưng chính như : 12  Biểu diễn những đối tượng người tiêu dùng bằng những quan hệ ( bảng ). Mỗi hàng thể hiệnmột đối tượng người tiêu dùng, mỗi cột là thuộc tính diễn đạt đối tượng người dùng đó,  Thuộc tính có kiểu alphanumeric ( ví dụ như Strinh hay real ),  Truy vấn dựa vào SQL, Đây là cách tiếp cận xoay quanh chuẩn SQL, nhưng khi điều khiển và tinh chỉnh cácứng dụng về không gian địa lý có những hạn chế sau :  Vi phạm nguyên tắc độc lập dữ liệu, những truy vấn trên đối tượng người dùng yên cầu cóhiểu biết về cấu trúc những đối tượng người dùng không gian. sự đổi khác cấu trúc dẫnđến phải tổ chức triển khai lại cơ sở dữ liệu và đổi khác công thức truy vấn,  Cần đến số lượng lớn những dòng dữ liệu bộc lộ dữ liệu không gian,  Cuối cùng là thiếu đi sự thân thiện với người sử dụng. Rất khó định nghĩakiểu không gian mới, đặc biệt quan trọng là khó kiểm tra những phép toán cơ bản. 1.3.3 Sử dụng kiến trúc song song. Hiện nay rất nhiều hệ đã được biết đến khi kiến thiết xây dựng những ứng dụng GISnhư : ArcInfo ( ESRI ), MGE và TIGISs sử dụng cách tiếp cận này. Kiến trúc nàytách riêng việc quản trị dữ liệu diễn đạt ( dữ liệu dạng alphanumeric ) với quản trị dữliệu không gian, gồm hai mạng lưới hệ thống cùng xuất hiện hình 1.4.13 Bao gồm :  Hệ quản trị cơ sở dữ liệu quan hệ và 1 số ít thành phần ở đó miêu tả dữliệu kiểu alphanumeric,  Các công dụng cho việc quản trị dữ liệu không gian. Tuy nhiên tiếp cận này cũng xuất hiện hạn chế như :  Hai thành phần trên Open cùng nhau mà quy mô dữ liệu củachúng lại không như nhau, do vậy khi quy mô phải sử dụng kết hợpnhững thực thi khác nhau,  Mất một phần tính năng cơ bản của Hệ quản trị cơ sở dữ liệu như : Phục hồi, sao lưu dữ liệu, truy vấn và tối ưu dữ liệu. Các chương trình ứng dụngHệ quản trị cơ sở dữ liệuquan hệ ( SQL chuẩn ) Các giải quyết và xử lý hình họcDBfileHình 1.4. Kiến trúc tuy nhiên song141. 3.4 Tích hợp trên cơ sở lan rộng ra hệ quản trị cơ sở dữ liệuMô hình này đã nhận được sự chăm sóc rất lớn từ nhiều năm trước đó ởnhiều ứng dụng và được tăng trưởng trên cơ sở thêm những kiểu, những toán tử mới vàohệ thống cơ sở dữ liệu quan hệ như sau :  Ngôn ngữ truy vấn SQL được lan rộng ra để thực thi dữ liệu khônggian. Toán tử không gian được điều khiển và tinh chỉnh trên cơ sở những kiểu dữ liệualphanumeric,  Một số công dụng khác của cơ sở dữ liệu như tối ưu hoá truy vấn, được sửa đổi nhằm mục đích thích nghi với những dữ liệu không gian một cáchhiệu quả. Hầu hết những hệ quản trị cơ sở dữ liệu có sẵn đều sử dụng cách tiếp cận mởrộng không gian ví dụ như Oracle ( Bắt đầu từ phiên bản 8 i ) và PostgreSQL. 1.4 Kết luậnXây dựng và tăng trưởng cơ sở dữ liệu không gian hiệu suất cao sử dụng môhình object-relational hay hoàn toàn có thể nói tích hợp dữ liệu không gian vào cơ sở dữliệu quan hệ trên cơ sở lan rộng ra hệ quản trị cơ sở dữ liệu, như vậy sẽ tận dụngđược sức mạnh của hướng đối tượng người dùng mà vẫn duy trì được những tính năng quantrọng trong cơ sở dữ liệu quan hệ. Tích hợp dữ liệu không gian như thế nào ? Sẽđược đề cập ở chương 3. Cấu trúc dữ liệu không gian, những thuật toán cơ sở vàphương thức xâm nhập. 15C hương 2 – Mô hình dữ liệu, mối quan hệ và ràng buộckhông gian2. 1 Giới thiệuMô hình hóa dữ liệu không gian là vô cùng quan trọng trong việc tích hợpvà màn biểu diễn dữ liệu không gian trong cơ sở dữ liệu. Các mối quan hệ không giancũng rất thiết yếu bởi những nguyên do sau :  Cho việc thực thi những truy vấn không gian. Truy vấn trong cơ sở dữ liệukhông gian hay GIS thường được triển khai trên cơ sở những mối quan hệgiữa những đối tượng người tiêu dùng không gian. Ví dụ, lấy hàng loạt lô đất kề với lô đất A, truy vấn này tương quan đến những điều kiện kèm theo mà ngôn từ SQL thông thườngkhông cung ứng được. Các mối quan hệ không gian là thiết yếu cho cả côngthức truy vấn và những mức giải quyết và xử lý,  Thỏa mãn tính đồng nhất của cơ sở dữ liệu. Các mối quan hệ không giancũng được sử dụng để thống kê giám sát những ràng buộc trong cơ sở dữ liệu khônggian. Ví dụ kiểm tra ràng buộc “ Hai lô đất phải chồng lên nhau ” trong cơsở dữ liệu địa chính ví dụ điển hình. Các mối quan hệ không gian cung ứng ýnghĩa trong việc định nghĩa và điều khiển và tinh chỉnh những ràng buộc trong cơ sở dữliệu do đó những công thức cơ sở cho những mối quan hệ không gian đượcthành lập và là thành phần quan trọng trong việc tăng trưởng GIS.Các ràng buộc toàn vẹn và thống nhất dữ liệu là điều kiện kèm theo cần cho việcđiều khiển và thống nhất dữ liệu trong cơ sở dữ liệu sao cho nó thỏa mãn nhu cầu tínhnhất quán, hợp lệ và dễ sử dụng. 16C ác phần dưới đây sẽ trình diễn kĩ hơn về quy mô dữ liệu không gian, mốiquan hệ và ràng buộc không gian. 2.2 Mô hình dữ liệu không gianCơ sở dữ liệu không gian được cho phép quản trị dữ liệu không gian trong môhình dữ liệu và ngôn từ truy vấn, yếu tố rất quan trọng cần chăm sóc là làm thếnào để quy mô hóa những đối tượng người tiêu dùng không gian. Có hai yếu tố mà cần được biểudiễn đó là : ( i ) Đối tượng trong không gian, là những đối tượng người tiêu dùng thực trong tự nhiênđược miêu tả bởi hình dáng của nó như : sông, thành phố, rừng và ( ii ) không gian. Nói một cách khác hai yếu tố này hoàn toàn có thể được xem như : ( i ) Các đối tượng người tiêu dùng đơn lẻvà ( ii ) Tập những đối tượng người dùng không gian. Các đối tượng người dùng độc lập được trình diễn một cách trừu tượng bởi điểm, đọanthẳng và miền ( minh họa hình 2.1 ). Hình 2.1. Các kiểu cơ bản : Điểm, đoạn thẳng và miềnTập những đối tượng người dùng có hai yếu tố đó phân cắt và mạng, phân cắt được xemnhư tập những đối tượng người tiêu dùng ( miền ) không giao nhau, những miền này phân loại vùngthành nhiều vùng con ( hình 2.2 ), mạng có những đặc trưng như nút và tập đọanthẳng diễn đạt những cạnh, chi tiết cụ thể sẽ được bộc lộ ở phần sau. 17H ình 2.2. Phân cắt và mạngDữ liệu không gian được tổ chức triển khai theo những cách khác nhau và đượcminh họa như hình 2.3. Gồm quy mô raster và vectơ, chúng thường được xemnhư quy mô field-based hay object-based. Biểu diễn raster sử dụng tessellationscho việc quy mô hóa tập dữ liệu và màn biểu diễn vectơ thì đối tượng người dùng là đơn vị chức năng cơsở, đồng thời có hai cấu trúc bộc lộ tập những đối tượng người dùng đó là : Có cấu trúc ( nhưtôpô, network ) và phi cấu trúc ( spagetti ). Mô hình tôpô tương đối phổ cập, nóko đơn thuần như cấu trúc spagetti. RasterField-baseVectorObject-base hayEntity baseTessellationLưới đềuMô hình dữ liệukhông gianTessellationLưới không đềuCó cấu trúcTôpô, NetworkKhông cấu trúcSpagettiHình 2.3. Các quy mô dữ liệu không gian2. 2.1 Mô hình dữ liệu rasterPhương pháp màn biểu diễn những đặc trưng địa lý bằng những điểm ảnh được gọi làphương pháp raster hay quy mô dữ liệu raster. Tiến trình thiết kế xây dựng lưới tế bàođược thực thi như sau : 18G iả sử phủ một lưới trên map gốc, dữ liệu raster được lập bằng cách mãhóa mỗi tế bào bằng một giá trị dựa theo những đặc trưng trên map ( hình 2.4 ). Trong thí dụ này, đặc trưng ” đường ” được mã hóa là 2, đặc trưng ” điểm ” đượcmã hóa là 1 còn đặc trưng ” vùng ” được mã hóa là 3. Kiểu dữ liệu của tế bàotrong lưới phụ thuộc vào vào thực thể được mã hóa ; Có thể sử dụng số nguyên, sốthực, ký tự hay tổng hợp chúng để làm giá trị. Độ đúng chuẩn của quy mô này phụthuộc vào kích cỡ hay độ phân giải của những tế bào lưới. Một điểm hoàn toàn có thể làmột tế bào, một đường là vài tế bào kề nhau, một vùng là tập hợp nhiều tế bào. Mỗi đặc trưng là tập tế bào đánh số như nhau ( có cùng giá trị ). Hình dạng hình học bao trùm hàng loạt mặt phẳng được gọi là ” khảm ” ( tessellation ). Minh họa hình 2.5. iểmùngườngàngộtBản đồ gốcLướiMa trận lưu trữHình 2.4 Biểu diễn raster19Biểu diễn raster tương thích với quy mô dữ liệu field-based bởi so với kiểudữ liệu entity-base thì đối tượng người dùng không gian trong không gian hai chiều đượcbiểu diễn bởi tập những điểm nằm trong nó, mỗi điểm được coi như một điểm ảnh, vị trí của nó chính là địa chỉ của điểm ảnh và việc biểu lộ đối tượng người tiêu dùng một cáchtrung thực là một điều vô cùng quan trọng nhưng mỗi đối tượng người tiêu dùng chiếm mộtkhông gian bộ nhớ khá lớn, ngoài những còn có thêm những toán tử trên những đối tượng người tiêu dùng. Đây chính là điểm hạn chế dẫn đến phải có cách trình diễn khác với quy mô dữliệu entity base tuy nhiên, thông tin nhiều lúc hoàn toàn có thể được nén. Đối với dữ liệu field-base thì trong thực tiễn chiêu thức này hoàn toàn có thể gặp ở trongcác ứng dụng giải quyết và xử lý ảnh chụp từ xa ( ảnh vệ tinh ), dự báo thời tiết hoặc ô nhiễmmôi trường. Do vậy dữ liệu field – base bộc lộ hàm từ không gian tới phạm vinhư nhiệt độ hoặc là độ cao so với mặt biển. Tuy nhiên miền những hàm này khôngcòn là tập số lượng giới hạn những điểm nữa mà là tập vô hạn những điểm. Nói một cách kháckhông gian không được coi như trường liên tục nữa mà rời rạc khi màn biểu diễn dữliệu. Tóm lại, Lợi thế lớn nhất của mạng lưới hệ thống raster là dữ liệu hình thành nên bảnđồ trong bộ nhớ máy tính, những thao tác kiểu như so sánh lưới tế bào được thựchiện thuận tiện. Tuy nhiên mạng lưới hệ thống raster sẽ không thuận tiện cho việc biểu diễnHình 2.5 ” Khảm ” mặt phẳngTế bào chữ nhậtTế bào lục giácTế bào tam giác20đường, điểm vì mỗi loại là tập những tế bào trong lưới. Đường thẳng hoàn toàn có thể bị đứtđoạn hay rộng hơn. 2.2.2 Mô hình dữ liệu VectơTrong chiêu thức này, những đối tượng người tiêu dùng được cấu trúc chính từ những thànhphần cơ sở như : điểm, đọan thẳng ( list những điểm ) và mặt phẳng của đối tượng người dùng ( list những những cạnh ). Hình 2.6 là minh họa cho giải pháp này. Trái vớibiểu diễn raster, màn biểu diễn vector không tốn bộ nhớ. Như vậy, quy mô dữ liệu vectơ sử dụng những đoạn thẳng hay điểm rời rạcđể phân biệt những vị trí của quốc tế thực ( hình 2.7 ). Kiểu thànhphần sơ cấpBiểu diễn bằng đồ họaBiểu diễn sốĐiểmĐườngVùngBề mặtKhốiTọa độ ( x, y ) trong2Dvà ( x, y, z ) trong3D1. Danh sách tọa độ2. Hàm toán học1. Đường có điểm đầu và cuối trùngnhau2. Tập những đường nếu vùng có lỗ hổng1. Ma trận điểm 2. Tập những tam giác3. Hàm toán học 4. Đường bình độTập bề mặtHình 2.6 Các thành phần hình học cơ sở

Source: https://vh2.com.vn
Category : Trái Đất