Bazı terimler, kavramlar, veri tipleri

advertisement
BAZI TERİMLER,
KAVRAMLAR
ve
VERİ TİPLERİ
Orhan Gündüz
CBS’de kullanılan veriler iki ana tiptedir:
1. Vektörel veri (Shape data)
2. Hücresel veri (Raster data)
Vektörel veri kendi içinde 3 sınıfa ayrılır:
1. Nokta verisi (Point data)
2. Çizgi verisi (Line/Polyline data)
3. Poligon verisi (Polygon data)
Noktasal veri:
•
•
•
0-D objelerdir.
Bir nokta iki koordinattan (X,Y) oluşur.
Genellikle noktasal gösterime uygun veriler için kullanılır.
(kuyu, köy, suç mahali, şehirler gibi objeler)
Çizgi verisi:
•
•
•
•
1-D objelerdir.
İki nokta arasındaki en kısa mesafe bir doğrudur.
Başlanğıç ve bitiş noktaları vardır.
Çizgisel gösterime uygun veriler için kullanılır.
(nehirler, yollar, sınırlar gibi objeler)
Poligon verisi:
•
•
•
2-D objelerdir.
Poligon doğrusal çizgilerle birbirine bağlanan noktalardan oluşan ve
başlanıç noktasına geri dönen noktalar kümesidir.
Alansal gösterime uygun veriler için kullanılır.
(göller, parseller, ülkeler gibi objeler)
ÇİZGİ
NOKTA
(X2,Y2)
(X,Y)
sol
sağ
ÇOKLU ÇİZGİ
POLİGON
(Xn,Yn)
dışı
(X2,Y2)
içi
(X1,Y1)
(X2,Y2)
(X1,Y1)
(X1,Y1)
(Xn-1,Yn-1)
* Poligonu oluştururken saat
yönünde ilerleme kolaylık
sağlar.
Nod:
En az 3 çizgi parçasının kesiştiği özel bir tür noktadır.
2 boyutlu uzayda iki koordinattan (X,Y) oluşur.
(X1,Y1)
(X1,Y1)
Piksel:
Bir resmin parçalanamaz en küçük elemanıdır (ör. dijital fotoğraflardaki piksel)
Grid/Grid hücresi:
Sürekli bir yüzeyin bir iki boyutlu bir elemanıdır.
(hücresel veri modelinde kullanılır)
Sembol:
Haritalarda bazı özel objelerin veya özelliklerin gösteriminde kullanılan
grafik elemanıdır.
Hastane
Havalimanı
Açıklama (Annotation):
Grafik olarak bir objeyi işaretleyen yazı veya etiket
ANKARA
Gediz Nehri
CBS işlemleri
1. İleri veri gösterimi (veriden haritaya)
2. Geri veri gösterimi (haritadan veriye)
3. Poligon içinde nokta analizi (point in polygon)
4. Poligon içinde çizgi analizi (line in polygon)
5. Poligon üsteleme/bindirme (overlay)
6. Tampon bölge analizi (buffer)
7. Tematik haritalama
8. Alan/mesafe hesaplamaları
9. Geokodlama ve adres eşleştirme
10. Ağ (network) analizi
11. Yüzey modelleme
Meta-veri kavramı (verinin verisi) :
•
•
•
•
•
“Veri ile ilgili veri”
Veri tabanının içeriğini anlatan genel tanımalamalar
Veriyi dokümante eden bilgiler
Dosya, format, sakalam yeri, kaynağı gibi bilgileri içerir
Çok önemlidir!!!
CBS’de kullanılan bilgisayar sistemleri
1. Bağımsız sistemler (Standalone systems)
(tek PC, yerel veri saklama ve işleme)
2. Ağa bağlı sistemler (Networked systems)
(NT, yerel veri işleme, merkezi veri saklama, kimlik bilgisi sorgulamalı)
3. Merkezi sistemler (Centralized systems)
(UNIX, merkezi veri saklama ve işleme)
CBS
Vektör-tabanlı CBS
•
•
•
•
•
•
Objeler nokta, çizgi veya
poligon olarak saklanır
Veri gruplanabilir
Tüm verilerin (X,Y)
koordinatları içerir
Tematik gösterim mümkündür
Üsteleme/Bindirme işlemleri
zordur
Sınırlar kolay gösterilir
Hücre-tabanlı CBS
•
•
•
•
•
•
Objeler grid olarak saklanır
Çözünürlük ne kadar
yüksekse o kadar iyidir
Sınırların gösterimi zordur
Vektör tabanlı objelerin (ör.
yol, nehir, çit gibi) gösterimi
zordur
Üsteleme/bindirme işlemleri
için çok uygundur
Modellemeye uygundur
Topoloji:
•
•
•
•
•
Objeler arasındaki ilişkileri tanımlar
Topoloji
 Doğrultu (Direction)
 Bağlantı (Connectivity)
 Komşuluk (Adjacency or contiguity)
 Yakınlık (Proximity)
gibi kavramları çalışan bir matematik dalıdır.
Bu sayede bilgisayar, grafik objeler arasındaki
ilişkileri bilebilmekte ve işlemleri yapabilmektedir.
Topolojik veri yapısı nodlar ve köşelere dayanır.
CBS işlemlerinde sıklıkla kullanılır.
CBS’de KULLANILAN VERİ
SINIFLANDIRMA
METOTLARI
Orhan Gündüz
CBS’de veri aşağıdaki tekniklere göre
sınıflandırılabilir :
1.
2.
3.
4.
5.
6.
7.
Doğal kesimler (Natural breaks)
Nicelikler (Quantiles)
Eş alan (Equal area)
Eş aralık (Equal interval)
Standart sapma (Standart deviation)
Süreklilik / süreksizlik
Normalizasyon
DOĞAL KESİMLER
•
•
•
•
•
Veriler minimumdan maksimuma doğru sıralanır.
Ani değişiklik gözlenen yerden kesilir.
Tüm kesmeler arasındaki veriler gruplanır.
Kesme noktalarının tespiti için istatistiksel teknikler de kullanılabilir.
Varyans minimizasyonu bir yöntemdir.
NİCELİKLER
•
•
•
Veri, her aralığa aynı sayıda data düşecek şekilde bölünür.
Doğrusal veri için en uygun yöntemdir.
Diğer veriler için hatalı olabilir.
EŞİT ALAN
•
•
Poligon verisini sınıflandırmak için kullanılır.
Veri eşit alan aralıkları olacak şekilde sınıflandırılır.
EŞİT ARALIK
•
Eşit boyutta aralıklar şeçilerek yapılır
Ör: Veri (12…351) aralığındaysa, toplam veri aralığı 339’dur. Bunu 3 eşir
aralığa bölersek, her bir aralık 113 büyüklüğünde olur. Buna göre:
12-125
125-238
238-351
aralıkları ortaya çıkar.
STANDARD SAPMA
•
•
•
•
Veri setinin ortalaması hesaplanır
Ortalama değerden yukarı ve aşağı olacak şekilde ¼, ½ or 1 standard
sapma olacak şekilde kesmeler konur
Nüfus gibi veri tiplerine uygun bir sınıflandırma şeklidir.
Verinin ortalam etrafındaki dağılımı ve ortalamadan sapmasının
görülmesi açısından uygun bir sınıflandırma tekniğidir. Verinin nerde
yoğunlaştığını nerede seyrekleştiğini görme imkanı tanır.
NORMALİZASYON
•
•
Verinin kendisi yerine normalleştirilmiş bir versiyonu kullanılır.
Normalizasyon genellikle veri toplamına veya maksimum veri değerine
bölünerek yapılır.
Veri değeri / toplam (data) * 100
Download
Study collections