Bölüm 6 İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi 6.1 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Öğrenme Hedefleri • Geleneksel dosyalama ortamındaki veri kaynaklarının yönetim sorunlarının veri tabanlı yönetim sistemiyle nasıl çözüleceğinin tanımlandırılması • Veritabanı yönetim sisteminin değerlendirilmesi ve yeteneklerinin tanımlanması • Önemli veritabanı tasarımlarına ilişkin uygulamalar • İşletme performansı ve karar vermeyi geliştirmek için veritabanından verilerin alınmasında kullanılan araç ve teknolojilerin değerlendirilmesi • Firmaların veri kaynaklarının yönetilmesinde enformasyon politikası, veri yönetimi ve veri kalitesinin güvenli olması rollerinin değerlendirilmesi 6.2 © 2010 by Prentice Hall Bölüm 6 İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Geleneksel Dosya Ortamında Organize edilmiş Veri • Dosya Organizasyonu Kavramı • • • • • Bilgisayar sistemi verileri hiyerarşik olarak gruplar Alan: Karakteri belirten kelime veya rakamlar Kayıt: Bir nesneyi açıklayan alan grupları Dosya: Aynı tip grup kayıtları Veritabanı: İlgili dosya grupları • Kayıt: Varlığın tanımlandırılması • Nitelik: Kişi, yer ve unsurlar hakkında kayıt ettiğimiz enformasyonlar • Özellik: Her karakteristik yada kaliteyi tanımlandırıcı özelliği • Örneğin, Ders özelliklerine bağlı olarak not yada tarih yüklenmesi 6.3 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Geleneksel Dosya Ortamında Organize Edilmiş Veri Data Hierarchy A computer system organizes data in a hierarchy that starts with the bit, which represents either a 0 or a 1. Bits can be grouped to form a byte to represent one character, number, or symbol. Bytes can be grouped to form a field, and related fields can be grouped to form a record. Related records can be collected to form a file, and related files can be organized into a database. Figure 6-1 6.4 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri; Veri Tabanları ve Enformasyon Yönetimi Geleneksel Dosya Alanlarında Organze Edilmiş Veri • Geleneksel dosya ortamıyla ilgili problemler (Farklı departmanlar tarafından dosyaların ayrı ayrı tutulması) • Veri Tekrarı ve Uyumsuzluk • Veri Tekrarı : Birçok dosyada yenilenen mevcut veriler • Veri Uyumsuzluğu: Aynı özelliklerin farklı değerlerle ifade edilmesi • Program veri bağımlılığı: • Programdaki değişiklikler program tarafından alınan veride değişiklikler gerektirir • Esneklikten yoksunluk • Düşük güvenlik • Verilerin uygun hale getirilmesinde ve paylaşılmasındaki eksiklik 6.5 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Geleneksel Dosya Alanlarında Organize Edilmiş Veri Geleneksel Dosyalama Süreci The use of a traditional approach to file processing encourages each functional area in a corporation to develop specialized applications and files. Each application requires a unique data file that is likely to be a subset of the master file. These subsets of the master file lead to data redundancy and inconsistency, processing inflexibility, and wasted storage resources. Figure 6-2 6.6 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Veri Yönetimine Veri Tabanlı Yaklaşım • Veri Tabanı • Bir örgütün elde ettiği veri organizasyonlarını bir çok uygulamayla merkezileştirilmiş verilerle ve kontrollü yedek veriler yardımıyla sunulmasıdır. • Verilerin birçok uygulamada kullanılmak üzere merkezi hale getirilerek ve veri tekrarı kontrol edilerek toplanması • Veri Tabanı Yönetim Sistemi • Uygulamalı programları ve fiziksel veri dosyaları arasında arayüz olması • Verilerin mantıksal ve fiziksel görünümlerinin ayrılması • Geleneksel dosya ortamı programlarının çözülmesi 6.7 • Veri tekrarının kontrolü • Uygun olmayanların elimine edilmesi • Veri yönetimi ve veri güvenliğinin yönetiminin sağlanması © 2010 by Prentice Hall Bölüm 6 İş zekasının temelleri: Veri Tabanları ve Enformasyon Yönetimi Çok Boyutlu İnsan Kaynakları Veri Tabanları A single human resources database provides many different views of data, depending on the information requirements of the user. Illustrated here are two possible views, one of interest to a benefits specialist and one of interest to a member of the company’s payroll department. Figure 6-3 6.8 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İlişkisel Veri Tabanı Yönetim Sistemleri (VTYS) • İki boyutlu olarak adlandırılan tabloların birbirleriyle olan ilişkilerinin ve dosyaların veri olarak sunulmasını sağlar. • Herbir tablo birimler ve özelliklere ilişkin veri içerir Tablo: Sütun ve satırlardan oluşur • Veri Grupları-alanlar (Satırlar): Farklı birimlerin kayıtları • Alanlar (Sütunlar) : Birimlere ilişkin özelliklerin gösterilmesi • Anahtar Alan: Her kaydın tekil olarak tanımlanmasında kullanılan anahtar alanlar • Birincil Anahtar: Dosyaların anahtarı için tablodaki alanların kullanılması • Yabancıl (İkincil anahtar): 6.9 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İlişkisel Veritabanı Tablosu A relational database organizes data in the form of two-dimensional tables. Illustrated here are tables for the entities SUPPLIER and PART showing how they represent each entity and its attributes. Supplier_Number is a primary key for the SUPPLIER table and a foreign key for the PART table. Figure 6-4A 6.10 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İlişkisel Veritabanı Tablosu (devamı) Figure 6-4B 6.11 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi VTYS ile ilişkili yönetimler • Kullanışlı veri toplulukları geliştirilmesinde kullanılan 3 temel operasyonlar • Seçim: Kriterleri karşılayan kayıt altına alınan tüm verilerin alt kümelere ayrıştırılması • Birleştirme: Kullanıcılara ulaşılabilir bireysel tablolardan daha çok enformasyonla birlikte ilgili tabloların kombine edilerek kullanıcıya sunulmasıdır. • Proje: Yalnızca özel enformasyonlarla birlikte oluşturulan tablolarda altküme sütunlarının oluşturulması. 6.12 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İlişkisel VYTS’nin 3 Temel Operasyonları The select, project, and join operations enable data from two different tables to be combined and only selected attributes to be displayed. Figure 6-5 6.13 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Nesne Yönelimli VYTS • Nesne olarak işlemlerin ve verilerin kayıt altına alınabilmesi, • Mültimedya uygulamalarını, grafikleri ve Java uygulamalarını yönetebilmektedir, • Nesnel yönelimli VYTS’ler ilişkisel VYTS’lere göre göreceli olarak çok sayıdaki işlemleri yürütmesi açısından daha yavaştır. • Hibrit nesne- İlişkisel VYTS: Hem nesnel yönelimli hem de ilişkisel VYTS’lerin kapasitelerini karşılamak için kullanılabilmektedir. 6.14 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi • Veri Tabanı Yönetim Sistemlerinin Yetenekleri • Veri tanımlama yeteneği: Veri tabanı tabloları oluşturmak ve her tablodaki alanların özelliklerini tanımlamak için kullanılabilmektedir, • Veri sözlüğü: Veri unsularının tanımların ve özelliklerini depolayan otomatik veya kullanıcı tarafından girilen bir dosyadır, • Veri işleme dili: Veriyi eklemek, silmek, değiştirmek ve veriyi geri almak için kullanılan veri işleme dilidir, • Yapılandırılmış sorgu dili (SQL) • Microsoft Access genelleştirmek için kullandığı araçlardır, SQL • Birçok VYTS rapor üretim imkanını içermektedir. Crystal reports büyük işletme VYTS’si için gözde bir rapor üreticisidir. 6.15 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Microsoft Access Veri Sözlüğü Özellikleri Figure 6-6 Microsoft Access has a rudimentary data dictionary capability that displays information about the size, format, and other characteristics of each field in a database. Displayed here is the information maintained in the SUPPLIER table. The small key icon to the left of Supplier_Number indicates that it is a key field. 6.16 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi SQL sorgu örneği Illustrated here are the SQL statements for a query to select suppliers for parts 137 or 150. They produce a list with the same results as Figure 6-5. Figure 6-7 6.17 © 2010 by Prentice Hall Yönetim Bilişim Sistemleri Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Bir Access Sorusu Illustrated here is how the query in Figure 6-7 would be constructed using query-building tools in the Access Query Design View. It shows the tables, fields, and selection criteria used for the query. Figure 6-8 6.18 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi • Veri Tabanlarının Tasarlanması • Kavramsal (mantıksal) dizaynı: İş perspektifi açısından soyut bir modeldir, • Fiziksel Dizayn: Veri tabanının doğrudan erişim saklama aygıtından nasıl düzenlendiğini göstermektedir. Tasarım sürecinin tanımlanması • Veri elemanları arasındaki ilişkileri ve işletmenin enformasyon ihtiyaçlarını karşılamak için veri elemanlarını bir arada gruplamanın en etkili yolu • Normalleştirme • Verilerin karmaşık gruplarından küçük, değişmez, ancak esnek ve adapte edilebilir veri yapıları oluşturma işlemine normalleştirme denmektedir. 6.19 © 2010 by Prentice Hall Yönetim Bilişim Sistemleri Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Siparişe göre normalleştirilmemiş bir ilişki An unnormalized relation contains repeating groups. For example, there can be many parts and suppliers for each order. There is only a one-to-one correspondence between Order_Number and Order_Date. Figure 6-9 6.20 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Siparişe İlişkin Normalleştirilmiş Bir Tablo After normalization, the original relation ORDER has been broken down into four smaller relations. The relation ORDER is left with only two attributes and the relation LINE_ITEM has a combined, or concatenated, key consisting of Order_Number and Part_Number. Figure 6-10 6.21 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi • Varlık – İlişki diyagramı • Veri tabanları tedarikçi ödeme, siparişleri işleme, müşterileri takip etme ve çalışanları ödeme gibi temel işlemleri takip etmek için kullanılır. • Varlıklar arasındaki ilişkilerin gösterilmesi 6.22 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Bir Varlık İlişki Diyagramı This diagram shows the relationships between the entities ORDER, LINE_ITEM, PART, and SUPPLIER that might be used to model the database in Figure 6-10. Figure 6-11 6.23 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi • Veri Tabanlarının Dağılımı • Veri Tabanı Dağılımlarının 2 Temel Metotları • Bölmeli: Veri tabanlarının farklı bölümlere ayrıştırılması • Tekrarlanan: Merkezi veritabanının farklı yerlerle ilişkili olarak yinelenmesi. • Avantajları • Daha Az Güvenlik Açığı • Daha Hızlı Yanıt Olumsuzluklar • Standart tanımlamalar kullanılarak açıklanması • Güvenlik Sorunları 6.24 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi arttırmada veri tabanlarının kullanılması • Çok geniş veri tabanları ve sistemlerin özel yeteneklere ve gereksinimlere gereksinimi • Geniş miktarda vergi analizi • Birden fazla sistemden gelen veriye erişim • 3 kilit teknik: • Veri ambarı • Döküman (Metin) Madenciliği • Web Madenciliği 6.25 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi arttırmada kullanılan veri tabanlarının kullanılması • Veri ambarı: • Birçok ana operasyonel geçiş sistemlerinden bugünkü ve geçmişteki verilerin depolanması, • Girişimcilik için bilginin toplanır ve standardize edilebilir, fakat veri değiştirilemez, • Veri havuzu sistemi sıralama, analiz ve rapor eden araçları sunacaktır. • Veri aşamaları: • Çeşitli veri ambarı • Özel sayıdaki kullanıcı için firma verisine yüksek düzeyde odaklanılarak kullanım için özetlenir, • Tipik olarak bir özne yada belirli bir iş alanı üzerinde odaklanılır, 6.26 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansı ve karar vermede kullanılan veri tabanları Veri havuzunun parçaları The data warehouse extracts current and historical data from multiple operational systems inside the organization. These data are combined with data from external sources and reorganized into a central database designed for management reporting and analysis. The information directory provides users with information about the data available in the warehouse. Figure 6-13 6.27 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları • İş Zekası: • Kullanıcılara daha iyi iş kararları vermeleri için geniş miktarda bilgiye erişimlerini sağlayan, analiz eden ve bunları bir araya getiren araçlar, • Örneğin, Harranın eğlence merkezinin müşterilerin oyun profilini geliştirme ve çok karlı müşterileri belirlemek için yaptırdığı analiz, • Araçların prensip olarak içerdikleri; - Raporlama 6.28 Veri madenciliği Çevrimiçi Çözümlemeli İşleme (OLAP) Web madenciliği © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş Zekası Figure 6-14 A series of analytical tools works with data stored in databases to find patterns and insights for helping managers and employees make better decisions to improve organizational performance. 6.29 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları • Çevrimiçi Çözümlemeli İşleme (OLAP) • Çok boyutlu veri analizlerinin desteklenmesi • Çok boyutları kullanarak verileri görüntüleme • Her açıdan bilginin farklı bölümlendirilmesi (Ürün, fiyat, maliyet, bölge, zaman periyodu) • Örneğin; Haziranda doğuda kaç pul satıldığının diğer bölgelerle karşılaştırılması? • Online analitiksel işlemler o anda oluşturulan sorulara hızlı ulaşılabilinir, online cevaplar sağlar. 6.30 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları Çok Boyutlu Veri Modeli Figure 6-15 The view that is showing is product versus region. If you rotate the cube 90 degrees, the face that will show is product versus actual and projected sales. If you rotate the cube 90 degrees again, you will see region versus actual and projected sales. Other views are possible. 6.31 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları • Veri Madenciliği: • OLAP’dan daha fazla keşif sağlar • Çok büyük veritabanlarında gizlenmiş yapıları ve ilişkileri bulur ve gelecekteki davranış tahminine ilişkin kuralları belirler • Örneğin: Bire bir pazarlama kampanyaları için müşteri veritabanındaki ilişkilerin bulunması veya karlı müşterilerin tanımlanması • Veri madenciliğinden elde edilen enformasyon türleri: • İlişkiler • sıralama • sınıflandırma • Kümeleme • Tahmin 6.32 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları • Öngörülebilir Analizler • Veri madenciliği teknikleri, tarihsel veri, ve tahmin edilen dış çevre olaylarının gelecekteki koşullar hakkındaki varsayımların kullanılması. • Örneğin, Olası müşteri sunulan tekliflere cevap verir yada özel ürün zatın alır. • Metin madenciliği • Büyük yapılandırılmamış veri kümelerinden anahtar elementlerin ayrılması (Örn. e-mailler saklanır) 6.33 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları Web madenciliği • Faydalı kalıp ve bilgilerin internetten keşfedilmesi ve analiz edilmesi, • Örn. Müşteri davranışlarını anlamak, We sitesinin etkinliğini değerlendirmek vb. • Teknikler • Web içerikli madenciliği • Bilginin Web sayfalarının içeriğinden seçilip çıkarılması • Web yapı madenciliği • Örn, Web sayfasından ve linklerden • Web kullanım madenciliği • Web sunucusu tarafından kaydedilen kullanıcı etkileşim verileri 6.34 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları • Veri tabanları ve Web’ler • Birçok şirket mevcut müşteri ya da ortakları için bazı içsel veri tabanlarını oluşturabilmek için Web’i kullanırlar. • Tipik yapılandırma içerikleri: • Web sunucusu • Uygulama sunucusu/katman/CGI betikleri • Veri tabanı sunucusu (hosting DBM) • Veri tabanı erişimi için Web kullanılmasının avantajları: 6.35 • Tarayıcı yazılımının kullanım kolaylığı • Web ara yüzü veri tabanında çok az değişiklik gerektirir yada hiç değişiklik gerektirmez, • Sisteme ara yüz eklemek pahalı değildir. © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi İş performansını ve karar vermeyi geliştirmede kullanılan veri tabanları Linking Internal Databases to the Web Users access an organization’s internal database through the Web using their desktop PCs and Web browser software. Figure 6-16 6.36 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Veri Kaynaklarının Yönetimi • Bilgilendirme politikasının oluşturulması • Firma kuralları, prosedürleri, paylaşılan, yönetilen, standartlaştırılan veri için roller. Örn. Çalışanların hassas çalışan bilgilerini güncellemesi için sorumluluğu nedir ? • Veri Yönetimi: Veri yönetiminde prosedür ve özel politikalar için firma fonksiyonu sorumluluğu • Veri yönetimi: özellikle hükümet düzenlemeleriyle ilgili olarak girişimci verilerin elde edilebilirliği, kullanımı, entegrasyonu ve güvenliği için politikalar ve işlemler, • Veri tabanı yönetimi : Veri tabanının Tanımlama, organize etme, uygulama, muhafaza edilmesi; Veri tabanı dizaynı ve yönetim grupları tarafından performans gösterilmesi 6.37 © 2010 by Prentice Hall Bölüm 6: İş Zekasının Temelleri: Veri Tabanları ve Enformasyon Yönetimi Veri kaynaklarının yönetimi • Veri kalitesinin sağlanması • Fortune dergisinde yer alan 1000 şirketin % 25’ten fazlasının veri tabanları oluşturulmamış ya da tamamlanmamıştır. • En çok veri tabanı problemleri yanlış girişten kaynaklanmaktadır. 6.38 © 2010 by Prentice Hall