T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ASENKRON MOTORLARDA VERİ MADENCİLİĞİ İLE HATA TESPİTİ Kıyas KAYAALP Danışman: Yrd. Doç. Dr. Hakan ÇALIŞ YÜKSEK LİSANS TEZİ ELEKTRONİK BİLGİSAYAR EĞİTİMİ ANABİLİMDALI ISPARTA – 2007 Fen Bilimleri Enstitüsü Müdürlüğüne Bu çalışma jürimiz tarafından Elektronik Bilgisayar Eğitimi ANABİLİM DALI'nda oybirliği ile YÜKSEK LİSANS TEZİ olarak kabul edilmiştir. Başkan : Yrd. Doç. Dr. Abdülkadir ÇAKIR (İmza) SDÜ Tek. Eği. Fak. Elektronik Bilgisayar Eğitimi Üye : Yrd. Doç. Dr. Oğuz ÇOLAK (İmza) SDÜ Tek. Eği. Fak. Makine Eğitimi Üye : Yrd. Doç. Dr. Hakan ÇALIŞ (İmza) SDÜ Tek. Eği. Fak. Elektronik Bilgisayar Eğitimi ONAY Bu tez .../.../20.. tarihinde yapılan tez savunma sınavı sonucunda, yukarıdaki jüri üyeleri tarafından kabul edilmiştir. ..../...../20... Prof. Dr. Fatma GÖKTEPE Enstitü Müdürü İÇİNDEKİLER Sayfa İÇİNDEKİLER………………………………………………………………………..i ÖZET………………………………………………………………………………...iii ABSTRACT…………………………………..……………………………………..iv TEŞEKKÜR………………………………………………………………………..…v ŞEKİLLER DİZİNİ………………………………………………………………….vi ÇİZELGELER DİZİNİ……………………………………………………………..viii SİMGELER VE KISALTMALAR DİZİNİ…………………………………………ix 1. GİRİŞ………………………………………………………………………………1 1.1. Veri Madenciliğine Genel Bir Bakış……………………………………………..1 1.2. Veri Madenciliği Teknikleri……………………………………………………..2 1.3. Karar Ağaçları………………………………………..…………………………..2 1.4. Tez Hakkında…………………………………………………………………….3 2. KAYNAK ÖZETLERİ…………………………………………………………….7 3. MATERYAL VE YÖNTEM……………………………………………………..11 3.1. Materyal………………………………………..……………………………….11 3.2. Veri Madenciliği………………………………………………………………..12 3.2.1. Veri Madenciliğine Genel Bir Bakış………………………………………….12 3.2.2. Veri Madenciliğinin Gelişimini Etkileyen Faktörler…………………………13 3.2.3. Veri Madenciliğinin Kullanım Amacı………………………………………..14 3.2.4. Veri Madenciliği Uygulamaları Ve Kullanım Alanları………………………15 3.2.5. Veri Madenciliği Uygulamalarında Karşılaşılan Problemler………………...18 3.2.6. Veri Madenciliği Teknikleri………………………………………………….20 3.2.6.1. Sınıflama …………………………………………………………………...20 3.2.6.2. Kümeleme…………………………………………………………………..23 3.2.6.3. Birliktelik Kuralları ve Ardışık Örüntüler………………………………….24 3.2.6.4. Tezde Kullanılan Veri Madenciliği Tekniği………………………………..24 3.2.7. Veri Madenciliği Yazılımları…………………………………………………27 3.3.Veri Madenciliği Süreci…………………………………………………………29 3.3.1. Problemin Tanımlanması……………………………………………………..30 3.3.2. Verilerin Hazırlanması (Veri Önişleme) ……………………………………..30 i 3.3.3. Modelin Kurulması ve Değerlendirilmesi……………………………………32 3.3.4. Modelin Kullanılması………………………………………………….……..34 3.3.5. Modelin İzlenmesi……………………………………………………………34 3.4. Yöntem………………………………………………………………………….34 3.4.1. Problemin Tanımlanması……………………………………………………..34 3.4.2. Kullanılan Yazılım……………………………………………………………35 3.4.3. Uygulamada Veri Madenciliği Süreci………………………………………..39 3.4.4. Veri Hazırlama………………………………………………………………..40 3.4.5. Modelleme……………………………………………………………………43 4. ARAŞTIRMA BULGULARI VE TARTIŞMA………………………………….45 4.1. Frekans Spektrum Analizi………………………………………………………45 4.2. Veri Madenciliği ile Hata Analizi ……………………………………………...57 5. SONUÇ…………………………………………………………………………...77 6. KAYNAKLAR…………………………………………………………………...80 EK-1…………………………………………………………………………………84 ÖZGEÇMİŞ…………………………………………………………………………86 ii ÖZET Yüksek Lisans Tezi ASENKRON MOTORLARDA VERİ MADENCİLİĞİ İLE HATA TESPİTİ Kıyas KAYAALP Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Elektronik Bilgisayar Eğitimi Anabilim Dalı Jüri: Yrd. Doç. Dr. Abdülkadir ÇAKIR Yrd. Doç. Dr. Hakan ÇALIŞ (Danışman) Yrd. Doç. Dr. Oğuz ÇOLAK Asenkron motorlar endüstride en yaygın kullanılan motor tipidir. Asenkron motorlarda oluşan hataların erken safhada tespit edilmesi maliyet açısından önemli bir kazanç sağlamaktadır. Bu tezde veri madenciliği tekniği ile üç fazlı asenkron motordaki sargı spirleri arasında oluşabilecek kısa devre veya yalıtım bozuklukları ve motor milinde oluşabilecek mekanik dengesizlik hatalarının tespiti amaçlanmıştır. Veri madenciliği büyük miktarlardaki verinin içinden anlamlı ve yararlı, ilişki ve kuralların bilgisayar programları aracılığıyla aranması ve analizidir. Bu amaçla WEKA veri madenciliği yazılımı kullanılmıştır. WEKA’ya 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerleri giriş parametresi olarak verilmiştir. Bu giriş parametrelerine WEKA’da sınıflandırma tekniklerinden karar ağacı algoritmaları uygulanmıştır. Uygulama sonucunda RepTree karar ağacının ürettiği kuralların geçerliliği ispatlanmıştır. Elde edilen bu kurallara göre asenkron motorlarda yukarıda adı geçen hataların bulunması için tek faz akımı yeterli olmaktadır. ANAHTAR KELİMELER: Asenkron motor, veri madenciliği, hata tespiti, karar ağaçları. 2007, 85 sayfa iii ABSTRACT M.Sc. Thesis FAULT DETECTION IN INDUCTION MOTORS USING DATA MINING Kıyas KAYAALP Süleyman Demirel University Graduate School of Applied and Natural Sciences Department of Electronics Computer Education Thesis Committee: Asst. Prof. Abdülkadir ÇAKIR Asst. Prof. Hakan ÇALIŞ (Supervisor) Asst. Prof. Oğuz ÇOLAK Induction motors are the most common motor types used in industry. The detection of the induction motors in early stage provides an important outcome in terms of cost. In this thesis, detection of the short circuit or insulating faults in the turns of the stator winding and mechanical unbalances in the three phase induction motors are aimed by using data mining technique. Data mining is the analyzing and searching of the rules and obtaining of the useful and meaningful relationships in a great quantity of data by the help of computer programs. For this purpose, data mining software known as WEKA is used in this work. Three phase currents, voltages, and filtered side bands of the motor current signals around fundamental supply frequency are applied as input parameters for WEKA program. Decision tree algorithms from classification techniques in WEKA have been applied to these input parameters. In the test results, the effectiveness of the rules produced by RepTree decision tree algorithms is proved. According to those acquired rules, a single phase current signal is adequate for the detection of above mentioned faults in induction motors. Key Words: Induction motor, data mining, fault detection, decision trees. 2007, 85 pages iv TEŞEKKÜR Bu çalışmanın gerçekleşmesinde katkılarından dolayı, aşağıda adı geçen kişilere içtenlikle teşekkür ederim. Bu çalışmanın ana fikrinin oluşmasında, tez çalışmasının gerçekleşmesi için gerekli ortamın hazırlanmasında, çalışmanın sonuca ulaştırılmasında ve karşılaşılan güçlüklerin aşılmasında tez danışmanım, çok kıymetli hocam Sayın Yrd. Doç. Dr. Hakan ÇALIŞ yön gösterici olmuştur. Sayın Öğr. Gör. Ecir Uğur KÜÇÜKSİLLE (Süleyman Demirel Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü) Veri Madenciliği çalışmalarında ve Sayın Arş. Gör. Yusuf Erkan GÖRGÜLÜ (Süleyman Demirel Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü) tezin anlatım dilinin düzeltilmesinde yardımcı olmuşlardır. Tezde kullanılan veriler için Artesis Teknoloji Sistemleri A.Ş. firması yetkililerine ayrıca teşekkürlerimi sunarım. Her zaman yanımda olan çok değerli aileme, verdikleri destek, gösterdikleri sabır ve anlayış için şükranlarımı sunuyorum. Kıyas KAYAALP ISPARTA, 2007 v ŞEKİLLER DİZİNİ Şekil 3.1. Futbol örneği için oluşan karar ağacı……………………………………..26 Şekil 3.2. WEKA programının genel kullanıcı arayüzü…………………………….36 Şekil 3.3. WEKA programının ön işleme panelinin ekran görünümü………………37 Şekil 3.4. WEKA programının sınıflandırma panelinin ekran görünümü………..…38 Şekil 3.5. Asenkron motorlarda hata tespiti için veri madenciliği süreci…………...39 Şekil 3.6. Band Geçiren Filtrelenmiş üç faz akım spektrumlarının 0-100 Hz aralığı………………………………………………………………………..41 Şekil 3.7. Normal motor için 1. faz akımının zaman-genlik grafiği………………...42 Şekil 3.8. Normal motor için 1. faz akımının RMS değişim grafiği………………...42 Şekil 4.1. Normal, kısa devre ve mekanik dengesizliği bulunan motorların 1., 2. ve 3. faz akımlarının zaman-genlik grafikleri a) 10 periyot b) 2 periyot…..46 Şekil 4.2. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator akımlarının genlik-frekans spektrumları….…………………..……………..47 Şekil 4.3. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator akımlarının frekans-genlik spektrumlarının 0-100 Hz aralığı….…………....47 Şekil 4.4. Sağ Band için band geçiren filtrenin kutup 0 diyagramı…………………49 Şekil 4.5. Sağ Band için Band Geçiren Filtrenin frekans cevabı……………………50 Şekil 4.6. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz akımının zaman-genlik grafiği………....…………………………..…50 Şekil 4.7. Normal, kısa devre, mekanik dengesizlik durumları için 2. faz akımının filtrelenmiş durumlarının zaman-genlik grafiği……………………………..51 Şekil 4.8. Normal, kısa devre, mekanik dengesizlik durumları için 3. faz akımının filtrelenmiş durumlarının zaman-genlik grafiği……………………………..51 Şekil 4.9. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-1000 Hz aralığı………………………………………….…..52 Şekil 4.10. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-100 Hz aralığı…….……..…………………………………..52 Şekil 4.11. Sol Band için band geçiren filtrenin kutup 0 diyagramı………………...53 Şekil 4.12. Sol Band için Band Geçiren filtrenin frekans cevabı…………………...54 vi Şekil 4.13. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz akımının zaman-genlik grafiği…………………..……………………54 Şekil 4.14. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 2. faz akımının zaman-genlik grafiği………………………………………..55 Şekil 4.15. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 3. faz akımının zaman-genlik grafiği………………………………………..55 Şekil 4.16. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-1000 Hz aralığı ……………………………………………..56 Şekil 4.17. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-100 Hz aralığı……………..………………………………...56 Şekil 4.18. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli …..………………………………………65 Şekil 4.19. 3 faz akım verilerine göre RepTree karar ağacı algoritması sonucunun ekran görüntüsü…..……………………………………………..66 Şekil 4.20. 3 faz akım verilerine göre M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli…..……………………………………….68 Şekil 4.21. 3 faz akım verilerine göre M5P-M4.0 karar ağacı algoritması sonucunun ekran görüntüsü…..……………………..………………………69 Şekil 4.22. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (1800 veri) …..……………………….…72 Şekil 4.23. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (900 veri) …..…………………………...72 Şekil 4.24. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (450 veri) …..…………………………...73 Şekil 4.25. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (225 veri) …..…………………………...73 Şekil 4.26. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (150 veri) …..…………………………...75 Şekil 4.27. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (75 veri) …..…………………………….76 vii ÇİZELGELER DİZİNİ Çizelge 3.1. Veri madenciliği uygulama alanları………………………....................18 Çizelge 3.2. Futbol örneği için hedef olmayan nitelikler…………............................25 Çizelge 3.3. Futbol örneği için öğrenme verisi…………...........................................26 Çizelge 3.4. Veri Madenciliğinde kullanılan bazı yazılımlar ve özellikleri………...27 Çizelge 3.5. Verilerin alındığı 3 faz sincap kafes asenkron motorun özellikleri……35 Çizelge 4.1. 3 faz akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri….59 Çizelge 4.2. 3 faz akım ve gerilim verilerine göre karar ağaçlarının ürettiği sonuç değerleri……………………………………………………………………..60 Çizelge 4.3. 3 faz akım ve sol band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri………………..….61 Çizelge 4.4. 3 faz akım ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri…………………...62 Çizelge 4.5. 3 faz akım, sol ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri…………………...63 Çizelge 4.6. 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri...64 Çizelge 4.7. WEKA programına giriş olarak verilen verilerden 3 faz akım RMS verilerinden rastgele seçilmiş örnek değerler…………..................................67 Çizelge 4.8. WEKA programına giriş olarak verilen 3 faz akımdan rastgele seçilmiş 1. faz akımına M5P-M4.0 karar ağacından elde edilen katsayıların uygulanması ve elde edilen sonuçlar…………………………………..……70 Çizelge 4.9. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden sadece 1. faz akımı için rastgele seçilmiş örnek değerler…………….…..…74 viii SİMGELER VE KISALTMALAR DİZİNİ DVM Destek vektör makinesi GP Genetik Programlama RMS Root Mean Square ( Karelerinin ortalamasının karekökü ) VM Veri madenciliği WEKA Waikato Environment for Knowledge Analysis YSA Yapay sinir ağları ZSVM Zaman serileri veri madenciliği ix 1. GİRİŞ Asenkron motorlar değişik endüstriyel uygulamalarda yaygın olarak kullanılmaktadır. Bu motorlar sağlam yapıda olmalarına rağmen elverişsiz ortamlara maruz kalmalarından dolayı hataları oluşmaktadır. Başlangıç seviyesindeki hatalar erken bir safhada tespit edilemezse, hem kendisi hem de sistem çalışması zarar görebilir, üretim kayıplarına neden olabilir. Son yirmi yılda çalışılan en önemli alan motorun performans karakteristikleri ve asenkron motor hatalarının tespiti ve analizi olmuştur. Doğru ve güvenilir hata tespit yönteminin uygulanması, iyi bir motor performansı için motor hatalarının etki ve sebeplerinin iyi anlaşılması gerekir. Asenkron motorlarda hata tespiti için değişik yöntemler kullanılmaktadır. Parametre tahmini ve diğer model tabanlı teknikler sistemin matematiksel modeline dayandığından, motor belli bir süre sonra aşındığından bu modeller motorun durumunu tam olarak ifade etmeyebilir. Hata tespiti için kullanılan diğer bir yöntem ise makine veya motorun bir eleman tarafından sürekli gözlemlenmesidir. Burada sistemin matematiksel modeli bilinmeden gözlem yoluyla hata tespiti yapılabilir. Fakat böyle bir yöntem hem zaman alıcı hem de pahalıdır. Akıllı bir hata tespiti için yumuşak hesaplama ve işaret işleme tabanlı yöntemlerde literatürde yoğun olarak kullanılmaya başlanmıştır. Tezde asenkron motorlarda hata tespiti için literatürdeki tekniklerden farklı olarak yeni bir alan olan Veri Madenciliği (VM) tekniği kullanılmıştır. Önerilen teknik ile üç fazlı bir asenkron motordaki sargı spirleri arasında oluşabilecek kısa devre veya yalıtım bozuklukları ve motor milinde oluşabilecek mekanik dengesizlik hatalarının tespiti amaçlanmıştır. 1.5. Veri Madenciliğine Genel Bir Bakış VM; verideki eğilimleri, ilişkileri ve profilleri belirlemek için veriyi sınıflandıran bir analitik araç olup bu amaçla bilgisayar yazılımları geliştirilmiştir. VM yazılımları; kümeleme, doğrusal regresyon, sinir ağları, Bayes ağları, görselleştirme ve ağaç 1 tabanlı modeller gibi birçok tekniği içerir. VM uygulamaların da önceleri sadece istatistiksel yöntemler kullanılmıştır. Bununla birlikte, bugünün VM teknolojisinde veri kümelerindeki eğilim ve ilişkileri kısa zamanda saptayabilmek için yüksek hızlı bilgisayarlar kullanılmaktadır. Böylece VM, gizli eğilimleri minimum çaba ile çok kısa bir sürede kolayca ortaya çıkarmaktadır. 1.6. Veri Madenciliği Teknikleri VM teknikleri işlevlerine göre 3 temel grupta toplanır: • Sınıflama, • Kümeleme, • Birliktelik kuralları ve sıralı örüntüler. Sınıflama, verinin önceden belirlenen çıktılara uygun olarak ayrıştırılmasını sağlayan bir tekniktir. Çıktılar, önceden bilindiği için sınıflama, veri kümesini denetimli olarak öğrenir. Kümeleme, verideki benzer kayıtların gruplandırılmasını sağlayan bir tekniktir. Birliktelik analizi, bir veri kümesindeki kayıtlar arasındaki bağlantıları arayan denetimsiz VM tekniğidir. Birliktelik analizi çoğu zaman perakende sektöründe süpermarket müşterilerinin satın alma davranışlarını ortaya koymak için kullanıldığından “pazar sepeti analizi” olarak da adlandırılır. Bu tezde VM uygulamasında, denetimli bir sınıflandırma tekniği olan karar ağaçları kullanılmıştır. 1.7. Karar Ağaçları Temel sınıflandırma tekniklerinden biri olan karar ağaçları; verileri belli nitelik değerlerine göre sınıflandırmaya yarar. Bunun için algoritmaya girdi olarak verilerin 2 belirlenen belli nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir. Algoritma bu çıktı niteliğindeki değerlere ulaşmak için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapılarını kullanarak keşfeder. 1.8. Tez Hakkında Hata tespit sistemlerinde; gözlem ile tespit, matematiksel modeller ve yapay zekâ tekniklerinin birlikte yer aldığı yöntemler kullanılır. Matematiksel modeller motor hakkında çok fazla bilgi gerektirdiklerinden hata tespiti için kullanılmaları, hem hesaplama hem de önceden motor hakkında bilgi gerektirir. Asenkron motor hatalarının belirlenmesi için sıcaklık ölçümü, rulman yağ analizi, titreşim analizi ve radyo frekans yayılımı gibi teknikler kullanılır. Asenkron motorların hatalarının belirlenmesi ve sınıflandırılması geleneksel olarak sağlıklı ve hatalı sinyal spektrumlarının karşılaştırılması ile yapılabilir. Bu teknikler sıcaklık, hız ve titreşim gibi parametrelerin ölçümüne ihtiyaç duyar. Fakat bunların ölçülmesi ekstra algılayıcılar, düzenekler ve motora erişim için kablolar gibi maliyeti artırıcı unsurlar gerektirir. İlave algılayıcı kullanmaksızın sistemde mevcut olan akım dönüştürücüleri ile motor akımından hata tespitine dayalı durum izleme daha fazla ilgi çekmektedir. Akım sinyalleri kullanılarak sağlam ve hatalı motor durumlarının birbirinden ayırt edilebilmesi için veride mevcut olan farklı özelliklerin çıkarılması gerekir. Tezde, sağlam durum için, sargı spirleri arasında kısa devre hatası ve motor milinde mekanik dengesizlik hatası olan 3 durum için üç faz motor akım ve üç faz şebeke gerilim bilgileri kullanılmıştır. Veriler ilk önce klasik bir yöntem olan frekans spektrum analizinde değerlendirilmiştir. Frekans spektrum analizi filtreli ve filtresiz iki ayrı durum için yeni oluşan yan band ve harmoniklerin tespiti için kullanılmıştır. Motor milindeki mekanik dengesizlik hatası akım spektrumlarında şebeke frekansının etrafında yan bandlar oluşturur. Bu bandlardaki genlik değişiminin algılanması ile hata tespiti yapılabilir. İşlememiş ham üç faz akım ve üç faz gerilim verileri ile band geçiren 3 filtre çıkışındaki verilerin etkin değerleri (RMS) hesaplanmıştır. Hesaplanan RMS değerleri VM yazılımının giriş parametrelerini oluşturmuştur. Farklı algoritmalara sahip ve farklı işletim sistemlerinde çalışan birçok VM yazılımı bulunmaktadır. Tezde WEKA VM yazılımı kullanılmıştır. WEKA (Waikato Environment for Knowledge Analysis), Yeni Zelanda Waikato Üniversitesi’nde geliştirilen bir VM ve makine öğrenmesi yazılımıdır. WEKA programında kullanılacak verilerin bulunduğu dosyaların uzantıları .arrf olması gerekmektedir. Bunun için veri dosyalarının uzantıları Cahit Arif Wizard isimli program ile .arff’a dönüştürülmüştür (http://cahitarf.sourceforge.net/). WEKA programına girdi olarak 6 farklı veri paketi kullanılmıştır. Bunlar; • 3 faz motor akım değerleri, • 3 faz motor akım ve gerilim değerleri, • 3 faz motor akım ve sol band için band geçiren filtre uygulanmış motor akım değerleri, • 3 faz motor akım ve sağ band için band geçiren filtre uygulanmış motor akım değerleri, • 3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış motor akım değerleri, • 3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış motor akım değerleri. WEKA programı birçok VM algoritmasına sahiptir. Tezde, denetimli sınıflandırma biçimi olarak karar ağaçları algoritmaları kullanılmıştır. Karar ağaçları girdi olarak verilerin belirlenen belli niteliklerini, çıktı olarak da verilerin belli bir niteliğini kullanır. Algoritma bu çıktı niteliğindeki değerlere ulaşmak için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapılarını kullanarak keşfeder. Yukarıda ki şekliyle 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım verileri girdi değerlerini oluşturmaktadır. Aynı şekilde sağlam, sargı spirleri 4 arasında kısa devre hatası olan ve milinde mekanik dengesizlik hatası bulunan motor durum bilgileri de çıktı değerlerini oluşturmaktadır. Verilere Rules, Trees, Meta, Lazy, Functions gruplarının alt modüllerinden toplam 18 tane karar ağacı algoritması uygulanmıştır. Uygulanan karar ağaçlarından elde edilen korelâsyon katsayıları ve mutlak hata değerleri tablolar halinde incelerek en iyi çözümü Trees karar ağacının alt algoritmalarından RepTree ve M5P-M4.0 algoritmalarının sağladığı bulunmuştur. Ayrıca WEKA’ya girdi olarak verilen 6 veri paketinden elde edilen sonuçlar incelenmiş olup, sadece 3 faz akım verisinin VM’nde sınıflandırma için en iyi seçici özelliğe sahip olduğu bulunmuştur. Karar ağaçlarının girdi niteliğini oluşturan 2700 satırlık 3 faz akım ve sonuç verilerinden rasgele olarak 15 satırı seçilmiştir. Seçilen bu satırlardaki verilerin RepTree ve M5P-M4.0 algoritmalarının ürettiği kuralları, gerçekleştirip gerçekleştirmedikleri kontrol edilmiştir. RepTree karar ağacı algoritmasının ürettiği kuralların %100 doğruluk derecesine sahip olduğu saptanmıştır. Bu tez, asenkron motorlarda hata tespiti için literatürde çok az kullanılan VM tekniğini sunmaktadır. Bu tezin amacı; VM teknikleri kullanılarak da asenkron motorlarda hata tespitinin yapılabileceğini göstermektir. Çalışma ile elde edilen avantajlar şunlardır; • Sadece 3 faz akım verileri ile asenkron motorlarda sargı spirleri arası kısa devre ve motor milindeki mekanik dengesizlik hataları bulunabilmektedir. • Literatürde çok az kullanılmış olan VM ile motor hata tespitinin yapılabildiğidir. • Motora ait ön bilgi, matematiksel modelleme gibi karmaşık hesaplama gerektiren işlemler gerektirmez. Ayrıca hata sınıflandırmasında kullanılmak üzere belli bir eşik değeri tespit edilmesini sağlamıştır. 5 Tezin ilk bölümünde tez çalışmasının amacı, kullanılan yöntem, elde edilen sonuçlar ve katkılar ifade edilmiştir. İkinci bölümünde ise, asenkron motor hatalarının, hangi yöntemler kullanılarak bulunduğundan bahsedilmiştir. Üçüncü bölümde tezde kullanılan VM yönteminin tanımı, kullanım alanları, VM teknikleri, karar ağacı algoritmaları, verilerin elde edilmesi, verilerin hazırlanması, kullanılan VM yazılımı ve tezde kullanılan VM süreci ifade edilmiştir. Dördüncü bölümde, verilerin frekans spektrum analizi ve VM yöntemleri ile incelenmiştir. Beşinci bölümde ise, elde edilen sonuçların asenkron motor hatalarının bulunmasında yeni bir yaklaşım olabileceği söylenmiştir. 6 2. KAYNAK ÖZETLERİ Asenkron motorlar değişik endüstriyel uygulamalarda yaygın olarak kullanılmaktadırlar. Değişen çalışma ortamları ve dinamik yükler motorlarda hatalara sebep olurlar. Bu nedenle sistemlerin ani duraklamalarının önlenmesi hem maliyet, hem güvenirlik için önemlidir. Asenkron motorlarda hataların oluşmadan önce belirlenmesi için uzun yıllardır birçok çalışma yapılmış ve günümüzde de yapılmaya devam etmektedir. Gao vd. (2001), son yıllarda birçok alanda uygulanmaya başlanan ve yeni bir teknik olan yumuşak hesaplama tekniği hakkında bilgi vermişlerdir. Gao vd. çalışmalarında, temel motor hata tespit sistemleri ile bulanık mantık, yapay sinir ağları (YSA), genetik algoritmalar kullanılarak yapılan motor hata tespit sistemleri hakkında bilgi vermişlerdir. Yumuşak hesaplama tekniklerinin (bulanık mantık, yapay sinir ağları, genetik algoritmalar, yapay sinir ağları ile bulanık mantığın beraber kullanımı), basitleştirilmiş şekillerle çalışma mantıkları anlatılmış, bu konuda yapılan araştırmaların avantaj ve dezavantajlarından bahsedilmiştir. Hata tespitinde yumuşak hesaplama olarak adlandırılan bu yeni yaklaşımlar, geliştirilmiş çözümler sunmasına rağmen tamamen klasik metotların yerini alamadığını, bahsedilen tekniklerin bir veya birkaçının birlikte kullanılması gerektiğini ifade etmişlerdir. Povinelli vd. (2002), geleneksel frekans düzlemindeki Fourier analizi gerektirmeyen yeni bir yaklaşımla, asenkron motorlardaki hataları belirlemek için bir çalışma yapmışlardır. Bu teknik ile asenkron motorlarda ayarlanabilir hız sürücülü sistemlerde hata tespiti ve tahmini üzerinde çalışmışlardır. Çalışmada 208 volt, 60 Hz, 4 kutuplu, 1.2 Hp’lik, 3 fazlı sincap kafes bir motor kullanılmıştır. Sincap kafes asenkron motorlarda çeşitli rotor çubuk kırıklarını tanımlamak ve ayırt etmek için Zaman Serileri Veri Madenciliği (ZSVM) tekniğini ve Evre Uzayı modelini kullanmışlardır. Evre Uzayından elde edilen zaman düzlemindeki motor dönüş profilleri ve ilk fark faz dönüşümleri ile sağlıklı, 3, 6, 9 adet kırık rotor çubuğunun hata tespitinin nasıl yapıldığı göstermişlerdir. Bu yaklaşım, asenkron motorların 7 ayarlanabilir hız sürücü devrelerine entegre edilerek motorlardaki kırık rotor çubuğu hatalarının tespitinde kullanılabileceğini ifade etmişlerdir. Ayaz vd. (2002), 5 Hp’lik asenkron motorun rulmanlarında yedi aşamada, y a p a y bir hata oluşturarak motor akım, titreşim ve hız verilerini toplamışlardır. Motor titreşim işaretlerine dalgacık dönüşümü uygulayarak, frekans bandlarına ayırarak ve rulman hatasını karakterize eden özelliğin 2-4 kHz’lik frekans aralığında yer aldığı saptamışlardır. Ayrıca yapılan istatistiksel analizler sonucunda hata için kritik bir standard sapma değeri belirlenerek rulman hatasının 4. aşamada belirgin hale geldiği görülmüşlerdir. Yapılan yeni bir tanım ile de rulman sağlamlığını yüzde cinsinden bir büyüklükle ifade etmişlerdir. Kowalski vd. (2003), asenkron motorlarda rotor ve stator hatalarının tespiti için yapay sinir ağlarını kullanmışlardır. Bu çalışmada çok katmanlı ve kendi kendini organize eden Kohonen yapay sinir ağları kullanılmıştır. Stator akım ve titreşim sinyal spektrum analiz değerleri yapay sinir ağlarının öğrenme ve test aşamalarında kullanılmıştır. Kohonen YSA başlangıçtaki motor hatalarının sınıflandırılmasında kullanılmıştır. Tek gizli katmanlı ve birkaç nöron içeren basit yapıdaki pratikte ki gerçekleştirilmesi kolay olan YSA ile bahsedilen hatalar tespit edilebilmiştir. Bangura vd. (2003), ZSVM metodu ile ayarlanabilir hız sürücülü asenkron motorlarda statik, dinamik eksantriklik ile rotor hatalarının tespiti ve teşhisini benzetim sonucu elde edilen verileri kullanarak göstermişlerdir. Sonlu elemanlar veya durum uzayı analizi ile yapılan benzetimde elde edilen faz akımları ve tork sinyallerinde hata ile ilgili gizli olan belirteçler ZSVM kullanılarak tespit edilmiştir. %10 ile %30 arasındaki eksantriklik hatası 1, 3, 6 ve 9 kırık çubuk hatası olan 1,2 Hp’lik 4 kutuplu bir asenkron motor üzerinde test edilen algoritma hem hata çeşidini ayırt edebilme hem de hata miktarını sayısallaştırabilmektedir. Bae vd. (2005), 4 kutuplu, 0.5 Hp’lik motor stator akım bilgilerini kullanmışlardır. Akım sinyallerinin analizi için zaman-genlik düzlemi yerine frekans-genlik düzlemindeki analizi kullanmışlardır. Bu çalışmada kırık rotor çubuğu, rulman ve 8 eksantriklik hataları incelenmiştir. Kırık rotor ve eksantriklik hataları dalgacık analizinde aynı sonucu doğurduğundan bunları birbirinden ayırt etmek için Fourier analizi yapılmıştır. Aydın vd. (2005), tek fazlı sincap kafesli asenkron motorların sarım, sürtünme, eksantriklik ve kırık rotor çubuğu hatalarının tespiti için yumuşak hesaplama tabanlı bir teknik üzerinde çalışmışlardır. Sarım ve sürtünme durumlarının sınıflandırılması için ileri beslemeli YSA kullanılmıştır. Eksantriklik ve kırık rotor çubuğu hatalarının bulunması için bulanık mantık kullanılmıştır. Tek fazlı asenkron motorun stator akımı ve rotor hızı kullanılarak YSA’nın girişlerini, stator akımının Fourier dönüşümleri de bulanık mantık modelinin girişlerini oluşturmuştur. Bulanık mantık ile değerlendirilen akım verilerinin spektrum analizi ile elde edilen yan bantlarda ki genlik değişimi, kırık rotor çubuk ve eksantriklik hatalarının tespiti için kullanılmıştır. Nandi vd. (2005), asenkron motorların hatalarının tespitinde genelde termal ölçümler ve kimyasal analizler gibi farklı tekniklerle birlikte, hatanın derecesini ve özelliğini bulmak içinde esas karar merci yine insan olmak şartıyla uzman sistemler, yapay sinir ağları, bulanık mantık tabanlı sistemler kullanıldığından söz etmişlerdir. Bu makalede daha önce yapılan rotor, stator hataları, eksenel kaçıklık hataları ve eksantriklik hatalarının bulunması için yapılan araştırmalar değerlendirilmiştir. Motor akım sinyalinin analizi hata tespitinde en çok tercih edilen bir teknik olduğunu, teorik analiz ve hatalı makinenin modellenmesinin hata belirtecinin kaynağının hatadan mı yoksa harmoniklerden mi kaynaklandığını ayırt edilebilmek için gerekli olduğunu ifade etmişlerdir. Zhang vd. (2005), genetik programlama (GP), otomatik olarak bilgisayar programları tarafından oluşturulan doğrusal olmayan bir süreçtir. Bu çalışmada 2 farklı asenkron motordan alınan sağlam ve hatalı veriler GP ile hataların tespiti için kullanılmıştır. Ayrıca destek vektör makinesi (DVM) olarak adlandırılan yaklaşım istatiksel bir öğrenme algoritmasıdır. DVM ve YSA’da asenkron motorlar da hata belirteçlerini bulmak için kullanılmıştır. Çalışmada kullanılan veriler ile hata sınıflandırılması 9 yapmak için, GP/YSA ve GP/DVM birlikte kullanılmıştır. Buradan elde edilen GP tabanlı hata sınıflandırma oranı %100 olarak elde edilmiştir. GP/YSA ve GP/DVM yaklaşımlarından üretilen sınıflandırma kurallarının kolay anlaşılması gerçek hayattaki uygulamalar için tercih edilebilir. GP ile kullanılan DVM ve YSA kendi başlarına yaptıkları hata tespitlerinden daha iyi sonuçlar ortaya koydukları görülmüştür. Aydın vd. (2005), asenkron motorlarda stator sargı ve eksantriklik hatalarının tespiti için ZSVM’ni kullanmışlardır. Bunun için motor stator akımı ve rotor hızını ZSVM girişi olarak almışlardır. Stator sargı ve eksantrik dönme hataları, akım veya rotor hızının etkin değerinde değişmelere sebep olduğundan kararlı durumdaki zamana ait iki grafiğin çarpımı faz alanı için, giriş olarak alınmıştır. Yaptıkları deneylerde ¼ Hp gücünde tek fazlı sincap kafesli bir asenkron motor kullanmışlardır. Deneyden elde edilen verilerin yarısı eğitim için, diğer yarısı da test için kullanılmıştır. Eğitim ve test verilerinden elde edilen sonuçların faz alanı grafiğinde yarıçap değerlerinde ki değişim ile hata durumunu sınıflandırmışlardır. Ancak hata kaynağının stator sargısındaki hatadan mı veya eksantriklik hatasından mı kaynaklandığını belirtmemişlerdir. ZSVM yaklaşımı ile motor dinamikleri hakkında çok fazla bilgiye sahip olmadan sadece akım ve hız değerleri ile hata tespitinin yapılabileceğini ifade etmişlerdir. Aydın vd. (2006), asenkron motorlarda kırık rotor çubuğu hatalarının tespiti için YSA ve ZSVM içeren 2 ayrı teknik kullanmışlardır. 4 kutuplu ve 0,37 kW’lık 3 fazlı sağlam ve hatalı asenkron motora ait veriler yedi farklı durumda alınmıştır. Birinci yöntemde akımdan özellik çıkarmak amacıyla motor akım sinyal analizi ve bu özelliklere göre hata durumlarını sınıflandırmak amacıyla YSA kullanılmıştır. İkinci yöntemde kırık rotor çubuğu hatalarını belirlemek için ZSVM yöntemini kullanmışlardır. Her iki yöntemin de en önemli avantajı hata tespiti için sadece akım bilgisinin yeterli olduğunu ifade etmişlerdir. 10 3. MATERYAL VE YÖNTEM 3.1. Materyal Üretimin sürekli yapıldığı endüstriyel tesislerde, uygulanan bakım türleri büyük önem taşır. Üretimin aksamasına tahammülü olmayan bazı tesisler, ani hatalarla karşılaşmamak, beklenmeyen üretim kayıplarını engellemek, bakım ve onarımı planlanabilir hale getirmeye çalışırlar. Yenilikçi bakım sistemleri, klasik bakım ve önleyici bakım sistemlerinde olmayan birçok avantajı da beraberinde getirir. Bu yöntemleri kullanan endüstri tesisleri makine hata oranlarında ortalama %55, bakım maliyetlerinde ise %50’leri aşan bir düşüş gözlemlemişlerdir. Makine ömrü %20 ile %40 arasında artmıştır. Bununla beraber verimlilikte %30, karda ise %60’lara varan bir artış kaydedilmiştir (Çeştepe ve Eren, 2005). Asenkron motorlar endüstrinin beygir gücü olduğu için, bunların hatalarının önceden tespiti hayati önem taşımaktadır. Bu yüzden asenkron motorlarda hataların önceden tespiti için birçok yöntem geliştirilmiş ve yeni yöntemler hala araştırılmaktadır. Bu yöntemlerden bazıları şunlardır; Bulanık Mantık, Yapay Sinir Ağları, Genetik Algoritmalar, Zaman Serileri Veri Madenciliği, vb.’dir. Bunların haricinde sadece Veri Madenciliği ile yapılmış asenkron motorlarda hata tespit sistemleri yok denecek kadar azdır. Bu tez için veriler Artesis Teknoloji Sistemleri A.Ş. firmasından alınmıştır. Veriler aynı motordan 3 durum için alınmıştır. Normal (Sağlam), sargı spirleri arasında kısa devre ve motor milindeki mekanik dengesizlik durumları için üç faz akım ve gerilim değerleridir. Verilerin Veri Madenciliği programında (tezde WEKA programı kullanılmıştır) kullanılabilmesi için bazı ön işlemlerden geçirilmiştir. Bu işlemlerden sonra elde edilen yeni veriler WEKA programında farklı sınıflandırma algoritmalarına uygulanmıştır. Elde edilen değerler karşılaştırılarak en uygun çözüm bulunmuştur. 11 3.2. Veri Madenciliği 3.2.1. Veri Madenciliğine Genel Bir Bakış Bilgisayar sistemleri her geçen gün hem daha ucuzluyor, hem de güçleri artıyor. İşlemciler gittikçe hızlanıyor, disklerin kapasiteleri artıyor. Artık bilgisayarlar daha büyük miktardaki veriyi saklayabiliyor ve daha kısa sürede işleyebiliyor. Bunun yanında bilgisayar ağlarındaki ilerleme ile bu veriye başka bilgisayarlardan da hızla ulaşabilmek mümkün olabilmektedir. Bilgisayarların ucuzlaması ile sayısal teknoloji daha yaygın olarak kullanılıyor. Veri doğrudan sayısal olarak toplanıyor ve saklanıyor. Bunun sonucu olarak da ayrıntılı ve doğru bilgiye ulaşabiliniyor (Alpaydın, 2000). Örneğin eskiden süper marketteki kasa basit bir toplama makinesinden ibaretti. Müşterinin o anda satın almış olduğu malların toplamını hesaplamak için kullanılırdı. Günümüzde ise kasa yerine kullanılan satış noktası terminalleri sayesinde bu hareketin bütün detayları saklanabiliyor. Saklanan bu binlerce malın ve binlerce müşterinin hareket bilgileri sayesinde her malın zaman içindeki hareketlerine ve eğer müşteriler bir müşteri numarası ile kodlanmışsa bir müşterinin zaman içindeki verilerine ulaşmak ve analiz etmek mümkün olabilmektedir. Bütün bunlar marketlerde kullanılan barkot, bilgisayar destekli veri toplama ve işleme cihazları sayesinde mümkün olmaktadır (Aydoğan, 2003). Verilen market örneğinde olduğu gibi ticari, tıp, askeri, iletişim, vb. birçok alanda benzer teknolojilerin kullanılması ile veri hacminin yaklaşık olarak her yirmi ayda iki katına çıktığı tahmin edilmektedir (Frawley vd., 1991). Veri hacminin hangi boyutlara ulaşabileceği ve bunların işlenmesinin ne kadar güç olduğu kolayca anlaşılabilmektedir. Süper market örneği incelendiğinde, veri analizi yaparak her mal için bir sonraki ayın satış tahminleri çıkarılabilir; müşteriler satın aldıkları mallara bağlı olarak gruplanabilir; yeni bir ürün için potansiyel müşteriler belirlenebilir; müşterilerin zaman içindeki 12 hareketleri incelenerek onların davranışları ile ilgili tahminler yapılabilir. Binlerce malın ve müşterinin olabileceği düşünülürse bu analizin gözle ve elle yapılamayacağı, otomatik olarak yapılmasının gerektiği ortaya çıkar. Veri madenciliği burada devreye girer; veri madenciliği büyük miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak bağıntı ve kuralların aranmasıdır (Aydoğan, 2003). Yani, veri madenciliği, büyük miktarlardaki verinin içinden geleceğin tahmin edilmesinde yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların bilgisayar programlarının aracılığıyla aranması ve analizidir. Ayrıca Veri Madenciliği, çok büyük miktardaki verilerin içindeki ilişkileri inceleyerek aralarındaki bağlantıyı bulmaya yardımcı olan veri analizi tekniğidir (Akpınar, 2000). Bir başka deyişle, veri madenciliği; verideki eğilimleri, ilişkileri ve profilleri belirlemek için veriyi sınıflandıran bir analitik araç ve bilgisayar yazılım paketidir. Spesifik veri madenciliği yazılımları; kümeleme, doğrusal regresyon, sinir ağları, Bayes ağları, görselleştirme ve ağaç tabanlı modeller gibi pek çok modeli içerir. Veri madenciliği uygulamalarında yıllar boyu istatistiksel yöntemler kullanılmıştır. Bununla birlikte, bugünün veri madenciliği teknolojisinde eski yöntemlerin tersine büyük veri kümelerindeki trend ve ilişkileri kısa zamanda saptayabilmek için yüksek hızlı bilgisayarlar kullanılmaktadır. Böylece veri madenciliği, gizli trendleri minimum çaba ve emekle ortaya çıkarmaktadır (Akbulut, 2006). 3.2.2. Veri Madenciliğinin Gelişimini Etkileyen Faktörler Temel olarak veri madenciliğini 5 ana faktör etkiler (Akpınar, 2000): 1. Veri: Veri madenciliğinin bu kadar gelişmesindeki en önemli faktördür. Son yirmi yılda sayısal verinin hızla artması, veri madenciliğindeki gelişmeleri hızlandırmıştır. Bu kadar fazla veriye bilgisayar ağları üzerinden erişilmektedir. Diğer taraftan bu verilerle uğraşan bilim adamları, mühendisler ve istatistikçilerin sayısı hala aynıdır. O yüzden, verileri analiz etme yöntemleri ve teknikleri geliştirilmektedir. 13 2. Donanım: Veri madenciliği, sayısal ve istatistiksel olarak büyük veri kümeleri üzerinde yoğun işlemler yapmayı gerektirir. Gelişen bellek ve işlem hızı kapasitesi sayesinde, birkaç yıl önce madencilik yapılamayan veriler üzerinde çalışmayı mümkün hale getirmiştir. 3. Bilgisayar ağları: Yeni nesil İnternet, çok yüksek hızları kullanmamızı sağlamaktadır. Böyle bir bilgisayar ağı ortamı oluştuktan sonra, dağıtık verileri analiz etmek ve farklı algoritmaları kullanmak mümkün olacaktır. Bundan 10 yıl önceki bilgisayar ağları teknolojisinde hayal edilemeyenler artık kullanılabiliyor. Buna bağlı olarak, veri madenciliğine uygun ağların tasarımı da yapılmaktadır. 4. Bilimsel hesaplamalar: Günümüz bilim adamları ve mühendisleri, simülasyonu, bilimin üçüncü yolu olarak görmekteler. Veri madenciliği ve bilgi keşfi, teori, deney ve simülasyonu birbirine bağlamada önemli bir rol almaktadır. 5. Ticari eğilimler: Günümüzde, işletmeler rekabet ortamında varlıklarını koruyabilmek için daha hızlı hareket etmeli, daha yüksek kalitede hizmet sunmalı, bütün bunları yaparken de minimum maliyeti ve en az insan gücünü göz önünde bulundurmalıdır. Bu tip hedef ve kısıtların yer aldığı iş dünyasında veri madenciliği, temel teknolojilerden biri haline gelmiştir. Çünkü veri madenciliği sayesinde müşterilerin ve müşteri faaliyetlerinin yarattığı fırsatlar daha kolay tespit edilebilmekte ve riskler daha açık görülebilmektedir. 3.2.3. Veri Madenciliğinin Kullanım Amacı İşletmeler, geçmişte yaptıkları işlemleri, sakladıkları veriler yardımıyla gözden geçirip analiz etme ve değerlendirme şansına sahiptirler. Bu değerlendirme aşamasında karşılaşılan ilk problem, veri yığınının büyüklüğünün artmasıyla birlikte, işlem yapmanın zorlaşması olmaktadır. Özellikle geçmişe dönük verilerin ve şu anda işlem gören ya da yeni giriş yapılan verilerin aynı ortamda bulunduğu durumlarda ciddi performans problemleri yaşanabilir. Bu konuya çözüm olarak veri ambarları kullanılabilir. Veri ambarlarının işlevlerinden biri, operasyonel veriler ile artık 14 kullanımda olmayan fakat ilerde fayda sağlanılabilecek, geçmişe ait verilerin bulunduğu ortamları ya da bu verileri depolayan yazılımları birbirinden ayırmaktır. Bu işlem hem teknik açıdan performansı arttırmakta, hem de geçmiş verilerin düzenli bir formatta depolanmalarını sağlamaktadır (Nath, 2003). Depolanan bu veriler üzerinde analiz yapılıp işletme açısından faydalı bilgiler ortaya çıkarılması amacına yönelik olarak veri madenciliği uygulamaları kullanılabilmektedir. Veri havuzunu analiz etmenin tek yöntemi veri madenciliği olmamakla birlikte, insan müdahalesine duyulan ihtiyacın en az olduğu ve kendi kendini modifiye edebilme kapasitesine sahip bir analiz şekli istendiğinde veri madenciliği yazılımları ihtiyacı karşılayacaktır (Nath, 2003). Veri madenciliği, analitik bir teknik değil, veri analizine bir yaklaşımdır. Diğer veri analiz yaklaşımlarından farklılıklarından biri, araştırmacının çoğu zaman çok genel bir araştırma sorusu çevresinde, keşfe yönelik bir tarzda işlem yapmasıdır. Veri madenciliğinin bu keşfe yönelik doğası sebebiyle, elimizdeki veri grubu için bir teknik seçerken diğer analiz yaklaşımlarına oranla daha az yol gösterici vardır. Veri madenciliği uygulamasının içerdiği istatistiksel teknikler, çoğunlukla genel kullanıma uygun olarak modifiye edilmiş ve böylece uygulama farklı veri grupları ve birçok değişken tipi üzerinde kullanılabilir hale gelmiştir (Hair vd.,1998). 3.2.4. Veri Madenciliği Uygulamaları ve Kullanım Alanları Veri madenciliğinde araştırma çok farklı disiplinlerin içinde uygulanmaktadır. Veri tabanını yöneten araştırmacılar veri madenciliğinin avantajını sorgu işleminden almaktadır. İlgi çeken alanlardan biri de sorgu işlemini genişletmek ve veri madenciliğini kolaylaştırmaktır. Veri depolama başka bir veri yönetim teknolojisidir ve bu ayrı veri kaynaklarını tamamlamakta, veriyi kolay bir şekilde organize edebilmektedir (Kalıkov, 2006). 15 Veri madenciliğinin asıl amacı, veri yığınlarından anlamlı bilgiler elde etmek ve bunu eyleme dönüştürecek kararlar için kullanmaktır. Örnek birkaç kullanım alanı aşağıdadır: İşletme alanındaki uygulamalar: Müşterilerin rakiplerine gitmelerini önlemek için bir şirket Veri Madenciliğine başvurabilir. Burada Veri Madenciliğinin amacı müşterilerin özelliklerini elde etmek ve rakip şirketlere gidebilecek müşterileri tespit etmek. Sonra da VM sonuçlarından faydalanarak onları kaybetmemek için strateji geliştirilebilir. Ürün ve hizmetlerin tercih edilme sebeplerini ve hangi özelliklerin müşterileri ne kadar etkilediğini belirleme. Banka müşterilerinin kredi durumları ve ödemeleri incelenerek aralarında riskli olan müşterilerin tespit edilmesi ve aynı risk grubuna düşebilecek diğer müşterilerin önceden tahmin edilebilmesi. Eğitim alanındaki uygulamalar: Öğrencileri performanslarına göre branşlara ayırma ve kişi-branş uyumunun arttırılması. Öğrencilerin performans ve memnuniyetlerinin arttırılması. Tıp alanındaki uygulamalar: Bir ilacın hangi yaş grup hastalarında nasıl etki yaratacağı konusunda tahminde bulunabilme. Yeni bulunan kanser tedavi yöntemi için en uygun adayı belirleme. 16 Spor alanındaki uygulamalar: Bir basketbol takımına alınacak oyuncunun gelecekteki performansı ve takıma sağlayacağı yararları tahmin edilebilme. Kütüphanecilik alanındaki uygulamalar: Bir müşterinin aldığı kitabı ne zaman getireceği ve bir sonraki gelişinde hangi kitabı seçeceği konusunda tahminler yapılabilme. Turizm alanındaki uygulamalar: Bir bölgeye turistlerin niçin geldiğini tespit ederek reklâm kampanyası düzenlemek ve bir sonraki sezonda turist sayısını arttırmak. Web alanındaki uygulamalar: Kullanıcıların profilini belirleyip onlara uygun ürünlerin reklâm kampanyalarını sayfalara koyma. Geçmişteki ve şu anki veriler analiz edilerek geleceğe yönelik tahminlerde bulunulabilir. Bu durum özellikle karlılık, ciro, pazar payı, hava durumu gibi analizlerde çok rahat kullanılabilir. Çizelge 3.1.’de 2003 yılında veri madenciliğinin sektörler bazında kullanımına ilişkin bir araştırmanın sonuçları yer almaktadır. Bu çizelgede araştırmaya katılan toplam 421 şirketin 51 adedinin bankacılık alanında veri madenciliğini kullandığı görülmektedir (Akbulut, 2006). 17 Çizelge 3.1. Veri madenciliği uygulama alanları 3.2.5. Veri Madenciliği Uygulamalarında Karşılaşılan Problemler VM büyük hacimli gerçek dünya verileriyle uğraştığı için, bu büyük hacimli veriler VM’de büyük sorunlar oluşturur. Bundan dolayı mesela küçük veri setleriyle ve yapay hazırlanmış verilerle doğru çalışan sistemler büyük hacimli, eksik, gürültülü, NULL değerli, artık, dinamik verilerle yanlış çalışabilir. Bundan dolayı bu sorunların aşılması gerekmektedir. 18 Veri madenciliği girdi olarak kullanılacak ham veriyi veritabanlarından alır. Bu da veritabanlarının dinamik, eksiksiz, geniş ve net veri içermemesi durumunda sorunlar doğurur (Aydoğan, 2003). Diğer sorunlar da verinin konu ile uyumsuzluğundan doğabilir. Sınıflandırmak gerekirse başlıca sorunlar aşağıdaki gibidir: 1. Sınırlı bilgi: Veritabanları genel olarak veri madenciliği dışındaki amaçlar için tasarlanmışlardır. Bu yüzden, öğrenme görevini kolaylaştıracak bazı özellikler bulunmayabilir. 2. Gürültü ve kayıp değerler: Veri girişi veya veri toplanması esnasında oluşan sistem dışı hatalara gürültü denir. Veri toplanması esnasında oluşan hatalara ölçümden kaynaklanan hatalar da dâhil olmaktadır. Bu hataların sonucu olarak VM’de birçok niteliğin değeri yanlış olabilir. 3. Belirsizlik: Yanlışlıkların şiddeti ve verideki gürültünün derecesi ile ilgilidir. Veri tahmini, bir keşif sisteminde önemli bir husustur. 4. Ebat, güncellemeler ve konu dışı sahalar: Veri tabanlarındaki bilgiler, veri eklendikçe ya da silindikçe değişebilir. Veri madenciliği perspektifinden bakıldığında, kuralların hala aynı kalıp kalmadığı ve istikrarlılığı problemi ortaya çıkar. Öğrenme sistemi, kimi verilerin zamanla değişmesine ve keşif sisteminin verinin zamansızlığına karşın zaman duyarlı olmalıdır. 5. Artık veri: Artık veri, problemde istenilen sonucu elde etmek için kullanılan örneklem kümesindeki gereksiz niteliklerdir. Artık nitelikleri elemek için geliştirilmiş algoritmalar, özellik seçimi olarak adlandırılır. Özellik seçimi arama uzayını küçültür ve sınıflama işleminin kalitesini de artırır. 19 3.2.6. Veri Madenciliği Teknikleri Veri madenciliği teknikleri işlevlerine göre 3 temel grupta toplanır (Akbulut, 2006): • Sınıflama, • Kümeleme, • Birliktelik kuralları ve sıralı örüntüler. 3.2.6.1. Sınıflama Sınıflama, verinin önceden belirlenen çıktılara uygun olarak ayrıştırılmasını sağlayan bir tekniktir. Çıktılar, önceden bilindiği için sınıflama, veri kümesini denetimli olarak öğrenir (Akbulut, 2006). Örneğin; A finans hizmetleri şirketi; müşterilerinin yeni bir yatırım fırsatıyla ilgilenip ilgilenmediğini öğrenmek istemektedir. Daha önceden benzer bir ürün satmıştır ve geçmiş veriler hangi müşterilerin önceki teklife cevap verdiğini göstermektedir. Amaç; bu teklife cevap veren müşterilerin özelliklerini belirlemek ve böylece pazarlama ve satış çalışmalarını daha etkin yürütmektir. Müşteri kayıtlarında müşterinin önceki teklife cevap verip vermediğini gösteren “evet”/ “hayır” şeklinde bir alan bulunur. Bu alan “hedef ” ya da “bağımlı” değişken olarak adlandırılır. Amaç, müşterilerin diğer niteliklerinin (gelir düzeyi, iş türü, yaş, medeni durum, kaç yıldır müşteri olduğu, satın aldığı diğer ürün ve yatırım türleri) hedef değişken üzerindeki etkilerini analiz etmektir. Analizde yer alan diğer nitelikler “bağımsız” ya da “tahminci” değişken adını alır. Temel sınıflama algoritmaları aşağıdadır: • Diskriminant analizi, • Naive Bayes, • Karar ağaçları, 20 • Sinir ağları, • Kaba kümeler, • Genetik algoritma, • Regresyon analizi. 1. Diskriminant analizi Diskriminant analizi, bir dizi gözlemi önceden tanımlanmış sınıflara atayan bir tekniktir. Model, ait oldukları sınıf bilinen gözlem kümesi üzerine kurulur. Bu küme, öğrenme kümesi olarak da adlandırılır. Öğrenme kümesine dayalı olarak, diskriminant fonksiyonu olarak bilinen doğrusal fonksiyonların bir kümesi oluşturulur. Diskriminant fonksiyonu, yeni gözlemlerin ait olduğu sınıfı belirlemek için kullanılır. Yeni bir gözlem söz konusu olduğu için tüm diskriminant fonksiyonları hesaplanır ve yeni gözlem diskriminant fonksiyonunun değerinin en yüksek olduğu sınıfa atanır (Huberty, 1994). 2. Naive Bayes Naive Bayes, hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden tahminci ve tanımlayıcı bir sınıflama algoritmasıdır (Hudairy, 2004). Naive Bayes, sürekli veri ile çalışmaz. Bu nedenle sürekli değerleri içeren bağımlı ya da bağımsız değişkenler kategorik hale getirilmelidir. Örneğin; bağımsız değişkenlerden biri yaş ise, sürekli değerler “<20” “21–30”, “31–40” gibi yaş aralıklarına dönüştürülmelidir. Naive Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır. Örneğin; bir banka kredi kartı başvurularını “iyi” ve “kötü” risk sınıflarında gruplandırmak istemektedir. İyi risk çıktısı toplam 5 vaka içinde 2 kere meydana geldiyse iyi risk için öncelikli olasılık 0,4’tür. Bu durum, “Kredi kartı için başvuran biri hakkında hiçbir şey bilinmiyorsa, bu kişi 0,4 olasılıkla iyi risk 21 grubundadır” olarak yorumlanır Naive Bayes aynı zamanda her bağımsız değişken/bağımlı değişken kombinasyonunun meydana gelme sıklığını bulur. Bu sıklıklar öncelikli olasılıklarla birleştirilmek suretiyle tahminde kullanılır. 3. Karar ağaçları Karar ağaçları, yaygın olarak kullanılan sınıflama algoritmalarından birisidir. Karar ağacı yapılarında, her düğüm bir nitelik üzerinde gerçekleştirilen testi, her dal bu testin çıktısını, her yaprak düğüm ise sınıfları temsil eder. En üstteki düğüm kök düğüm olarak adlandırılır. Karar ağaçları, kök düğümden yaprak düğüme doğru çalışır (Wei vd., 2002). En yaygın kullanılan karar ağacı algoritmaları; • CHAID (Chi-Squared Automatic Interaction Detector , Kass 1980), • C&RT (Classification and Regression Trees, Breiman ve Friedman, 1984), • ID3 (Induction of Decision Trees, Quinlan, 1986), • C4.5 (Quinlan, 1993). 4. Sinir Ağları Sinir ağları, tanımlayıcı ve tahmin edici veri madenciliği algoritmalarındandır. İnsan beyninin fizyolojisini taklit ederler. Komplike ve belirsiz veriden bilgi üretirler. Keşfettikleri örüntü ve trendler, insanlar ya da bilgisayarlarca kolay keşfedilemez. Bu tür karmaşık problemlerde birbirleriyle etkileşimli yüzlerce değişken bulunur (Aryeetey, 2003). Bu teknik, veritabanındaki örüntüleri, sınıflandırma ve tahminde kullanılmak üzere genelleştirir. Sinir ağları algoritmaları sadece sayısal veriler üzerinde çalışırlar. 22 5. Kaba kümeler Kaba küme teorisi 1970’li yıllarda Pawlak tarafından geliştirilmiştir. Kaba küme teorisinde bir yaklaştırma uzayı ve bir kümenin alt ve üst yaklaştırmaları vardır. Yaklaştırma uzayı, ilgilenilen alanı ayrı kategorilerde sınıflandırır. Alt yakınlaştırma belirli bir altkümeye ait olduğu kesin olarak bilinen nesnelerin tanımıdır. Üst yakınlaştırma ise alt kümeye ait olması olası nesnelerin tanımıdır. Alt ve üst sınırlar arasında tanımlanan herhangi bir nesne ise “kaba küme” olarak adlandırılır (Pawlak, 2002). 6. Genetik algoritma Algoritma ilk olarak popülâsyon adı verilen bir çözüm kümesi (öğrenme veri kümesi) ile başlatılır. Bir popülâsyondan alınan sonuçlar bir öncekinden daha iyi olacağı beklenen yeni bir popülâsyon oluşturmak için kullanılır. Evrim süreci (yeni popülâsyonlar yapma iterasyonu) tamamlandığında bağımlılık kuralları veya sınıf modelleri ortaya konmuş olur (Shah vd., 2004). 7. Regresyon analizi Regresyon analizi, bir ya da daha fazla bağımsız değişken ile hedef değişken arasındaki ilişkiyi matematiksel olarak modelleyen bir yöntemdir. Veri madenciliğinde yaygın olarak kullanılan regresyon modellerinden doğrusal regresyonda tahmin edilecek olan hedef değişken sürekli değer alırken; lojistik regresyonda hedef değişken kesikli bir değer almaktadır. Doğrusal regresyonda hedef değişkenin değeri; lojistik regresyonda ise hedef değişkenin alabileceği değerlerden birinin gerçekleşme olasılığı tahmin edilmektedir (Hui vd., 2000). 3.2.6.2. Kümeleme Kümeleme, verideki benzer kayıtların gruplandırılmasını sağlayan bir tekniktir. Kümelemede, genellikle k-ortalamalar algoritması ya da Kohonen şebekesi gibi 23 istatistiksel yöntemler kullanılmaktadır. Hangi yöntem kullanılırsa kullanılsın süreç aynı şekilde işler. Her kayıt var olan kümelerle karşılaştırılır. Bir kayıt kendisine en yakın kümeye atanır ve bu kümeyi tanımlayan değeri değiştirir. Optimum çözüm bulununcaya kadar kayıtlar yeniden atanır ve küme merkezleri ayarlanır (Hui vd., 2000). 3.2.6.3. Birliktelik Kuralları ve Ardışık Örüntüler Birliktelik analizi, bir veri kümesindeki kayıtlar arasındaki bağlantıları arayan denetimsiz veri madenciliği şeklidir. Birliktelik analizi çoğu zaman perakende sektöründe süpermarket müşterilerinin satın alma davranışlarını ortaya koymak için kullanıldığından “pazar sepeti analizi” olarak da adlandırılır (Bland, 2002). Birliktelik kurallarına ait bir örnek: “Düşük yağlı peynir ve yağsız süt alan müşteriler %85 olasılıkla diyet süt alırlar.” Ardışık analiz ise birbiriyle ilişkisi olan ancak birbirini izleyen dönemlerde gerçekleşen ilişkilerin tanımlanmasında kullanılır. Aşağıda ardışık analize ait örnekler yer almaktadır. • “Çadır alan müşterilerin %10’u bir ay içerisinde sırt çantası almaktadır.” • “A hissesi %15 artarsa üç gün içinde B hissesi %60 olasılıkla artacaktır.” 3.2.6.4. Tezde Kullanılan Veri Madenciliği Tekniği Yukarıda anlatılan tekniklerden, tez kapsamında karar ağaçları kullanıldığından, bu gruba giren sınıflandırma algoritmaları detaylı bir şekilde anlatılmıştır. Karar Ağaçları, verileri belli nitelik değerlerine göre sınıflandırmaya yarar. Bunun için algoritmaya girdi olarak verilerin belirlenen belli nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir ve algoritma bu çıktı niteliğindeki değerlere ulaşmak 24 için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapıları kullanarak keşfeder. Tezde karar ağaçlarının kullanılmasının sebebi; eldeki değerlerle en iyi sonucun, yukarıda verilen tanıma en uygun çözüm olmasıdır. Bunun için 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerleri algoritmaya girdi bilgisi olarak alınmıştır. Sağlam motor (1), sargı spirleri arasında kısa devre hatası bulunan motor (2) ve milinde mekanik dengesizlik hatası bulunan motor (3) değerleri de çıktı olarak değerlendirilmiştir. Eldeki bu girdi parametrelerine göre WEKA’da bulunan karar ağaçları algoritmaları ile çıktı niteliğindeki değerlere nasıl ulaşıldığı keşfedilmeye çalışılmıştır. Ayrıca, karar ağacı, gürültülü veride etkili çalışabildiği için sınıfların ayırıcı özelliklerini keşfeder. Karar ağacı algoritmalarını bir probleme uygulayabilmek için aşağıdaki koşulların sağlanması gerekir; • Olayların özelliklerle ifade edilebilmesi gerekir. Nesnelerin belli sayıda özellik değerleriyle ifade edilebilmesi gerekir. Örneğin; soğuk, sıcak,...vb. • Sınıfları belirleyebilmek için gereken ayırıcı özelliklerin olması gerekir. Örnek olarak futbol oynamak isteyen kişiler için hava koşulları kayıtlarıyla ilgilenilsin. Hedef nitelik olan futbol oynama durumu iki değer alabilsin. Bunlar oynanabilir ve oynanamaz olsun. Çizelge 3.2.’deki veriler bu örnek için verilmiş nitelik ve bunların alabileceği olası değerler olsun. Çizelge 3.2. Futbol örneği için hedef olmayan nitelikler NİTELİK OLASI DEĞERLER Hava durumu Güneşli, Bulutlu, Yağmurlu Sıcaklık Sürekli Nem Sürekli Rüzgâr Var, Yok 25 Çizelge 3.3. Futbol örneği için öğrenme verisi Hava durumu Sıcaklık Nem Rüzgâr Futbol Oynama Durumu Güneşli 29 85 Yok Oynanamaz Güneşli 27 90 Var Oynanamaz Bulutlu 28 78 Yok Oynanabilir Yağmurlu 21 96 Yok Oynanabilir Yağmurlu 20 80 Yok Oynanabilir Yağmurlu 18 70 Var Oynanamaz Bulutlu 18 65 Var Oynanabilir Güneşli 22 95 Yok Oynanamaz Güneşli 21 70 Yok Oynanabilir Yağmurlu 24 80 Yok Oynanabilir Güneşli 24 70 Var Oynanabilir Bulutlu 22 90 Var Oynanabilir Bulutlu 27 75 Yok Oynanabilir Yağmurlu 22 80 Var Oynanamaz Çizelge 3.2.’deki nitelikler ve Çizelge 3.3.’deki öğrenme verileri kullanıldığında ortaya Şekil 3.1.’deki karar ağacı çıkar. Şekil 3.1. Futbol örneği için oluşan karar ağacı 26 Şekil 3.1.’deki karar ağacına göre, havanın bulutlu olduğu zamanlarda diğer şartlara bakılmaksızın futbol oynanabilir. Eğer hava güneşli ise o zaman nem değerine bakılır ve nem değeride 75’den büyük ise futbol oynanmaz ama nem değeri 75 veya 75’den küçük ise futbol oynanabilir. Eğer hava yağmurlu ise o zaman da rüzgâra bakılır. Rüzgâr varsa futbol oynanmaz, yoksa futbol oynanabilir. 3.2.7. Veri Madenciliği Yazılımları Farklı algoritmaları bünyesinde bulunduran ve farklı işletim sistemleri üzerinde çalışabilen birçok veri madenciliği yazılımı bulunmaktadır. Çizelge 3.4.’de, bu yazılımlardan bazıları, üzerinde çalıştıkları platform ve fonksiyonel özellikleri ile birlikte gösterilmektedir. Çizelge 3.4. Veri Madenciliğinde kullanılan bazı yazılımlar ve özellikleri IBM Ürün Adı Intelligent Miner Oracle Darwin AIX 4.1, Platform NVS, AS/400, Windows Windows SAS Enterprise SPSS WEKA Windows, Windows, Windows, Macintosh, Macintosh, Macintosh, Unix Unix Unix x x Miner Karar Ağacı x x x Sinir Ağları x x x Zaman Serileri x Tahmin x Kümeleme x x Birliktelik x x x x Görselleştirme x x x x x x x x x 27 x x x 1. Intelligent Miner Eşleştirme, sınıflama, tahmin modelleme, gruplama, sıralı desen analizi, regresyon analizi gibi fonksiyonları içeren IBM firmasının geliştirdiği bir yazılımdır. Ayrıca yapay sinir ağları algoritmaları, istatistik metotları, veri hazırlama ve görsel gösterim araçları gibi ek özellikler içerir. 2. Darwin Darwin Oracle firmasının VM aracıdır. Darwin regresyon ağaçları, karar ağaçları, kümeleme, yapay sinir ağları, Bayesian öğrenme, k-yakınlığında komşuluk gibi birçok algoritmayı destekleyen bir VM aracıdır. Darwin kullanımı kolay bir ara yüze sahiptir. Darwin VM algoritmalarından CART, StarTree, StarNet ve StarMatch’i kullanır (Aydoğan, 2003). 3. Enterprise Miner SAS firmasının VM aracıdır. Enterprise Miner karar ağaçları, yapay sinir ağları, regresyon analizi, kümeleme, zaman serileri, ilişkilendirme, vb. VM sorgularını ele alabilmektedir. Grafiksel arayüzü sayesinde kullanım kolaylığı sağlar ve kullanıcılar uygulamanın karmaşıklığından habersiz bir şekilde sadece girdi ve çıktılara yoğunlaşabilirler (Aydoğan, 2003). 4. SPSS İlk sürümü 1968 yılında piyasaya sürülmüş istatistiksel analize yönelik bir bilgisayar programıdır. Günümüzde en son versiyonu olan SPSS 15.0 kullanımdadır. Özellikle Sosyal Bilimlerde, pazar araştırmalarında, sağlık araştırmalarında başta anket şirketleri, hükümetler ve eğitim kurumları olmak üzere pek çok kurum tarafından kullanılan bir VM yazılımıdır. 28 Kullanımı grafiksel bir kullanıcı ara yüzüne bağlı olup, açılır menüler yardımıyla kolaylaştırılmıştır. Ayrıca makro dilleri yardımıyla kullanıcı kendi amaçları doğrultusunda programı yönlendirebilmektedir. SPSS programının Windows, Mac OS ve UNIX işletim sistemleri için farklı sürümleri mevcuttur. Windows sürümü daha sık güncellenmekte ve diğer versiyonlara göre daha fazla özellik içermektedir (http://tr.wikipedia.org/wiki/SPSS). 5. WEKA Yeni Zelanda Waikito Üniversitesinde, obje yönelimli programlama dillerinden biri olan Java ile geliştirilmiş ve halen yeni sürümleri geliştirilmeye devam eden açık kaynak kodlu bir VM yazılımdır. WEKA’nın Java ile geliştirilmiş olması, Linux, Unix, Windows ve Macintosh gibi başlıca işletim sistemi platformlarında kullanılabilirliğini sağlamıştır. Ayrıca WEKA programı internet üzerinden bedelsiz olarak dağıtılması nedeniyle tezde kullanılmıştır. (http://www.cs.waikato.ac.nz/ml/ weka/index_downloading.html) Yukarıdaki programların haricinde ayrıca özel amaçlar için tasarlanmış VM uygulama programları bulunmaktadır. Bunlardan bazıları; Clementine (Kimya), Data Logic/R (Ticaret), INLEN, KDW (Knowledge Discowery Workbench), SKICAT (Sky Image Classification & Archiving Tool) (Astronomi), R-MINI (Finansal), TASA (Telecommunication Network Alarm Sequence Analyzer) (Telekomünikasyon), GCLUTO (Graphical CLUstering TOolkit). 3.3.Veri Madenciliği Süreci Ne kadar etkin olursa olsun hiç bir veri madenciliği algoritmasının, üzerinde inceleme yapılan işin ve verilerin özelliklerinin bilinmemesi durumunda fayda sağlaması mümkün değildir. Bu nedenle yukarıda tanımlanan tüm aşamalardan önce, iş ve veri özelliklerinin öğrenilmesi-anlaşılması başarının ilk şartı olacaktır. Başarılı bir veri madenciliği projesinde izlenmesi gereken adımlar aşağıdadır (Shearer, 2000); 29 1. Problemin tanımlanması, 2. Verilerin hazırlanması, 3. Modelin kurulması ve değerlendirilmesi, 4. Modelin kullanılması, 5. Modelin izlenmesi. 3.3.1. Problemin Tanımlanması Veri madenciliği çalışmalarında başarılı olmanın en önemli şartı, projenin hangi işletme amacı için yapılacağının ve elde edilecek sonuçların başarı düzeylerinin nasıl ölçüleceğinin tanımlanmasıdır. Ayrıca yanlış tahminlerde katlanılacak olan maliyetlere ve doğru tahminlerde kazanılacak faydalara ilişkin tahminlere de bu aşamada yer verilmelidir. Bu aşamada mevcut iş probleminin nasıl bir sonuç üretilmesi durumunda çözüleceğinin, üretilecek olan sonucun fayda-maliyet analizinin başka bir ifadeyle üretilen bilginin işletme için değerinin doğru analiz edilmesi gerekmektedir (Akbulut, 2006). Analistin, işletmede üretilen sayısal verilerin boyutlarını, proje için yeterlilik düzeyini ve iş süreçlerini iyi analiz etmesi gerekmektedir. 3.3.2. Verilerin Hazırlanması (Veri Önişleme) Veri madenciliğinin en önemli aşamalarından biri olan verinin hazırlanması aşaması, analistin toplam zaman ve enerjisinin %50-%85’ini harcamasına neden olmaktadır. Veri kalitesi, veri madenciliğinde anahtar bir konudur. Veri madenciliğinde güvenilirliğin artırılması için, veri ön işleme yapılmalıdır. Aksi halde hatalı girdi verileri kullanıcıyı hatalı çıktıya götürecektir. Veri ön işleme, çoğu durumlarda yarı otomatik olan ve yukarıda da belirtildiği gibi zaman isteyen bir veri madenciliği aşamasıdır. Verilerin sayısındaki artış ve buna bağlı olarak çok büyük sayıda 30 verilerin ön işlemden geçirilmesinin gerekliliği, otomatik veri ön işleme için etkin teknikleri önemli hale getirmiştir (Oğuzlar, 2003). Veri ön işleme teknikleri şu şekilde sıralanabilir: 1. Veri Temizleme 2. Veri Birleştirme 3. Veri Dönüştürme 4. Veri İndirgeme Veri önişleme tekniklerinden kısaca bahsetmek gerekirse; 1. Veri Temizleme Veri temizleme, eksik verilerin tamamlanması, aykırı değerlerin tespit edilmesi amacıyla gürültünün düzeltilmesi ve verilerdeki tutarsızlıkların giderilmesi gibi işlemleri gerektirmektedir. 2. Veri Birleştirme Veri madenciliğinde bazen farklı veri tabanlarındaki verilerin birleştirilmesi gerekebilir. Farklı veri tabanlarındaki verilerin tek bir veri tabanında birleştirilmesiyle şema birleştirme hataları oluşur. Örneğin, bir veri tabanında girişler “tüketici-ID” şeklinde yapılmışken, bir diğerinde “tüketici-numarası” şeklinde olabilir. Bu tip şema birleştirme hatalarından kaçınmak için meta veriler kullanılır. 3. Veri Dönüştürme Veri dönüştürme ile veriler, veri madenciliği için uygun formlara dönüştürülürler. Veri dönüştürme; düzeltme, birleştirme, genelleştirme ve normalleştirme gibi değişik işlemlerden biri veya bir kaçını içerebilir. Veri normalleştirme en sık kullanılan veri dönüştürme işlemlerinden birisidir. 31 4. Veri İndirgeme Veri indirgeme teknikleri, daha küçük hacimli olarak ve veri kümesinin indirgenmiş bir örneğinin elde edilmesi amacıyla uygulanır. Bu sayede elde edilen indirgenmiş veri kümesine veri madenciliği teknikleri uygulanarak daha etkin sonuçlar elde edilebilir. Veri indirgeme yöntemleri ise aşağıdaki biçimde özetlenebilir: 1. Veri Birleştirme veya Veri Küpü 2. Boyut indirgeme 3. Veri Sıkıştırma 4. Kesikli hale getirme 3.3.3. Modelin Kurulması ve Değerlendirilmesi Tanımlanan problem için en uygun modelin bulunabilmesi, olabildiğince çok sayıda modelin kurularak denenmesi ile mümkündür. Bu nedenle veri hazırlama ve model kurma aşamaları, en iyi olduğu düşünülen modele varılıncaya kadar yinelenen bir süreçtir. Model kuruluş süreci denetimli ve denetimsiz öğrenimin kullanıldığı modellere göre farklılık göstermektedir (Witten ve Frank, 2000). Örnekten öğrenme olarak da isimlendirilen denetimli öğrenimde, bir denetçi tarafından ilgili sınıflar önceden belirlenen bir kritere göre ayrılarak, her sınıf için çeşitli örnekler verilir. Sistemin amacı verilen örneklerden hareket ederek her bir sınıfa ilişkin özelliklerin bulunmasıdır. Öğrenme süreci tamamlandığında, tanımlanan kurallar verilen yeni örneklere uygulanır ve yeni örneklerin hangi sınıfa ait olduğu kurulan model tarafından belirlenir. 32 Denetimsiz öğrenmede, kümeleme analizinde olduğu gibi ilgili örneklerin gözlenmesi ve bu örneklerin özellikleri arasındaki benzerliklerden hareket ederek sınıfların tanımlanması amaçlanmaktadır. Denetimli öğrenimde seçilen algoritmaya uygun olarak ilgili veriler hazırlandıktan sonra, ilk aşamada verinin bir kısmı modelin öğrenimi, diğer kısmı ise modelin geçerliliğinin test edilmesi için ayrılır. Modelin öğrenimi, öğrenim kümesi kullanılarak gerçekleştirildikten sonra, test kümesi ile modelin doğruluk derecesi belirlenir (Akbulut, 2006). Bir modelin doğruluğunun test edilmesinde kullanılan en basit yöntem basit geçerlilik testidir. Bu yöntemde tipik olarak verilerin %5 ile %33 arasındaki bir kısmı test verileri olarak ayrılır ve kalan kısım üzerinde modelin öğrenimi gerçekleştirildikten sonra, bu veriler üzerinde test işlemi yapılır. Bir sınıflama modelinde yanlış olarak sınıflanan olay sayısının, tüm olay sayısına bölünmesi ile hata oranı, doğru olarak sınıflanan olay sayısının tüm olay sayısına bölünmesi ile ise doğruluk oranı hesaplanır (Akpınar, 2000). Değerlendirme kriterlerinden en önemlisi, modelin anlaşılabilirliğidir. Bazı uygulamalarda doğruluk oranlarındaki küçük artışlar çok önemli olsa da, birçok işletme uygulamasında ilgili kararın niçin verildiğinin yorumlanabilmesi çok daha büyük önem taşıyabilir. Çok ender olarak yorumlanamayacak kadar karmaşıklaşsalar da, genel olarak karar ağacı ve kural temelli sistemler model tahmininin altında yatan nedenleri çok iyi ortaya koyabilmektedir. Kurulan modelin doğruluk derecesi ne denli yüksek olursa olsun, gerçek dünyayı tam anlamı ile modellediğini garanti edebilmek mümkün değildir. Yapılan testler sonucunda geçerli bir modelin doğru olmamasındaki başlıca nedenler, model kuruluşunda kabul edilen varsayımlar ve modelde kullanılan verilerin doğru olmamasıdır. 33 3.3.4. Modelin Kullanılması Kurulan ve geçerliliği kabul edilen model doğrudan bir uygulama olabileceği gibi, bir başka uygulamanın alt parçası olarak kullanılabilir. Kurulan modeller risk analizi, kredi değerlendirme, dolandırıcılık tespiti gibi işletme uygulamalarında doğrudan kullanılabileceği gibi, promosyon planlaması simülasyonuna entegre edilebilir veya tahmini envanter düzeyleri yeniden sipariş noktasının altına düştüğünde, otomatik olarak sipariş verilmesini sağlayacak bir uygulamanın içine gömülebilir (Shearer, 2000). 3.3.5. Modelin İzlenmesi Zaman içerisinde bütün sistemlerin özelliklerinde ve dolayısıyla ürettikleri verilerde ortaya çıkan değişiklikler, kurulan modellerin sürekli olarak izlenmesini ve gerekiyorsa yeniden düzenlenmesini gerektirecektir. Tahmin edilen ve gözlenen değişkenler arasındaki farklılığı gösteren grafikler model sonuçlarının izlenmesinde kullanılan yararlı bir yöntemdir (Shearer, 2000). 3.4. Yöntem 3.4.1. Problemin Tanımlanması Bu tezin amacı, işletmelerde m a k s i m u m verimlilik s a ğ l a n m a s ı , ürün kalitesinin artırılması ve çalışma zaman kayıplarının önlenmesini sağlamak için atılması gereken ilk adım işletmelerdeki süreçlerin gerçek zamanlı olarak sürekli izlenmesi, ikinci adım ise bu süreçlerin izlenmesi ile elde edilen verilerin, veri madenciliği gibi tahmin ve sınıflama kabiliyetine sahip bir araç ile analiz edilmesidir. Bu bize üretimi durdurmadan, belirli aralıklarla işletme duruşlarına gidilerek makine ve ekipmanlardan verileri alarak, oluşturulan veri madenciliği sistemi ile ortaya çıkabilecek olan hataların önceden tespit edilmesini sağlayacaktır. 34 Bu çalışma için veriler Artesis Teknoloji Sistemleri A.Ş. firmasından alınmıştır. Veriler aynı motordan 3 durum için alınmıştır. Normal (Sağlam), sargı spirleri arasında kısa devre hatası ve milinde mekanik dengesizlik hatası durumları için üç faz akım ve gerilim değerleridir. Verilerin alındığı motorun özelikleri Çizelge 3.5.’de verilmiştir. Çizelge 3.5. Verilerin alındığı 3 faz sincap kafes asenkron motorun özellikleri Özellik Değer Gücü (kVA) 1.2 Gerilin (V) 220 Frekans (Hz) 50 Devir Sayısı (d/dk) 1475 Stator Rezistansı rs (ohm) 4.85 Xls (ohm) 0.274 Xlr (ohm) 0.274 rr (ohm) 3.805 J (kg.m2) 0.031 3.4.2. Kullanılan Yazılım WEKA (Waikato Environment for Knowledge Analysis ), Yeni Zelanda Waikato Üniversitesi’nde geliştirilen bir veri madenciliği ve makine öğrenmesi yazılımıdır. WEKA yazılımı nesneye yönelik programlama dillerinden olan Java ile geliştirilmiştir. Java birçok değişik öğrenme algoritmaları için düzenli bir platform sağlamaktadır. WEKA’nın en güçlü özelliği birçok sınıflandırma tekniğini içermesidir. Diğer bir özelliği de uygulamaların komut girilerek gerçekleştirilmesine imkân tanımasıdır. Şekil 3.2.’de WEKA programının genel kullanıcı ara yüzü görülmektedir. 35 Şekil 3.2. WEKA programının genel kullanıcı arayüzü WEKA’da; Preprocess (önişleme), Classify (sınıflama), Cluster (kümeleme), Associate (birliktelik kuralları), Select Attribute (nitelik seçme) ve Visualize (görselleştirme) panelleri bulunmaktadır. 36 Ön işleme paneli: Bilgi keşfinin başlangıç noktasıdır. Veri dosyaları bu panelden yüklenir. WEKA’ya Excel ve Access ortamından ve herhangi bir internet sayfasından dosya yüklemek mümkündür. Şekil 3.3.’de WEKA programının ön işleme panelinin ekran görüntüsü verilmiştir. Şekil 3.3. WEKA programının ön işleme panelinin ekran görünümü Bu ekranda verilerin minimum, maksimum, ortalama ve standart sapma değerleri ve verilerin dağılımları sağ alt köşede görülmektedir. 37 Sınıflandırma algoritmalarının paneli: Veri kümesi çalıştırıldığı paneldir. üzerinde Şekil WEKA’nın 3.4.’de WEKA sınıflandırma programının sınıflandırma panelinin ekran görüntüsü verilmiştir. Şekil 3.4. WEKA programının sınıflandırma panelinin ekran görünümü Sınıflandırma paneli, karar ağaçlarından kurallara; fonksiyonlardan Bayes ağlarına birçok sınıflandırma algoritmasını içermektedir. Kurulacak modeli belirlemek için farklı algoritmalar veri üzerinde çalıştırılarak doğrulukları karşılaştırılmalıdır. Bu panelde çapraz geçerleme (cross validation) ya da yüzde ayırma (percentage split) seçeneklerini kullanarak kurulan modellerin doğruluğunu ölçmek mümkündür. Çapraz geçerleme veri kümesinin eş büyüklükte (program varsayılan değer olarak 10 katman kullanmaktadır) katmana ayırarak; her iterasyonda n-1 parçayı modelin öğrenilmesinde 1 parçayı ise modelin testinde kullanan bir yöntemdir. Yüzde ayırma yönteminde ise veri kümesinin belirli bir yüzdesi (program varsayılan değer olarak %66 kullanmaktadır) modelin öğrenilmesine kalan kısmı ise modelin testine ayrılmaktadır. 38 Kümeleme paneli: Bu panelde veritabanı üzerinde WEKA’daki kümeleme algoritmaları çalıştırılır. Birliktelik Kuralları paneli: Bu panelde veri kümesine birliktelik kuralları uygulanır. Görselleştirme paneli: Bu panel ile farklı nitelikler arasındaki ilişkileri grafik olarak görüntülemek mümkündür. 3.4.3. Uygulamada Veri Madenciliği Süreci Asenkron motorlarda hata tespiti veri madenciliği sürecinin aşamaları Şekil 3.5.’de verilmiştir. Şekil 3.5. Asenkron motorlarda hata tespiti için veri madenciliği süreci 39 Şekil 3.5.’de de görüleceği üzere ilk önce VM’de kullanılacak veriler veri örnekleme işlemi ile toplanır. Veriler sistematik olarak, aynı şartlarda belli bir yük altında, motor çalıştırılıp geçici durumları bittikten ve sistem kararlı duruma geldikten sonra alınmaya başlanmıştır. Veriler 10000 nokta/saniye hızında 6 saniye süresince 3 faz akım ve gerilim değerleri olarak alınmıştır. Daha sonra veriler WEKA programında işlenmek üzere hazırlanır. Hazırlanan verileri işlemek için bir model kurulur (tezde karar ağaçları kullanılarak model kurulmuştur), kurulan modele veriler uygulanır ve elde edilen sonuçlar değerlendirilir. 3.4.4. Veri Hazırlama Veri kalitesi, veri madenciliğinde anahtar bir konudur. Veri madenciliğinde güvenilirliğin artırılması için, veri ön işleme yapılmalıdır. Aksi halde hatalı girdi verileri kullanıcıyı hatalı çıktıya götürecektir. Veri madenciliğinin en önemli aşamalarından biri olan verinin hazırlanması aşaması, analistin toplam zaman ve enerjisinin %50-%85’ini harcamasına neden olmaktadır. Bu yüzden bu aşama yapılırken çok dikkatli olunmalıdır. Çünkü yanlış hazırlanan veriler, sonuçlarında yanlış çıkmasına neden olacaktır. Tezde veri hazırlama işlemi olarak, • 3 faz akım değerlerine sol ve sağ band için band geçiren filtre uygulanması, • 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerlerinin RMS değerlerinin hesaplanması, • Veri dosyalarının uzantılarının .arff olarak hazırlanmasıdır. 1. Band Geçiren Filtre Uygulaması Band Geçiren Filtre ile hatalı durumların genlik-frekans düzleminde görülüp, görülemeyeceği araştırılmıştır. Şekil 3.6.’da band geçiren bir filtrenin frekans-genlik değişimi gösterilmektedir. Buradaki ok işaretleri de, işaretli olan frekans değerlerinde normalden farklı bir değişim olduğunu göstermektedir. Filtre çıkışından elde edilen zaman-genlik değerleri bir Excel dosyası olarak kaydedilmiştir. 40 Şekil 3.6. Band Geçiren Filtrelenmiş üç faz akım spektrumlarının 0-100 Hz aralığı 2. RMS Değerlerinin Hesaplanması Burada, ilk önce filtresiz durumdaki verilerin RMS değerleri hesaplanacaktır. RMS hesaplama işlemi Matlab programı ile gerçekleştirilmiştir. RMS hesaplama işlemi aşağıdaki program parçası ile yapılmıştır. function [sonuc]=rmsbul(x) for i=1:1:299 t=0; y=x((i*200-199):i:i*200); t=y.*y; sonuc(i)=sqrt(sum(t)/200); end 41 Zaman düzlemindeki sinyal 10 kHz örnekleme frekansı ile 6 sn süresince toplandığından, her bir kanal için 60 bin veri elde edilmiştir. Buna göre bir periyotluk veride 50 Hz şebeke frekansında 200 adet örnek vardır. Bu sebeple toplam periyot sayısı 300 olarak bulunmuştur. Bu yüzden döngü 1-299 arasındadır. RMS alma işlemi 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerlerine ayrı ayrı uygulanmıştır. Şekil 3.7. Normal motor için 1. faz akımının zaman-genlik grafiği Şekil 3.8. Normal motor için 1. faz akımının RMS değişim grafiği Şekil 3.7. ve Şekil 3.8.’de sırasıyla normal motor için 1. faz akımının anlık değerlerinin değişimi ve RMS değerlerinin değişim grafikleri gösterilmiştir. RMS 42 hesaplama işleminin nedeni; hatadan kaynaklanan genlik değişimlerinin izlenebilmesi içindir. RMS alınmadan önce herhangi bir durumdaki (normal, kısa devre ve mekanik dengesizlik), tek faz akım veya gerilim verileri 180000 adet iken RMS hesaplama işleminden sonra bu sayı 900’e dönüştürülmüştür. Elde edilen bu değerler Excel dosyası olarak kaydedilmiştir. 3. .arff Dosyalarının Hazırlanması WEKA uygulamalarında veri girişi olarak .arff dosya biçimi kullanılmaktadır. Eldeki verileri WEKA programına girdi değeri olarak vermek için aşağıdaki işlemler sırayla yapılmıştır; • Excel’de bulunan veriler ilk önce düzenli hale getirilir, • Sonra Excel sayfaları Access’de açılarak veritabanı dosyası olarak kaydedilir, • Cahit Arf Wizard programı ile de Access’deki veri tabanı dosyaları .arff uzantılı dosyalara dönüştürülür. 3.4.5. Modelleme Verilerin hazırlanmasından sonraki adım modelleme adımıdır. Bu adımda farklı karar ağaç algoritmaları veri kümesi üzerinde denenerek doğruluğu en yüksek olan model seçilir. Bu uygulamada, model kurma aşamasında WEKA VM yazılımı kullanılmıştır. Burada karar ağaçları olarak M5Rules, Decision Table, Conjuctive Rule, RepTree, M5P-M 4.0, Decision Stump, Regression By Discretization, Bagging, Additive Regression, LWL, Kstar, Ibk, SMOreg, Simple Linear Regression, RBF Network, Pace Regression, Multilayer Perceptron, Linear Regression modelleri kullanılmıştır. Bu karar ağaçlarına girdi verisi olarak aşağıdaki veri paketleri ayrı ayrı uygulanmıştır. 43 • 3 faz motor akım değerleri, • 3 faz motor akım ve gerilim değerleri, • 3 faz motor akım ve sol band için band geçiren filtre uygulanmış akım değerleri, • 3 faz motor akım ve sağ band için band geçiren filtre uygulanmış akım değerleri, • 3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış akım değerleri, • 3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerleri. Kurulan modele uygulanan veriler ile elde edilen sonuçlar bir sonraki bölümde değerlendirilmiştir. 44 4. ARAŞTIRMA BULGULARI VE TARTIŞMA Bu bölümde, tezde kullanılan asenkron motor frekans spektrum analizi ile hata tespitinin, VM ile hata tespitinin nasıl yapıldığından ve bu iki uygulamadan elde edilen sonuçlardan söz edilmiştir. Frekans spektrum analizinde, yüksek genlikli şebeke frekansı ile düşük genlikli yan bandları ayırt edebilmek için dar aralıklı bir band geçiren filtre tasarlanarak, motor milindeki mekanik dengesizlik hatası tespit edilmiştir. VM ile de, sınıflandırma tekniklerinden birkaç karar ağacı uygulanarak motor milindeki mekanik dengesizlik ve sargı spirleri arasındaki kısa devre hatası tespit edilmiştir. Asenkron motor hataları genel olarak stator sargılarında oluşan hatalar, sincap kafesli motorlarda rotorda oluşan mekanik hatalar ve rulman hataları olarak sınıflandırılabilir. Endüstride en yaygın olarak kullanılan motorlar olmaları nedeniyle, özellikle büyük güçlü asenkron motorların hatalarının motor onarılamayacak duruma gelmeden önce belirlenmesi önem kazanmıştır. Tezde kullanılan motor akım ve gerilim değerleri sağlam, sargı spirleri arasında kısa devre olan ve mekanik dengesizliği bulunan 3 fazlı sincap kafesli asenkron motordan alınmıştır. İlerleyen kısımlarda sağlam motor verileri için “NORMAL”, sargı spirleri arasındaki kısa devre olan motor verileri için “KISA DEVRE” ve mekanik dengesizlik motor verileri için “MEK. DENGSZ.” ifadeleri kullanılmıştır. Asenkron motorların hatalarının belirlenmesi ve sınıflandırılmasında genel olarak stator akımının frekans spektrumu hatasız bir motordan elde edilen frekans spektrumu ile karşılaştırılarak yapılmaktadır. 4.1. Frekans Spektrum Analizi Bu amaçla ilk önce 3 faz motor akımları kullanılarak kısa devre ve mekanik dengesizlik gibi hatalarının araştırılması için Matlab programında spektrum analizi yapılmıştır. 45 Akım verilerinin daha iyi görülebilmesi için sadece 10 periyotluk ve 2 periyotluk kısımları Şekil 4.1.’de gösterilmiştir. Grafiklerdeki siyah renk sağlam motoru, kırmızı renk kısa devre hatası bulunan motoru ve mavi renkte mekanik dengesizlik bulunan motoru göstermektedir. Grafiklerde görülen ilk farklılık, normal motor ile hatalı motor akım verileri arasındaki genlik değişimidir. (a) (b) Şekil 4.1. Normal, kısa devre ve mekanik dengesizliği bulunan motorların 1., 2. ve 3. faz akımlarının zaman-genlik grafikleri a) 10 periyot b) 2 periyot Hata tespiti ve sınıflandırması için geleneksel yöntemle stator akımının frekans spektrumları Şekil 4.2.’de her bir faz için ayrı ayrı verilmiştir. 46 Şekil 4.2. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator akımlarının genlik-frekans spektrumları Şekil 4.2.’de gösterilen faz akımlarının frekans spektrumu 0-1000 Hz aralığındadır. Şebeke frekansının sağında ve solunda farklı genlik değerleri görülmektedir. Bunların daha iyi görülmesi için frekans spektrumu 0-100 Hz aralığında Şekil 4.3.’de gösterilmiştir. Şekil 4.3. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator akımlarının frekans-genlik spektrumlarının 0-100 Hz aralığı 47 Şekil 4.3.’de mekanik dengesizlik hatası bulunan motor faz akımlarının genliğinin 70-80 Hz ve 20-30 Hz arasında diğer motor faz akımlarının genliklerinden farklı bir tepe değerine sahip olduğu görülmektedir. Bu durum rotorda oluşan mekanik dengesizliğin rotor dönüş hızında şebeke frekansını modüle etmesi ile oluşan bir etkidir. Bu sebeple şebeke frekansının sağında ve solunda rotor hızı ile orantılı yan bandlar oluşur. Yüksek genlikli şebeke frekansı ile düşük genlikli yan bandları ayırt edebilmek için dar aralıklı bir band geçiren filtre ile filtrelenmiştir. Çünkü band geçiren filtre, sadece belirli frekans aralığını geçirir, diğerlerini söndürür. 70-80 Hz aralığındaki sağ band için ve 20-30 Hz aralığındaki sol band için 2 ayrı band geçiren filtre tasarlanmıştır. Band geçiren filtrenin transfer fonksiyonu için aşağıdaki kısa Matlab programı kullanılmıştır. w=[0.01451 0.01531]; [b,a]=butter(3,w); sys=tf(b,a); Filtrenin transfer fonksiyonu ise aşağıdaki gibidir; 1.98e-009 s^6 - 5.939e-009 s^4 + 5.939e-009 s^2 - 1.98e-009 --------------------------------------------------------------------------------------s^6 - 5.988 s^5 + 14.95 s^4 - 19.91 s^3 + 14.92 s^2 - 5.968 s + 0.995 Sağ band için 3. dereceden butterworth tipi sayısal band geçiren filtre kullanılmıştır. Filtrede pencere genişliği 4 Hz, normalizasyon fs/2 olarak alınmıştır. (fs: örnekleme frekansı (10/2=5 kHz)) 48 Şekil 4.4. Sağ Band için band geçiren filtrenin kutup 0 diyagramı Şekil 4.4.’deki kutup 0 diyagramında Filtre Kutupları birim çember üzerindedir. Buradan filtrenin kararlılığı anlaşılmaktadır. Eğer Filtre Kutupları birim çember dışında olsalardı uygulanan filtre kararsız olurdu. 49 Şekil 4.5. Sağ Band için Band Geçiren Filtrenin frekans cevabı Şekil 4.5.’deki kazanç-frekans ve faz açısı-frekans değişimlerinden band geçiren filtre karakteristiği olduğu gözlemlenmiştir. Şekil 4.5.’de Kazanç Genliği(dB)Normalize Frekans(rad) grafiğinde kırmızı çember içine alınan bölge band geçiren filtrenin ilgili aralığı geçirdiğini göstermektedir. Şekil 4.6. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz akımının zaman-genlik grafiği 50 Şekil 4.7. Normal, kısa devre, mekanik dengesizlik durumları için 2. faz akımının filtrelenmiş durumlarının zaman-genlik grafiği Şekil 4.8. Normal, kısa devre, mekanik dengesizlik durumları için 3. faz akımının filtrelenmiş durumlarının zaman-genlik grafiği Şekil 4.6., 4.7. ve 4.8. normal, kısa devre, mekanik dengesizlik durumları için 3 faz akımının filtrelenmiş hallerini göstermektedir. 51 Şekil 4.9. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-1000 Hz aralığı Şekil 4.10. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-100 Hz aralığı 50 Hz’lik temel bileşene göre sağ band daha ayırt edici bir şekilde genliği tespit edilebilmektedir. 52 Sol band için yine sağ banda olduğu gibi band geçiren filtre olarak butter tipi filtre kullanılmıştır. Filtrede pencere genişliği 4 Hz, normalizasyon fs/2 olarak alınmıştır. (fs: örnekleme frekansı (10/2=5 kHz)) Şekil 4.11. Sol Band için band geçiren filtrenin kutup 0 diyagramı Şekil 4.11.’deki kutup 0 diyagramında Filtre Kutupları birim çember üzerindedir. Buradan filtrenin kararlılığı anlaşılmaktadır. Eğer Filtre Kutupları birim çember dışında olsalardı uygulanan filtre kararsız olurdu. 53 Şekil 4.12. Sol Band için Band Geçiren filtrenin frekans cevabı Şekil 4.12.’deki kazanç-frekans ve faz açısı-frekans değişimlerinden band geçiren filtre karakteristiği olduğu gözlemlenmiştir. Şekil 4.12.’deki Kazanç Genliği (dB)Normalize Frekans (rad) grafiğinde kırmızı çember içine alınan bölge, band geçiren filtrenin ilgili aralığı geçirdiğini göstermektedir. Şekil 4.13. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz akımının zaman-genlik grafiği 54 Şekil 4.14. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 2. faz akımının zaman-genlik grafiği Şekil 4.15. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 3. faz akımının zaman-genlik grafiği Şekil 4.13., 4.14. ve 4.15. normal, kısa devre, mekanik dengesizlik durumları için 3 faz akımının filtrelenmiş durumlarını göstermektedir 55 Şekil 4.16. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-1000 Hz aralığı Şekil 4.17. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları 0-100 Hz aralığı 50 Hz’lik temel bileşene göre, sol band daha ayırt edici bir şekilde genliği tespit edebilmektedir. 56 Yapılan frekans spektrum analizlerinde kısa devre hatasından kaynaklanan genlik değişimi frekans düzleminde görülmemektedir. Fakat zaman düzleminde genlik değişimi ve faz değişimi belirgin şekilde görülmektedir. 4.2. Veri Madenciliği ile Hata Analizi Filtreli ve filtresiz sinyal değerlerinin RMS değerlerinin bulunması için aşağıdaki kısa Matlab programı kullanılmıştır. function [sonuc]=rmsbul(x) for i=1:1:299 t=0; y=x((i*200-199):i:i*200); t=y.*y; sonuc(i)=sqrt(sum(t)/200); end Zaman düzlemindeki sinyal 10 kHz örnekleme frekansı ile 6 sn süresince toplandığından, her bir kanal için 60 bin veri elde edilmiştir. Buna göre bir periyotluk veride 50 Hz şebeke frekansında 200 adet örnek vardır. Bu sebeple toplam periyot sayısı 300 olarak bulunmuştur. Bu yüzden döngü 1-299 arasındadır. Filtreli ve filtresiz verilerin VM ile çözümlenmesi için bazı adımlardan geçmesi gerekmektedir. Veriler Excel’de düzenlikten sonra, Access’te veri tabanına aktarılmıştır. VM işlemi için WEKA programı kullanılmıştır. Bu programda kullanılacak veriler .arff uzantılı dosyalarda bulunmak zorundadır. Bunun için veri tabanındaki dosyaların uzantısı Cahit Arf Wizard programı ile .arff olarak değiştirilmiştir. WEKA için hazırlanan dosyaların bir örneği EK-1’de verilmiştir. WEKA uygulamaları için 6 adet dosya hazırlanmıştır; • 3 faz motor akım değerleri, • 3 faz motor akım ve gerilim değerleri, • 3 faz motor akım ve sol band için band geçiren filtre uygulanmış akım değerleri, 57 • 3 faz motor akım ve sağ band için band geçiren filtre uygulanmış akım değerleri, • 3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış akım değerleri, • 3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım değerleri. Karar ağaçları, verileri belli nitelik değerlerine göre sınıflandırmaya yaradığından dolayı kullanılmıştır. Bunun için algoritmaya girdi olarak verilerin belirlenen belli nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir. Algoritma bu çıktı niteliğindeki değerlere ulaşmak için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapılarını kullanarak keşfeder. EK-1’de verilen örnek .arff dosyasında da görülebileceği gibi 3 faz akım ve 3 faz gerilimin RMS değerleri giriş olarak alınmıştır. 1 değeri sağlam motoru, 2 değeri kısa devre hatası bulunan motoru ve 3 değeri de mekanik dengesizlik hatası bulunan motoru temsil etmektedir. Aşağıdaki 3 satır EK-1’de verilen .arff dosyasından alınmıştır. Bu satırlardaki ilk 3 değer 3 faz gerilim RMS değerini, ikinci 3 değer 3 faz akım RMS değerini ve son değerde motorun durumunu temsil etmektedir. 217.5731, 221.5576, 223.5613, 1.9757, 1.8311, 1.8326, 1.0 220.1463, 221.6926, 220.4362, 2.0595, 1.7336, 1.9997, 2.0 221.7459, 213.7593, 227.2815, 1.8339, 1.7337, 2.117, 3.0 Hazırlanan bu 6 dosyaya WEKA programında sırayla farklı karar ağaç algoritmaları uygulanmıştır. Uygulanan karar ağacı algoritmaları şunlardır. - Rules: M5Rules, Decision Table, Conjuctive Rule, - Trees: RepTree, M5P-M 4.0, Decision Stump, - Meta: Regression By Discretization, Bagging, Additive Regression, - Lazy: LWL, Kstar, Ibk, - Functions: SMOreg, Simple Linear Regression, RBF Network, Pace Regression, Multilayer Perceptron, Linear Regression 58 WEKA programında kuralların oluşturulmasında verilerin %80’i öğrenme verisi ve %20’si test verisi olarak seçilmiştir. WEKA’ya sadece 3 faz akım RMS verileri giriş olarak verildiği zaman, karar ağaçlarından elde edilen değerler Çizelge 4.1.’de verilmiştir. Çizelgedeki Correlation coefficient (Korelâsyon katsayısı) değeri 1’e ne kadar yakın ise karar ağacının ürettiği kurallar o derece doğrudur. Aynı şekilde Mean Absolute Error (Mutlak hata değeri) değerinin de 0’a yakın olması istenir. Çizelge 4.1. 3 faz akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.95 0.0039 Decision Table 0.97 0.03 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.85 0.34 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.99 0.001 KStar 0.95 0.04 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.85 0.25 Pace Regression 0.98 0.05 Multilayer Perceptron 0.94 0.002 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları 59 Çizelge 4.1.’de RepTree ve M5P-M4.0 karar ağaçlarının korelâsyon katsayısı 1 diğerlerininki de 1’e yakın değerler çıkmıştır. Korelasyon katsayısı 1’e ne kadar yakın olursa üretilen kurallar o derece doğruydu. İkinci kriter olarak ise mutlak hata değerine bakılırsa yine RepTree ve M5P-M4.0 karar ağaçlarının ürettikleri değerler 0 ve 0’a çok yakın değerlerdir. Akım verilerine göre en iyi kural çıkaran karar ağaçları RepTree ve M5P-M4.0’dır. Çizelge 4.2. 3 faz akım ve gerilim verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.95 0.0039 Decision Table 0.98 0.003 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.85 0.34 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.99 0.001 KStar 0.95 0.04 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.87 0.12 Pace Regression 0.98 0.05 Multilayer Perceptron 0.94 0.002 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları 60 Çizelge 4.3. 3 faz akım ve sol band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.95 0.0039 Decision Table 0.93 0.024 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.85 0.34 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.99 0.001 KStar 0.95 0.04 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.85 0.25 Pace Regression 0.98 0.05 Multilayer Perceptron 0.97 0.06 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları 61 Çizelge 4.4. 3 faz akım ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.95 0.0039 Decision Table 0.97 0.03 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.82 0.40 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.99 0.001 KStar 0.92 0.059 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.85 0.25 Pace Regression 0.98 0.05 Multilayer Perceptron 0.94 0.002 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları 62 Çizelge 4.5. 3 faz akım, sol ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.96 0.039 Decision Table 0.97 0.03 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.85 0.34 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.99 0.001 KStar 0.95 0.04 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.85 0.25 Pace Regression 0.98 0.05 Multilayer Perceptron 0.94 0.002 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları 63 Çizelge 4.6. 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri Correlation Mean absolute coefficient error M5 Rules 0.95 0.0039 Decision Table 0.97 0.03 Conjuctive Rule 0.85 0.34 RepTree 1 0 M5P- M4.0 1 0.0008 Decision Stump 0.85 0.34 Regression By Disc. 0.76 0.45 Bagging 0.87 0.38 Additive Regression 0.90 0.25 LWL 0.97 0.01 KStar 0.95 0.04 Ibk 0.94 0.0032 SMOreg 0.98 0.04 Simple Linear Reg. 0.98 0.04 RBF Network 0.85 0.25 Pace Regression 0.98 0.05 Multilayer Perceptron 0.94 0.002 Linear Regression 0.98 0.04 Functions Lazy Meta Trees Rules Karar Ağaçları Çizelge 4.1., Çizelge 4.2., Çizelge 4.3., Çizelge 4.4., Çizelge 4.5. ve Çizelge 4.6. incelendiğinde üretilen değerlerin hepsinde birbirine çok yakın olduğu görülmüştür. Yukarıdaki çizelgelere bakılarak 3 faz akım, 3 faz gerilim, band geçiren filtre uygulanmış sol band 3 faz akım ve band geçiren filtre uygulanmış sağ band 3 faz akım verilerine birlikte ve ayrı ayrı VM uygulanmıştır. Ama çıkan sonuçlar çok benzer olduğundan dolayı sadece 3 faz akım verileriyle VM uygulaması yapmak yeterlidir. 64 Karar ağaçlarından elde edilen değerlere göre RepTree ve M5P-M4.0 karar ağaçlarında, korelasyon katsayısı 1 ve mutlak hata değeri 0 veya sıfıra çok yakın değerler almıştır. Bunun için Reptree ve M5P-M4.0 karar ağaçlarının ürettiği kurallar incelenmiştir. Şekil 4.18. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli Şekil 4.18.’de görülen RepTree karar ağacına 2700 satırlık veri girişi yapılmıştır ve üretilen kurallar ise şöyledir; • Eğer ı_2 değeri 1.79’a eşit veya büyükse 1. durum, (1. Kural) • Eğer ı_2 değeri 1.79’dan küçükse I1’e bakılır (2. Kural) o Eğer ı_1 değeri 1.96’ya eşit veya büyükse 2. durum, (3. Kural) o Eğer ı_1 değeri 1.96’dan küçükse 3. durum (4. Kural) meydana gelir. Burada ı_1 değeri 1. faz akımını ve ı_2 değeri 2. faz akımını göstermektedir. 1. durum motorda hata olmadığını, 2. durum motor sargı spirleri arasında kısa devre olduğunu ve 3. durum ise motorda mekanik dengesizlik hatasının olduğunu göstermektedir. 65 Şekil 4.19. 3 faz akım verilerine göre RepTree karar ağacı algoritması sonucunun ekran görüntüsü Şekil 4.18.’e göre çıkarılan kurallar ayrıca, Şekil 4.19.’da da kırmızı renkte çerçeve içine alınan bölümden de rahatlıkla çıkarılabilir. Kırmızı çerçeve içindeki bölüm 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu kurallardır. Kırmızı çerçeve içindeki lacivert renkli çemberlerin içindeki sayısal ifadeler (1, 2, 3) ise sırasıyla 1. durumu (sağlam motor), 2. durumu (sargı spirleri arasında kısa devre hatası bulunan motoru) ve 3. durumu (milinde mekanik dengesizlik hatası bulunan motoru) göstermektedir. 66 Çizelge 4.7. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden rastgele seçilmiş örnek değerler I1 I2 I3 Sonuç 1 1.9499 1.8453 1.8257 1.0 2 1.9341 1.8321 1.8517 1.0 3 1.8311 1.6824 2.1064 3.0 4 2.0636 1.7305 1.9948 2.0 5 2.07 1.731 1.9908 2.0 6 1.8223 1.6871 2.108 3.0 7 2.0731 1.7322 1.9851 2.0 8 1.9319 1.8344 1.8468 1.0 9 1.9341 1.8321 1.8517 1.0 10 1.8161 1.8008 2.1008 1.0 11 1.8479 1.7134 2.1436 3.0 12 1.8573 1.7031 2.1403 3.0 13 1.8658 1.6949 2.1277 3.0 14 1.9757 1.8311 1.8326 1.0 15 1.9336 1.827 1.8536 1.0 Çizelge 4.7.’deki 1.satırdaki değerlere bakıldığında I2 akımının değeri (1.8453) 1.79’dan büyük olduğu için sonucun 1.Kurala göre 1 nolu durumun çıkması gerekir, sonuçta zaten 1’dir. (DOĞRU) Çizelge 4.7.’deki 7. satırdaki değerlere bakıldığında I2 akımının değeri (1.7322) 1.79’dan küçük olduğu için I1 akımına bakılır (2.Kural), I1 akımının değeri (2.0731) 1.96’dan büyük olduğu için sonucun 3.Kurala göre 2. durumun çıkması gerekir, zaten sonuçta 2’dir. (DOĞRU) Çizelge 4.7.’deki 13. satırdaki değerlere bakıldığında ise I2 akımının değeri (1.6949) 1.79’dan küçük olduğu için I1 akımına bakılır (2.Kural), I1 akımının değeri (1.8658) 1.96’dan küçük olduğu için sonucun 3.Kurala göre 3. durumun çıkması gerekir, zaten sonuçta 3’tür. (DOĞRU) 67 RepTree karar ağacının ürettiği kurallar WEKA programına giriş olarak verilen 3 faz akım değerlerine uygulandığında geçerli olduğu görülmüştür. Yukarıdaki örnek satırlar ile bu kuralların doğruluğu görülmektedir. Şekil 4.20. 3 faz akım verilerine göre M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli Şekil 4.20.’de M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma modeline göre 3 durum oluşmaktadır. Oluşturulan bu sınıflandırma durumları LM 1, LM 2 ve LM 3 olarak Şekil 4.20.’de görülmektedir. M5P-M4.0 karar ağacı sadece 1. faz akımını kullanarak bir sınıflandırma gerçekleştirmiştir. 68 Şekil 4.21. 3 faz akım verilerine göre M5P-M4.0 karar ağacı algoritması sonucunun ekran görüntüsü Şekil 4.20.’de M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma modelindeki kurallar ayrıca, Şekil 4.21.’de verilen M5P-M4.0 karar ağacı algoritması sonucunun ekran görüntüsündeki kırmızı çerçeve içindeki bölümde de görülebilmektedir. Lacivert çerçeve içindeki ifadeler (LM 1, LM 2, LM 3)’de sınıflandırma durumlarını göstermektedir. M5P-M4.0 karar ağacından elde edilen sınıflandırma modeli ile kullanıcı direkt olarak sağlam ve hatalı motorları birbirinden ayırt edememektedir. Çünkü M5P-M4.0 karar ağacının ürettiği sınıflandırma modelinde, sınıflandırma işlemi için aşağıdaki denklemler otomatik olarak elde edilmiştir; • LM 1 durumu: sonuc = -0.0727 * I1 + 3.1253 • LM 2 durumu: sonuc = 0.1011 * I1 + 0.8117 69 LM 3 durumu: sonuc = 0.1011 * I1 + 1.7872 • Otomatik olarak M5P-M4.0 karar ağacının ürettiği bu kurallarda 1. faz akımı (I1) ayrıca üretilen katsayılarla çarpılarak ve toplanarak sınıflandırma yapılıyor. Çizelge 4.8. WEKA programına giriş olarak verilen 3 faz akımdan rastgele seçilmiş 1. faz akımına M5P-M4.0 karar ağacından elde edilen katsayıların uygulanması ve elde edilen sonuçlar I1 LM 1 LM 2 LM 3 Sonuç 1 1.9499 2.98 1.01 1.98 1 2 1.9341 2.98 1.01 1.98 1 3 1.8311 2.99 1.00 1.97 3 4 2.0636 2.98 1.02 2.00 2 5 2.07 2.97 1.02 2.00 2 6 1.8223 2.99 1.00 1.97 3 7 2.0731 2.97 1.02 2.00 2 8 1.9319 2.98 1.01 1.98 1 9 1.9341 2.98 1.01 1.98 1 10 1.9406 2.98 1.01 1.98 1 11 1.8479 2.99 1.00 1.97 3 12 1.8573 2.99 1.00 1.97 3 13 1.8658 2.99 1.00 1.98 3 14 1.9757 2.98 1.01 1.99 1 15 1.9336 2.98 1.01 1.98 1 Çizelge 4.8.’de 1.faz akımına M5P-M4.0 karar ağacından elde edilen katsayı değerleri uygulandığında elde edilen sonuçlar görülmektedir. Çizelge 4.8.’de 3., 6., 11., 12. ve 13. satırdaki LM 1 sütunundaki değerlerin aynı (2.99) olduğu ve sonuç sütununda ise bu satırlara karşılık 3 nolu sonuç değerinin olduğu görülmektedir. Yani M5P-M4.0 karar ağacından elde edilen LM 1 durumu motorun 3 nolu (Mekanik dengesizlik hatası) durumunu ifade etmektedir. 70 Aynı çizelgede 1., 2., 8., 9., 10., 14. ve 15. satırlardaki LM 2 sütunundaki değerlerin 1.01 olduğu ve sonuç sütunundaki değerin ise 1 olduğu görülmektedir. Buna göre M5P-M4.0 karar ağacından elde edilen LM 2 durumu motorun 1 nolu (sağlam) durumunu ifade etmektedir. Çizelge 4.8.’de 4., 5. ve 7. satırlardaki LM 3 sütunundaki değerlerin aynı (2.00) olduğu ve sonuç sütunundaki değerin ise 2 olduğu görülmektedir. Buna göre M5PM4.0 karar ağacından elde edilen LM 3 durumu motorun 2 nolu (sargı spirleri arasında kısa devre hatası) durumunu ifade etmektedir. Elde edilen bu sınıflandırma kurallarının geçerliliği Çizelge 4.8.‘deki verilerle test edildiğinde M5P-M4.0 karar ağacının da iyi bir sınıflandırma yaptığı görülmektedir. Ama kullanıcı oluşturulan LM 1, LM 2 ve LM 3 durumlarının sağlam motorumu yoksa hatalı motor durumlarını mı ifade ettiğini tam olarak bulamamaktadır. Ayrıca kullanıcı otomatik olarak üretilen katsayı değerlerini 1. faz akımı ile çarpmak ve toplamak zorundadır. Buradan elde edilecek sonuçlar ayrıca incelenecek ve bu değerlere göre sağlam ve hatalı durumlar ancak birbirinden ayrıştırılabilecektir. Ama RepTree karar ağacından elde edilen kurallarda ise hiç hesaplama yapmadan sadece akım değerlerine bakılarak sağlam ve hatalı durumlar birbirinden kolayca ayırt edilebilmekteydi. RepTree ve M5P-M4.0 karar ağaçları iyi bir sınıflandırma yapmalarına rağmen RepTree karar ağacının ürettiği kurallar kolay anlaşılabilir ve ekstra hesaplama işlemleri gerektirmemektedir. Böylece RepTree karar ağacının daha kullanışlı olduğu görülmektedir. Daha az veri ile VM’nin amacı, online durum izleme için az veri ile karar verme, kısa işlem süresi veya örnekleme zamanı için tercih edilebilir. Bu yüzden 2700 veri ile elde edilen sonuçların daha az veri ile yine aynı durumu sağlayıp sağlamadığını kontrol etmek için VM’ne uygulanan giriş verileri azaltıldığı zaman şu sonuçlara ulaşılmıştır. 71 Şekil 4.22. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (1800 veri) Şekil 4.22.’de RepTree karar ağacına giriş olarak 1800 satırlık 3 faz akım verisi uygulanmıştır. Elde edilen karar ağacı Şekil 4.18’de ki giriş olarak 2700 satırlık 3 faz akım verisi uygulanmış karar ağacı ile aynı sonucu vermiştir. Şekil 4.23. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (900 veri) Şekil 4.23.’de RepTree karar ağacına giriş olarak sadece 900 satırlık 3 faz akım verisi uygulanmıştır. Şekil 4.18. (2700 veri) ve Şekil 4.22. (1800 veri)’deki karar ağaçlarında bulunan kurallardan tek fark ise sadece 1. faz akımının ayırt edici değeri olan 1.96’nın 1.95 olarak değişmesidir. 72 Şekil 4.24. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (450 veri) Şekil 4.24.’de RepTree karar ağacının sadece 450 adet 3 faz akım giriş verisine göre otomatik olarak oluşturduğu kurallar görülmektedir. Giriş veri sayısı %50 azaltıldığı halde Şekil 4.23.’de ki kurallar ile Şekil 4.24.’de ki kurallar aynıdır. Şekil 4.25. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (225 veri) Şekil 4.25.’de RepTree karar ağacı algoritmasına sadece 225 adet 3 faz akım verisi girdi olarak verilmiş ve bunun sonucunda otomatik olarak üretilen kurallar görülmektedir. Burada diğer RepTree karar ağacı algoritmalarının sonucundan farklı olarak sadece 1. faz akımı ile sınıflandırma yapıldığı görülmektedir. 73 Şekil 4.25.’de görülen RepTree karar ağacına 225 satırlık veri girişi yapılmıştır ve üretilen kurallar ise şöyledir; • Eğer ı_1 değeri 1.9’dan küçükse 3. durum, (1. Kural) • Eğer ı_1 değeri 1.9’a eşit veya büyükse tekrar I1’e bakılır (2. Kural) o Eğer ı_1 değeri 2.01’e eşit veya büyükse 2. durum, (3. Kural) o Eğer ı_1 değeri 2.01’den küçükse 1. durum (4. Kural) meydana gelir. Burada ı_1 değeri 1. faz akımını göstermektedir. 1.durum motorda hata olmadığını, 2. durum motorun spirleri arasında kısa devre hatasının olduğunu ve 3. durum ise motor milinde mekanik dengesizlik hatasının olduğunu göstermektedir. Çizelge 4.9. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden sadece 1. faz akımı için rastgele seçilmiş örnek değerler I1 Sonuç 1 1.9499 1.0 2 1.9341 1.0 3 1.8311 3.0 4 2.0636 2.0 5 2.07 2.0 6 1.8223 3.0 7 2.0731 2.0 8 1.9319 1.0 9 1.9341 1.0 10 1.9261 1.0 11 1.8479 3.0 12 1.8573 3.0 13 1.8658 3.0 14 1.9757 1.0 15 1.9336 1.0 Çizelge 4.9.’da WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden sadece 1. faz akımı için rastgele seçilmiş örnek değerler görülmektedir. 74 Çizelge 4.9.’da 3.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri (1.8311) 1.9’dan küçük olduğu için sonucun 1.Kurala göre 3 nolu durumun çıkması gerekir, sonuçta zaten 3’tür. (DOĞRU) Çizelge 4.9.’da 7.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri (2.0731) 1.9’dan büyük olduğu için sonucun 2.Kurala göre tekrar I1 akımının değeri kontrol edilir. I1 akımının değeri (2.0731) 2.01’den büyük olduğu için 3.Kurala göre 2 nolu durumun çıkması gerekir, sonuçta zaten 2’dir. (DOĞRU) Çizelge 4.9.’da 14.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri (1.9757) 1.9’dan büyük olduğu için sonucun 2.Kurala göre tekrar I1 akımının değeri kontrol edilir. I1 akımının değeri (1.9757) 2.01’den küçük olduğu için 4.Kurala göre 1 nolu durumun çıkması gerekir, sonuçta zaten 1’dir. (DOĞRU) Çizelge 4.9.’da verilen diğer değerlerde kontrol edilirse hepsinde de doğru çıktığı görülmektedir. Bu da RepTree karar ağacının sadece 1. faz akımına göre yaptığı sınıflandırmanın doğru olduğunu göstermektedir. Artık sadece 1. faz akımına bakılarak motorun sağlam veya hatalı olduğu ve hatalı ise hangi hatanın olduğu tespit edilebilmektedir. Şekil 4.26. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (150 veri) Sadece 150 adet 3 faz akım verisi kullanılarak RepTree karar ağacı algoritmasının ürettiği sınıflandırma modeli Şekil 4.26.’da görülmektedir. Şekil 4.25.’de ve Şekil 75 4.26’da elde edilen sınıflandırma modelleri aynı olduğu için üretilen kurallarda aynıdır. Böylece Şekil 4.25.’deki kural yapısında geçerli olan kuralların daha az veri girişi ile de elde edilebildiği görülmektedir. Şekil 4.27. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu sınıflandırma modeli (75 veri) Şekil 4.27.’de 75 adet 3 faz akım verisi kullanılarak RepTree karar ağacı algoritmasının ürettiği sınıflandırma modeli görülmektedir. Şekil 4.25., Şekil 4.26 ve Şekil 4.27.’den elde edilen sınıflandırma modelleri aynı olduğu için üretilen kurallarda aynıdır. Böylece Şekil 4.25.’deki kural yapısında geçerli olan kuralların daha az veri girişi ile de elde edilebildiği görülmektedir. RepTree karar ağacı algoritmasına en az 75 adet 3 faz akım verisi girdi olarak verildiğinde sadece 1. faz akımına göre sağlam, hatalı motor ve hatalı motor durumlarının birbirinden ayırt edilebildiği kurallar otomatik olarak oluşturuluyor. Bu kurallara göre kullanıcı sadece 1. faz akımına bakarak; • motor sağlam, • sargı spirleri arasında kısa devre hatası var, • motor milinde dengesizlik hatası var. sonuçlarına ulaşabilir. 76 5. SONUÇ Asenkron motorlar değişik endüstriyel uygulamalarda yaygın olarak kullanılmaktadır. Bu motorlar sağlam yapıda olmalarına rağmen elverişsiz ortamlara maruz kalmalarından dolayı hatalar oluşmaktadır. Başlangıç seviyesindeki hatalar erken bir safhada tespit edilemezse, hem kendisi hem de sistemin çalışması zarar görebilir ve üretim kayıplarına neden olabilir. Son yirmi yılda çalışılan en önemli alan motorun performans karakteristikleri ve asenkron motor hatalarının tespiti ve analizi olmuştur. Asenkron motorlarda hata tespiti için değişik yöntemler kullanılmaktadır. Parametre tahmini ve diğer model tabanlı teknikler sistemin matematiksel modeline dayandığından, motor belli bir süre sonra aşındığından bu modeller motorun durumunu tam olarak ifade etmeyebilir. Hata tespiti için kullanılan diğer bir yöntem ise makine veya motorun bir eleman tarafından sürekli gözlemlenmesidir. Burada sistemin matematiksel modeli bilinmeden gözlem yoluyla hata tespiti yapılabilir. Fakat böyle bir yöntem hem zaman alıcı hem de pahalıdır. Akıllı bir hata tespiti için yumuşak hesaplama ve işaret işleme tabanlı yöntemlerde literatürde yoğun olarak kullanılmaya başlanmıştır. Tezde asenkron motorlarda hata tespiti için literatürdeki tekniklerden farklı olarak yeni bir alan olan VM tekniği kullanılmıştır. Veri hacmi arttıkça bunların işlenmesi ve istenilen bilgilere ulaşmak oldukça güçleşecektir. VM burada devreye girer; VM büyük miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak bağıntı ve kuralların aranmasıdır. Yani, VM büyük miktarlardaki verinin içinden anlamlı ve yararlı ilişki ve kuralların bilgisayar programları aracılığıyla aranması ve analizidir. VM’nde ne kadar çok veri kullanılırsa, sistemin tüm sürecini kapsayacak veri kümesi ile daha geçerli kurallar çıkarılabilir. Bu amaçla piyasada birçok VM yazılımı mevcuttur. Tezde, Java dili kullanılarak geliştirilmiş, içinde birçok öğrenme algoritması bulunan, tüm işletim sistemlerinde çalışabilen açık kaynak kodlu WEKA VM yazılımı kullanılmıştır. 77 Tezde, üç fazlı bir asenkron motorun sargı spirleri arasında oluşabilecek kısa devre veya yalıtım bozuklukları ile motor milinde oluşabilecek mekanik dengesizlik hataları, üç faz akım ve gerilim bilgilerinin RMS değerlerindeki değişim, VM ile izlenerek tespit edilmiştir. Motor faz akım spektrumunda yan band olarak görülen bileşenlerin genlik değişimi bir band geçiren filtre ile izlenmiştir. Filtre belirli frekans aralığını geçirip ilgili bileşenin dışındaki tüm genlik değerlerini söndürdüğü için VM ile hata tespitinde geçerli sonuç alınamamıştır. Bu yüzden spektrum analizi sadece mekanik dengesizliğinin tespitinde sonuç verirken VM ile her iki hata durumu da tespit edilebilmektedir. VM tekniklerinden biri olan sınıflandırma tekniği, verinin önceden belirlenen çıktılara uygun olarak ayrıştırılmasını sağlayan bir tekniktir. Çıktılar, önceden bilindiği için sınıflama, veri kümesini denetimli olarak öğrenir. Temel sınıflandırma tekniklerinden biri olan karar ağaçları da; verileri belli nitelik değerlerine göre sınıflandırmaya yarar. WEKA yazılımında birçok karar ağacı algoritması bulunmaktadır. Hazırlanan veri paketleri WEKA’daki karar ağaçları ile analiz edilmiştir. En iyi sonucu RepTree ve M5P-M4.0 karar ağaçları vermiştir. M5P-M4.0 karar ağacı çok iyi bir sınıflama yapmasına rağmen kullanıcıyı tam olarak bilgilendirmemektedir. Ancak RepTree karar ağacından elde edilen kurallar ile kullanıcı elindeki verilere bakarak, motor hatalarının tespitini ve sınıflandırmasını yapabilmektedir. Ayrıca kullanıcı bu karara sadece tek bir faz akımı ve belli bir miktardaki veriye bakarak varabilmektedir. Hem sargı spirleri arasında kısa devre hem de mekanik dengesizlik gibi aynı anda motorda birden fazla hata varsa, bu gibi durumlarda VM’ne bilgiler girilirken, gerekli hata kodlama işlemi yapılır ve bu gibi durumlardaki hatalarda tespit edilebilir. VM ile durum izleme sisteminin avantajları; • motor ait ön bilgi gerektirmez, 78 • Matematiksel modelleme gibi karmaşık hesaplama gerektiren işlemlere ihtiyaç duyulmaz, • Ayrıca hata sınıflandırmasında kullanılmak üzere belli bir eşik değeri tespit edilmesini sağlar. Bu yüzden VM klasik yöntemlerin önüne geçmiştir. Bu avantajlardan yararlanarak, frekans düzlemindeki genlik değerleri her bir şart için VM sürecine verilerek, izlenecek parametrenin genlik eşik değerleri tespit edilebilir. RMS’deki artışın hatadan mı, yoksa motor yük değişiminden veya diğer sebeplerden mi olduğunu ayırt edebilmek için motor hızı veya şebeke gerilimi RMS değerleri gibi ilave sinyallerde kontrol edilmelidir. Tezde kullanılan VM yaklaşımı ile asenkron motorlarda hata tespiti için yeni bir çözüm sunulmaktadır. Ancak, temel niteliğindeki bu çalışma farklı güç ve farklı marka motorlardan alınan verilerle test edilmelidir. Yine asenkron motorların diğer hatalarının da VM ile çözümünün yapılabilirliği araştırılmalıdır. Gelecek çalışmalarda VM’den elde edilen algoritmaların DSP sürücülerine entegre edilebilirliği araştırılabilir. 79 6. KAYNAKLAR Akbulut, S., 2006. Veri Madenciliği Teknikleri ile Bir Kozmetik Markanın Ayrılan Müşteri Analizi ve Müşteri Segmentasyonu. G.Ü. Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, 91s, Ankara. Akpınar, H., 2000. Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği. http://www - . isletme.istanbul.edu.tr/dergi/nisan2000/1.htm Erişim Tarihi: 20.04.2007 Alpaydın, E., 2000. Zeki Veri Madenciliği: Ulaşma Yöntemleri, Ham Veriden Altın Bilgiye www.cmpe.boun.edu.tr/~ethem/files/papers/veri- maden_2k- notlar.doc Erişim Tarihi: 11.05.2007. Aryeetey, K., 2003. Data Analysis and Predictive Modelling Using The Variable Precision Rough Set Approach. M. Sc. Thesis, Faculty of Graduate Study and Research of University of Regina, 87p, Canada. Ayaz, E., Şeker, S., 2002. İleri İşaret İşleme Yöntemleri ile Elektrik Motorlarında Rulman Arıza Tanısı. İTÜ Dergisi/d, 1 (1), 23-34. Aydın, İ., Karaköse, M., Akın, E., 2005. Asenkron Motorlarda Hata Teşhisi için Yeni Bir Yumuşak Hesaplama Yaklaşımı. Otomatik Kontrol Ulusal Toplantısı, TOK’05, 375-380. Aydın, İ., Karaköse, M., Akın, E., 2005. Zaman Serileri Veri Madenciliği Tekniği Kullanılarak Asenkron Motorlarda Sarım ve Sürtünme Hatalarının Teşhisi. 11. Elektrik Elektronik Bilgisayar Mühendisliği Ulusal Kongresi, 124-127. Aydın, İ., Karaköse, M., Akın, E., 2006. Asenkron Motorlarda Arıza Teşhisi için Zaman Serileri Veri Madenciliği ve Yapay Sinir Ağı Tekniklerinin Kullanımı. Otomatik Kontrol Ulusal Toplantısı, TOK’06, 153-158. 80 Aydoğan, F., 2003. E-Ticarette Veri Madenciliği Yaklaşımlarıyla Müşteriye Hizmet Sunan Akıllı Modüllerin Tasarımı ve Gerçekleştirimi. H.Ü. Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, 179s, Ankara. Bae, H., Kim, S., Kim, Y., Lee, S, 2005. Application of Time-Series Data Mining for Fault Diagnosis of Induction Motors. Springer-Verlag Berlin Heildberger, 1085-1094. Bangura, J., Povinelli, R., Demerdash, N., Brown, R., 2003. Diagnostics of Eccentricities and Bar/End-Ring Connector Breakages in Polyphase Induction Motors Through a Combination of Time-Series Data Mining and Time-Stepping Coupled FE–State-Space Techniques. IEEE Transactions on Industry Applications, 39 (4), 1005-1013. Bland, C., 2002. The Discovery of Multiple Level Profile Association Rules. Ph. D. Thesis, Graduate School of Computer and Information Science of University of Missisipi, 123p, Missisipi. Çeştepe, E., Eren, A., 2005. Dedektif Multimetre Arıza Erken Uyarı Sistemlerinde Uygulanabilecek En Kolay ve En Ekonomik Çözüm. 3E Dergisi, 128, 24-27. Frawley, W. J., Piatetsky-Shapiro, G., Matheus, C. J., 1991. Knowledge Discovery D atabases: An Overview, in Knowledge Discovery in Databases. Cambridge, MA: AAAI/M1T, 1-27. Gao, X., S. Ovaska. 2001. Soft Computing Methods in Motor Fault Diagnosis. Applied Soft Computing, 1, 73-81. Hair, J., Ronald, L., Rolph, E., Black, W., 1998. Multivariate Data Analysis. New Jersey: Prentice Hall. 81 Huberty, C., 1994. Applied Discriminant Analysis. John Wiley & Sons Inc., Canada, 25-35. Hudairy, H., 2004. Data Mining and Decision Making Support in The Governmental Sector. M. Sc. Thesis, Faculty of Graduate School of The University of Louisville, 100p, Kentucky. Hui, S., Jha, G., 2000. Application Data Mining for Customer Service Support. Information and Management, 38, 1-13. Kalıkov, A., 2006. Veri Madenciliği ve Bir E-Ticaret Uygulaması. G.Ü. Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, 94s, Ankara. Kowalski, C., Kowalska, T., 2003. Neural Networks Application for Induction Motor Faults Diagnosis. Mathematics and Computers in Simulation, 63, 435–448. Nandi, S., Toliyat, H., Li,X., 2005. Condition Monitoring and Fault Diagnosis of Electrical Motors. IEEE Transactions on Energy Conversion, 20 (4), 719-729. Nath, S., 2003. Data Warehousing and Mining: Customer Churn Analysis in the wireless Industry. M. Sc. Thesis, Florida Atlantic University, 68p, Boca Raton, Florida. Oğuzlar, A., 2003. Veri Önişleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 21, 67-76. Pawlak, Z., 2002. Rough Sets, Decision Algorithms and Bayes Theorem. Europen Journal of Operation Research, 136, 181-189. 82 Povinelli, R., Bangura, J.,Demerdash, N., Brown, R.,2002. Diagnostics of Bar and End-Ring Connector Breakage Faults in Polyphase Induction Motors Through a Novel Dual Track of Time-Series Data Mining and Time-Stepping Coupled FE-State Space Modeling. IEEE Transactions on Energy Conversion, 17 (1), 39-46. Shah. S., Kursak. A., 2004. Data Mining and Genetic Algorithms Based Gene / SNP Selection. Artificial Intelligence in Medicine, 31, 183 -196. Shearer, C., 2000. The Crisp-DM Model: The New Blueprint for Data Mining. Journal of Data Warehousing, 5 (4), 13-23. Wei, C., Chiu T., 2002. Turning Telecommunications Call Details to Churn Prediction: A Data Mining Approach. Expert Systems with Applications, 23, 93-102. Witten I., Frank E., 2000. Data Mining: Practical Machine Learning Tools and Techniques With Java Implementations. Morgan Kaufmann Publishers, San Fransisco, 120-129, 267-277. Zhang, L., Jack, L., Nandi, A., 2005. Fault Detection Using Genetic Programming. Mechanical Systems and Signal Processing, 19, 271–289. 83 EK-1 WEKA programına giriş olarak verilen .arff dosyasının içeriği. % Created by Cahit Arf at 18 Nis 2007 13:30:08 @RELATION noname @ATTRIBUTE v_1 real @ATTRIBUTE v_2 real @ATTRIBUTE v_3 real @ATTRIBUTE ı_1 real @ATTRIBUTE ı_2 real @ATTRIBUTE ı_3 real @ATTRIBUTE sonuc real @DATA 217.5731,221.5576,223.5613,1.9757,1.8311,1.8326,1.0 217.6274,221.0508,223.9795,1.9723,1.8332,1.8272,1.0 217.7997,220.4641,224.3251,1.9689,1.8391,1.8264,1.0 218.0769,219.9271,224.4891,1.9611,1.8409,1.8233,1.0 218.5142,219.427,224.6064,1.9571,1.8451,1.8259,1.0 218.9925,218.9756,224.5166,1.9499,1.8453,1.8257,1.0 219.554,218.6104,224.3348,1.946,1.8472,1.8306,1.0 220.1177,218.3508,224.0108,1.9406,1.8448,1.8321,1.0 220.6191,218.2279,223.5553,1.9373,1.8441,1.8363,1.0 221.0814,218.2519,223.0381,1.9347,1.8415,1.8384,1.0 221.4678,218.4402,222.4567,1.9349,1.8402,1.8443,1.0 221.734,218.7459,221.9115,1.9319,1.8344,1.8468,1.0 221.8663,219.1553,221.4081,1.9341,1.8321,1.8517,1.0 221.8666,219.6116,220.9599,1.9336,1.827,1.8536,1.0 221.7361,220.104,220.6171,1.9382,1.8247,1.8595,1.0 221.4394,220.6523,220.3218,1.9406,1.8205,1.8621,1.0 . . . . 221.6162,219.5433,221.104,2.0415,1.7465,1.9944,2.0 221.5222,220.0388,220.7683,2.0442,1.7419,1.9969,2.0 221.2424,220.6336,220.4772,2.0491,1.7395,2.0011,2.0 220.7324,221.2282,220.3383,2.0532,1.7348,1.9996,2.0 220.1463,221.6926,220.4362,2.0595,1.7336,1.9997,2.0 219.5802,222.0542,220.734,2.0636,1.7305,1.9948,2.0 219.0303,222.3368,221.0477,2.07,1.731,1.9908,2.0 218.4202,222.5204,221.4797,2.0731,1.7322,1.9851,2.0 217.8681,222.4612,222.0391,2.078,1.736,1.9809,2.0 217.5595,222.3035,222.7031,2.0794,1.7396,1.9743,2.0 84 217.3544,222.0067,223.3116,2.083,1.7457,1.9713,2.0 217.18,221.5412,223.9053,2.0792,1.7493,1.9648,2.0 217.2205,220.8884,224.4014,2.0757,1.7549,1.962,2.0 217.4268,220.2323,224.7593,2.0677,1.7575,1.9579,2.0 217.8024,219.6937,224.9432,2.0628,1.7628,1.9591,2.0 218.1762,219.1413,225.0124,2.0549,1.7635,1.9581,2.0 218.7126,218.6204,224.9513,2.0498,1.7658,1.9622,2.0 219.3597,218.266,224.6769,2.0438,1.7652,1.9647,2.0 219.9597,218.0793,224.3179,2.0407,1.7649,1.9695,2.0 220.45,217.9761,223.8578,2.0371,1.7613,1.9722,2.0 220.949,217.9908,223.2915,2.036,1.7599,1.9776,2.0 221.3415,218.2871,222.6476,2.0351,1.7554,1.9804,2.0 221.5507,218.7068,222.0055,2.0377,1.7524,1.9863,2.0 221.5827,219.1814,221.525,2.0386,1.7474,1.9898,2.0 221.4804,220.245,220.6716,2.0464,1.7398,1.9972,2.0 221.0552,220.863,220.4424,2.0527,1.7384,2.0007,2.0 220.5766,221.3988,220.4075,2.0572,1.7349,1.9992,2.0 220.0296,221.8139,220.5276,2.0629,1.7336,1.9981,2.0 219.4209,222.2233,220.6648,2.0668,1.7306,1.9935,2.0 218.7404,222.4568,221.0348,2.0716,1.7319,1.9891,2.0 218.2221,222.524,221.5526,2.0763,1.7332,1.9826,2.0 217.823,222.5019,222.1404,2.0791,1.7381,1.9782,2.0 217.4783,222.2738,222.7225,2.0809,1.7415,1.9722,2.0 . . . . . 220.0651,214.3002,228.4867,1.8181,1.6987,2.0641,3.0 220.7068,214.0496,228.2559,1.8381,1.7348,2.1072,3.0 221.2984,213.8349,227.8658,1.811,1.6993,2.0717,3.0 221.7459,213.7593,227.2815,1.8339,1.7337,2.117,3.0 222.1963,213.8841,226.749,1.8083,1.6981,2.08,3.0 222.5378,214.2808,226.1417,1.8336,1.7287,2.1264,3.0 222.6653,214.6974,225.598,1.8116,1.6947,2.0918,3.0 222.6144,215.1459,225.0962,1.8394,1.7211,2.1365,3.0 222.5404,215.6683,224.6651,1.8161,1.6908,2.1008,3.0 222.282,216.3035,224.386,1.8479,1.7134,2.1436,3.0 221.7975,216.8366,224.1733,1.8223,1.6871,2.108,3.0 220.6868,217.7849,224.3503,1.8311,1.6824,2.1064,3.0 220.0563,218.1936,224.6839,1.8658,1.6949,2.1277,3.0 219.3962,218.3195,225.0848,1.838,1.6786,2.0987,3.0 218.9093,218.3027,225.5948,1.8711,1.6949,2.1101,3.0 218.5402,218.2216,226.2154,1.8437,1.6801,2.0894,3.0 218.2364,217.9797,226.8824,1.8727,1.702,2.0949,3.0 218.0113,217.4345,227.4259,1.8464,1.686,2.0816,3.0 218.0441,216.8722,227.8833,1.863,1.7104,2.081,3.0 218.2579,216.3335,228.3875,1.8427,1.6935,2.0763,3.0 85 ÖZGEÇMİŞ Adı Soyadı : Kıyas KAYAALP Doğum Yeri ve Yılı : Isparta, 1976 Medeni Hali : Evli Yabancı Dili : İngilizce Eğitim Durumu (Kurum ve Yıl) Lise : Isparta Teknik Lisesi, 1994 Lisans : Marmara Üniversitesi Teknik Eğitim Fakültesi, Elektronik Bilgisayar Eğitimi, 1999 Çalıştığı Kurum/Kurumlar ve Yıl 1999-2000 Isparta Anadolu Teknik, Teknik ve Endüstri Meslek Lisesi, Bilgisayar Öğretmeni 2000-2001 Isparta Anadolu Teknik, Teknik ve Endüstri Meslek Lisesi, Bilgisayar Bölümü Şefi 2001- Süleyman Demirel Üniversitesi, Uluborlu Selahattin Karasoy Meslek Yüksekokulu Öğretim Görevlisi 86