Öncelikle Orjinal çalışmadan bahsedelim ;
Complete Gradient Clustering Algorithm for Features Analysis of X-Ray Images
Abstract
Methods based on kernel density estimation have been successfully applied for various data mining tasks. Their natural interpretation together with suitable properties make them an attractive tool among others in clustering problems. In this paper, the Complete Gradient Clustering Algorithm has been used to investigate a real data set of grains. The wheat varieties, Kama, Rosa and Canadian, characterized by measurements of main grain geometric features obtained by X-ray technique, have been analyzed. The proposed algorithm is expected to be an effective tool for recognizing wheat varieties. A comparison between the clustering results obtained from this method and the classical k-means clustering algorithm shows positive practical features of the Complete Gradient Clustering Algorithm.
X-Işını tekniği dedikleri bir metodla çektikleri görüntüler üzerinden çıkardıkları özniteliklerle, "Complete Gradient Clustering Algorithm"kullanılarak sınıflandırma çalışması yapılmış.
Biz bu çalışmanın veri setine The UCI Machine Learning Repository den ulaştık.
http://archive.ics.uci.edu/ml/datasets/seeds
Veri setininin tanıtımı şöyle yapılmış ;
The examined group comprised kernels belonging to three different varieties of wheat: Kama, Rosa and Canadian, 70 elements each, randomly selected for the experiment. High quality visualization of the internal kernel structure was detected using a soft X-ray technique. It is non-destructive and considerably cheaper than other more sophisticated imaging techniques like scanning microscopy or laser technology. The images were recorded on 13x18 cm X-ray KODAK plates.
Studies were conducted using combine harvested wheat grain originating from experimental fields, explored at the Institute of Agrophysics of the Polish Academy of Sciences in Lublin.
The data set can be used for the tasks of classification and cluster analysis.
Attribute Information:
To construct the data, seven geometric parameters of wheat kernels were measured:
1. area A,
2. perimeter P,
3. compactness C = 4*pi*A/P^2,
4. length of kernel,
5. width of kernel,
6. asymmetry coefficient
7. length of kernel groove.
All of these parameters were real-valued continuous.
Bu veri setini FannTool'u kullanarak YSA ile sınıflandırmayı deneyeceğiz.
Öncelikle Veri setini inceliyoruz
http://archive.ics.uci.edu/ml/machine-learning-databases/00236/seeds_dataset.txt
Veri setimiz 7 giriş ve 1 çıkış dan oluşuyor
1 çıkış değerimiz 3 buğday türü için bir sınıflandırma içerdiğinden
biz o bir sutunu her bir sınıf için bir sutun haline getiriyoruz yani
Kama için 1 0 0
Rosa için 0 1 0
Canadian 0 0 1
Sonuçda 7 giriş 3 çıkışlı bir veri setimiz oluyor
bu verileri bir text dosyasına kaydedip, FannTool'un DataProcessing kısmıyla açıyoruz
7 giriş 3 çıkış üzere ayarlayıp
sonrasında oluşan dosyalarımız
seed-scale.txt : Ölçeklendirme bilgilerini tutan dosya
seed-train.dat : Eğtim verileri
seed-test.dat : Test Verileri
Artık yapmamız gereken şey Eğitim ve test verilerini yükleyip. YSA için değişik yapılarda ve değişik eğitim algoritmaları ve paramtereleri ile denemeler yapmak.
Sonuç :
Yapılan pek çok denemenin ardından oldukça başarılı Sınıflandırma başarılarına ulaşıldı
Eğitim Verisi için % 99,32 ( 146 verinin 145 adedi doğru sınıflandırıldı )
Test Verisi için % 96,88 ( 64 verinin 62 adedi doğru sınıflandırıldı )
0 yorum:
Yorum Gönder