İş Memnuniyeti Faktörlerini Belirlemek ve Analiz Etmek için Çevrimiçi Çalışan Değerlendirmelerini Kullanan ilgili Makine Öğrenmesi ve Topluluk Öğrenmesi Tabanlı Yöntem

Bu çalışmada, makine öğrenmesi tekniklerinin sınıflandırmada yüksek performans elde edebileceği ve büyük veri setleri ile etkin ve ölçeklenebilir bir şekilde çalışabileceği vurgulanmıştır. Bu çalışmada kullanılan veri seti www.kaggle.com adresinden elde edilmiştir. Google, Amazon, Netflix, Facebook, Apple ve Microsoft'ta çalışan kişilerden toplanan toplam 67529 yorum değerlendirilmiştir. N-gram modeli, metin madenciliğinde önemli bir temsil şemasıdır. N-gram modelleri, unigram modeli (N = 1), bigram (N = 2) ve trigram (N = 3) şeklindedir. TP, TF ve TF-IDF olmak üzere üç farklı ağırlıklandırma şeması ve N-gram modeli (bigram, unigram ve trigram) olarak geleneksel makine öğrenmesi tabanlı analiz için üç farklı ağırlıklandırma şeması kullanılmıştır. Modelleri eğitmek için beş farklı denetimli öğrenme algoritması kullanılmıştır: Naive Bayes, Destek Vektör Makineleri (SVM), Lojistik Regresyon (LR), K-En Yakın Komşu (KNN) ve Rastgele Orman (RF).

Machine Learning and Ensemble Learning Based Method Using Online Employee Assessments to Identify and Analyze Job Satisfaction Factors

In this paper it was emphasized that machine learning techniques can achieve high performance in classification and work effectively and scalably with large data sets. The dataset used in this study was obtained from www.kaggle.com. A total of 67529 comments collected from people working at Google, Amazon, Netflix, Facebook, Apple and Microsoft were evaluated. The N-gram model is an important representation scheme in text mining. N-gram models are the unigram model (N = 1), bigram (N = 2), and trigram (N = 3). Three different weighting schemes as TP, TF, and TF-IDF, and three different weighting schemes for traditional machine learning-based analysis as N-gram model (bigram, unigram and trigram) was used. Five supervised learning algorithm was used to train models: Naive Bayes, Support Vector Machines (SVM), Logistic Regression (LR), K-Nearest Neighbor (KNN) and Random Forest (RF).

___

  • Kaynar, O., Yıldız, M., Görmez, Y., Albayrak, A. 2016. Makine Öğrenmesi Yöntemleri ile Duygu Analizi. International Artificial Intelligence and Data Processing Symposium (IDAP'16), 17-18 Eylül, Malatya, 1-8
  • Kazan, S., Karakoca, H. 2019. Makine Öğrenmesi ile Ürün Kategorisi Sınıflandırma. Sakarya University Journal of Computer and Information Sciences, 2(2019), 1-10
  • Liu, H., & Zhang, S. (2012). Noisy data elimination using mutual k-nearest neighbor for classification mining. Journal of Systems and Software, 85(5), 1067-1074.
  • Kalaycı, T. E. (2018). Kimlik hırsızı web sitelerinin sınıflandırılması için makine öğrenmesi yöntemlerinin karşılaştırılması. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 24(5), 870-878.
  • Dietterich, T. G. (2000, June). Ensemble methods in machine learning. In International workshop on multiple classifiersystems (pp. 1-15). Springer, Berlin, Heidelberg
  • Onan A., Korukoğlu S., Bulut H., Ensemble of keyword extraction methods and classifiers in text classification, Expert Systems with Applications, 2016, 57, 232-247.
  • Breiman L. Random forests. MachLearn 2001, 45: 5-32
  • Ho, T. K. (1998). Ther and om subspace method forc onstructing decision forests. IEEE transactions on pattern analysis and machine intelligence,20(8), 832-844
  • Polikar R. Ensemble learning. In: Zhang C, Ma Y (eds). Ensemble machine learning. Springer Science, Business Media, 2012: 1-34.
  • Wolpert DH. Stacked generalization. NeuralNetw 1992, 5: 241-59.
  • Kaynar, O., Yıldız, M., Görmez, Y., & Albayrak, A. (2016). td öğrenmesi yöntemleri ile Duygu Analizi. In International Artificial Intelligence and Data Processing Symposium (IDAP'16) (pp. 17-18)
Avrupa Bilim ve Teknoloji Dergisi-Cover
  • Yayın Aralığı: Yılda 4 Sayı
  • Başlangıç: 2013
  • Yayıncı: Osman Sağdıç
Sayıdaki Diğer Makaleler

Gölcük/Isparta ve Yakın Çevresinde Yer Alan Kayaçların Doğal Radyoaktivite Özelliklerinin İncelenmesi

Osman ÇOBAN, M. Nuri DOLMAZ, Ezgi ERBEK-KIRAN, Ömer ELİTOK

Araç Aydınlatma Sisteminde Yoğuşma Bölgesi Tahmini ve Yoğuşmanın Sayısal Analiz ile Belirlenmesi ve Karşılaştırılması

Kemal Furkan SÖKMEN, Erol KOCABIYIK, Yunus MEŞECİ, Onur Kadir RENÇBER

Müzik Veri Setinin Analizi ve Sınıflandırma Algoritmaları Kullanılarak Şarkı Türü Tahminleme Çalışması

Berke Bartuğ SEVİNDİK, Vahide BULUT

4-Vynilbenzil Grubu Taşıyan Benzimidazol Fonksiyonelleştirilmiş PEPPSI tipi Pd(II)NHC Komplekslerinin Dizaynı, Sentezi, Karakterizasyonu ve Doğrudan Arilasyon Reaksiyonundaki Katalitik Aktivitesi

Semra DAŞGIN, Yetkin GÖK, Aydın AKTAŞ

Açıklanabilir Yapay Zeka Destekli Evrişimsel Sinir Ağları Kullanılarak Maymun Çiçeği Deri Lezyonunun Sınıflandırılması

Korhan Deniz AKIN, Caglar GURKAN, Abdulkadir BUDAK, Hakan KARATAŞ

MRG Veri Tabanında U-Net ile Otomatik Kafatası Çıkartma ve Beyin Segmentasyonu

Alperen DERİN, Ahmet Furkan BAYRAM, Caglar GURKAN, Abdulkadir BUDAK, Hakan KARATAŞ

CT Modalitesinde U-Net Tabanlı Segmentasyon Ağlarını Kullanarak Pankreas Segmentasyonu: Karşılaştırmalı Bir Analiz

Alperen DERİN, Caglar GURKAN, Abdulkadir BUDAK, Hakan KARATAŞ

Karar Ağaçları Kullanılarak Klinik Verilerle Covid-19 Enfeksiyonunun İncelenmesi

Fırat ORHANBULUCU, Fatma LATİFOĞLU

Covid-19 Salgın Döneminde Öğrenilen Tüketici Alışveriş Davranışlarının Kalıcılığının Araştırılması

Müzeyyen ÖZHAVZALI

İskemik İnme Lezyon Segmentasyonunda Segmentasyon Ağlarının ve Kayıp Fonksiyonlarının Etkilerinin Analizi

Ahmet Furkan BAYRAM, Alperen DERİN, Caglar GURKAN, Abdulkadir BUDAK, Hakan KARATAŞ