Araştırmanın amacı, ortaokul öğrencilerinin STEM mesleklerine olan ilgilerini veri madenciliği kullanarak incelemektir. Veri madenciliği son yıllarda eğitim de dâhil olmak üzere farklı alanlarda başarıyla kullanılan veri analizi yöntemlerinden birisidir. Bu çalışmada eğitsel veri madenciliği yöntemlerinden sınıflandırma analizi ve karar ağacı teknikleri kullanılmıştır. Araştırmanın örneklemini İstanbul'un çeşitli semtlerinde bulunan farklı sınıflardan 300 ortaokul öğrencisi oluşturmaktadır. Araştırma betimsel bir özelliğe sahip olup genel tarama modeline uygun olarak yürütülmüştür. Araştırmada veriler Fen, Teknoloji, Matematik ve Mühendislik Mesleklerine Yönelik İlgi Ölçeği (FeTeMM-MYİÖ) aracılığıyla toplanmıştır. FeTeMM-MYİÖ dört alt boyuttan (fen, matematik, teknoloji, mühendislik meslekleri) ve kişisel bilgiler bölümünden oluşmaktadır. Ölçeğin kişisel bilgiler bölümünde yer alan bilgiler öğrencilerin okul türü, sınıf düzeyi, cinsiyeti, akademik başarı seviyesi, anne ve baba mesleği, anne ve baba eğitim düzeyi, gelir düzeyi, ailedeki birey sayısı, kardeş sayısı ile ilgili olup bu araştırmada etkisi araştırılan değişkenlerdir. Araştırma sonuçlarına göre J48 algoritması, verilerin sınıflandırılmasında en yüksek doğruluk oranına sahip algoritmadır. Öğrencilerin STEM mesleklerine olan ilgilerinde en önemli etkiye baba mesleği değişkeninin sahip olduğu görülmektedir. Ayrıca, sınıflamada baba mesleği değişkeninden sonra en önemli etkiye sırasıyla anne mesleği, anne eğitim düzeyi ve cinsiyet değişkenleri sahiptir. Araştırmada incelenen diğer değişkenlerin etkisi ile ilgili olarak daha farklı gruplarla çalışılabilir. Lise yıllarında öğrencilerin STEM mesleklerine olan ilgilerinin değişip değişmediğini ölçmek için boylamsal bir araştırma yapılabilir. Bu çalışmanın veri madenciliğinin eğitim bilimleri alanına uygulanmasına bir örnek olması açısından ileriki çalışmalara ışık tutacağı düşünülmektedir.
The aim of the study is to examine middle school students’ interest in STEM professions using data mining. Data mining is one of the data analysis methods used successfully in different fields, including education, in recent years. Classification analysis and decision tree techniques, which are among the educational data mining methods, are used in this study. The sample of the study consists of 300 middle school students from different classes in various districts of Istanbul. The research has a descriptive feature and is conducted in accordance with the general survey model. The data in the study were collected through the STEM Career Interest Survey (STEM-CIS). STEM-CIS consists of four sub-dimensions (science, mathematics, technology, engineering professions) and personal information sections. The information in the personal information section of the scale is related to the type of school, grade level, gender, academic achievement, mother and father occupation, education level of the mother and father, income level, number of family members, number of siblings and are the variables whose effects have been investigated in this study. According to the results of the research, J48 algorithm is the algorithm with the highest accuracy rate in classifying data. It is seen that the father occupation variable has the most important effect on students’ interest in STEM professions. In addition, in the classification, after the father occupation variable, the variables of mother occupation, mother's education level and gender have the most important effects, respectively. Regarding the effect of other variables examined in the study, different groups can be studied. A longitudinal study can be conducted to measure whether students’ interest in STEM professions has changed during high school years. It is thought that this study will shed light on future studies in terms of being an example of the application of data mining to the field of educational sciences.