Günümüzde teknolojinin gelişmesi, internetin hayatımıza girmesi ve veri boyutlarındaki hızlı artış farklı kavramların hayatımıza girmesine neden olmuştur. Veri boyutundaki bu hızlı artışla karşımıza verilerin saklanması ve yorumlanması gibi sorunlar ortaya çıkarmıştır. Bunun yanı sıra, oluşan veri yığınlarının boyutu ile paralel olarak verilerin tutulduğu veri tabanlarının boyutlarında da artışlar gözlenmiştir (Taşdemir, 2012; Atalay ve Çelik, 2017). Büyük veri tabanlarında saklanan bu veriler, verinin hacimi (volume), verinin çeşitliliği (variety), veriye ait hız (velocity), doğrulama (verification), değer (value), gerçeklik (veracity), değişkenlik (variability), hassaslık (vulnerability) görselleştirme (visualization) gibi farklı kavramlara sahiptir. Bu veriler işlenmemiş bir şekilde değersiz olup ancak bir amaç doğrultusunda işlendiği zaman bilgiye dönüşüp değer kazanabilmektedirler (Savaş, Topoğlu ve Yılmaz, 2012). Ancak yüksek miktardaki ham verilerin analiz edilerek içerisinden anlamlı bilgilerin çıkarılması noktasında klasik istatistiksel yöntemler yetersiz kalmaktadır (Ayık, Özdemir ve Yavuz, 2007; Şengür ve Tekin, 2013; Türel ve Baz, 2016). Bu yüzden ham veriyi anlamlı hale getirme konusunda araştırmacılar tarafından farklı disiplinlere ve analiz yöntemlerine ihtiyaç duyulmuştur. Bu tarz büyük verilerin arasındaki örüntülerin keşfedilerek anlamlı bilgi haline getirilmesi veri madenciliği yöntemleri ile sağlanabilmektedir. Baker (2004) veri madenciliğini, farklı sınıflandırma algoritmaları kullanılarak büyük veri setlerinden yeni yönelimler ve kalıplar çıkarma işlemi olarak tanımlamaktadır. Eğitim alanında ise bu tarz büyük verilerin istatiksel olarak islenmesine ise Eğitsel Veri Madenciliği (EVM) denmektedir. Eğitsel Veri Madenciliği özellikle bireyselleştirilmiş öğrenme, öğrenci davranışlarını gruplandırarak modelleme ve akademik başarı, okulu bırakma, çalışma alışkanlığı vs. gibi bazı durumların tahmininde kullanılmaktadır. Benzer davranış örüntüsü sergileyen öğrenen grupların tespiti EVM’nin çalıştığı önemli bir araştırma konusudur. Çalışmanın bu kısmında veri madenciliği kavramı, veri madenciliği modelleri ve eğitimde veri madenciliği uygulamaları anlatılacaktır
Proje kapsamında, Türkiye’de sosyal Bilimler Alanında lisansüstü öğrenim gören öğrencilere veri madenciliği tanımı, perspektifleri ve süreçleri hakkında teorik ve uygulamalı eğitim verilecektir. Her bir katılımcının bireysel ya da grup olarak etkinlikleri bizzat yapacakları, yaparak-yaşayarak öğrenme imkânı elde edecekleri etkinlikler proje eğitiminde verilecektir. Proje kapsamında aşağıdaki problemler ele alınacaktır: