Dünyanın önde gelen mühendislik organizasyonu olan ve 420 binden fazla üyesi bulunan Elektrik ve Elektronik Mühendisleri Enstitüsünün (The Institute of Electrical and Electronics Engineers) ya da kısaca IEEE’nin düzenlemiş olduğu, veri setlerin teknik değerine ve görüntüleme sayılarına bağlı olarak değerlendirme yapılan veri seti yarışmasında, Yalova Üniversitesi Endüstri Mühendisliği Bölümü Dr. Öğretim Üyesi İbrahim Sabuncu ve Yalova Üniversitesi öğrencisi Zeynep Yürek “Korona Virüsü (COVID-19) Türkçe Tweet Veri Seti” başlıklı veri seti ile üçüncü oldu.

Dr. Öğr. Üyesi İbrahim Sabuncu ve öğrencisi Zeynep Yürek, yarışmada kullandıkları veri setini, Covid-19’un Türkiye’deki sosyal etkilerini araştırmak amacıyla kullandılar.  Covid-19 ile ilgili Türkçe yazılmış Twitter mesajlarını veri madenciliği yazılımını kullanarak Türkiye’de görülen ilk Covid-19 vakası olan 11 Mart 2020 tarihinden itibaren Covid-19 ile ilgili tüm Twitter mesajlarını topladılar.  Bu çalışma sonucunda 4,8 milyon Twitter mesajı elde ettiler. Bu Twitter mesajları Covid-19’un Türkiye’ye sosyal etkileri ile ilgili sosyal medya analizi, metin madenciliği, konu modelleme gibi çalışmalar yapmak için önemli bir veri kaynağı oluşturmaktadır.  Ayrıca bu verilerle Türkiye’de yaşayan insanların Covid-19 İle ilgili endişelendikleri konuları, ihtiyaçlarını, beklentilerini, yöneticilerden taleplerini anlamak; virüsün yayıldığı noktaları, yayılma hızını ve gelecekteki vaka sayılarını tahmin edilebilecektir. Bunların yanı sıra Covid-19 ile ilgili kasıtlı yalan, yanlış haber, bilgi paylaşanları tespit edebilmek gibi pek çok farklı konu ile ilgili yapılacak analizlerde de bu veriler kullanılabilecek.