Makine Öğrenimi ile Nefret Söylemi Nasıl Tespit Edilir?

Jun 11, 2020 - 7 min read
Makine Öğrenimi ile Nefret Söylemi Nasıl Tespit Edilir?

Hayatın her alanında karşımıza çıkan nefret söyleminin yıkıcı etkileriyle mücadele edebilmek, dijitalde daha da zor. Mesajların anonim olarak üretilip kısa sürede çok ciddi görünürlük rakamlarına ulaşabilmesi ve daha birçok faktör yüzünden insanlar sosyal medyada daha agresif davranıyorlar. Bunlara bir de bilinçli olarak bir araya getirilmiş sahte hesap ordularının ürettikleri içerikler de eklenince, nefret söylemi, manuel olarak tespit edilip moderasyonu yapılamayacak kadar yaygın bir hale geliyor.

Dünyanın en büyük medya kuruluşları dahi zaman zaman YouTube’da yayınladıkları hassas içerikli videolarda yorum yapma seçeneğini devre dışı bırakırken, daha kısıtlı kaynaklara sahip kurum ve kuruluşlar için nefret söylemiyle manuel olarak mücadele etmek imkânsıza yakın. Bu yüzden nefret söylemini otomatik olarak tespit eden metotlara başvurmak artık kaçınılmaz.

Bilgisayar işlemcilerinin yüksek kapasitesinden ve akıllı algoritmalar üzerine kurulu yapay zekanın gücünden yararlanan makine öğrenimi teknolojisi tam bu noktada devreye giriyor ve nefret söylemiyle mücadele etmek isteyenlere çözümler sunuyor.

Makine öğreniminin nefret söylemini tespit etmede nasıl kullanıldığına değinmeden önce, nefret söyleminin neleri içerdiğini ve mücadelenin neden gerekli olduğunu hatırlayalım.

Nefret Söylemi Nedir?

Cambridge’in sözlüğü nefret söylemini, “Irk, din, cinsiyet ya da cinsel yönelim gibi özelliklerine dayanarak bir kişiye ya da gruba karşı nefret ifade eden veya şiddeti teşvik eden kamuya açık söylem” olarak tanımlıyor. Avrupa Konseyi ise bu tanıma ek olarak, nefret söyleminin medya aracılığıyla yayıldığında etkilerinin daha yıkıcı olduğunu hatırlatıyor ve nefret söyleminin demokrasiye, farklı kültürlerin bir arada yaşayabilmesi pratiğine ve çoğulculuğa ciddi bir tehdit olduğunun altını çiziyor.

Nefret Söylemini Tespit Etmek Neden Önemli?

Nefret söylemiyle mücadele etmenin genel anlamda insanlık için neden önemli olduğunu anlamak için Avrupa Konseyi’nin demokrasi, çoğulculuk ve bir arada yaşama dair tespitini hatırlamak yeterli. Bu sebeple markalar, özellikle de medya kuruluşları, nefret söyleminin yaygınlaşmasına -istemeyerek dahi olsa- aracılık etmediklerinden emin olmak durumunda.

Facebook, Twitter ve Instagram gibi mecralar -söylemlerin kaynağı bizzat kendileri olmasa dahi- nefret söyleminin dolaşımını kolaylaştırmamak, aksine nefret söylemini derhal tespit edip ilgili içeriği kaldırmak için gerekli çözümlere bu yüzden büyük yatırımlar yapıyorlar. Örneğin 1,7 milyar aktif kullanıcıya sahip Facebook, 2020 yılının ilk çeyreğinde 9,6 milyon içeriği nefret söylemi gerekçesiyle kaldırdığını açıkladı. Açıklamaya göre bu içeriklerin %88,8’i başka bir kullanıcı henüz şikâyet etmeden, tamamen Facebook’un kullandığı yazılım tarafından otomatik olarak tespit edilerek kaldırıldı.

Aynı şekilde bir marka bir kampanya yürütürken istemeden de olsa nefret söylemi kullanmadığından ya da kullandığı dilin nefret söylemine yol açmadığından emin olmak için çaba sarf etmek durumunda.

Nefret söyleminin tespiti, bu konuda araştırmalar yapan kuruluşlar açısından, araştırmanın zaten konusu olduğu için de önemli. Bir sivil toplum kuruluşunun roman vatandaşların Türkiye’de nasıl algılandığına dair bir araştırma yaptığını farz edelim. Doğal olarak bu STK için nefret söyleminin tespiti, araştırmanın en temel konusu olacaktır. Siyasi partiler de özellikle seçimlerin yaklaştığı ve tansiyonun arttığı dönemlerde, söylemlerinin toplumda nefrete neden olup olmadığını anlayabilmek için benzer araştırmalar yapıyorlar.

Nefret Söyleminin Tespitine Dair Zorluklar Nelerdir?

Nefret söyleminin tespiti çok önemli bir konu olsa da günümüz koşullarında bunu verimli ve etkili bir biçimde yapmak kolay değil.

Birincisi, bir araştırmadan sağlıklı sonuçlar elde edilebilmesi için toplanması gereken verinin büyüklüğü, bu verinin manuel olarak işlenmesini imkânsıza yakın bir hale getiriyor. Zira bir araştırma sonunda elde edilen on binlerce satır verinin tek tek incelenip “nefret söylemidir”, “nefret söylemi değildir” şeklinde sınıflandırılması için ciddi bir zaman ve iş gücü gerekiyor. Bu sorunu yaşamamak için daha az veriyle yetinmekse araştırmadan çıkan sonuçların bilimselliğine zarar veriyor.

İkinci olarak, toplanan veriyi anahtar kelime bazlı aramalarla anlamlandırmaya çalışmak da dilin yapısı ve ironi gibi ifade biçimleri nedeniyle doğru sonuçlar vermiyor. Örneğin “çingene” kelimesiyle yapılacak bir arama, çıkan sonuçların tamamının nefret söylemi olduğu anlamına gelmiyor. Bu kelimeyi nefret söylemi olarak kullananları eleştiren veya “Çingeneler Zamanı” gibi konuyla hiç ilgisi olmayan ifadelerin yer aldığı veriler, bu yöntemle doğru bir şekilde sınıflandırılamıyor.

Makine Öğrenimi Nefret söyleminin Tespitine Dair Sorunları Nasıl Çözebilir?

Hem bilgisayar işlemcilerinin yüksek kapasitesinden hem de akıllı algoritmalar üzerine kurulu yapay zekanın gücünden yararlanan makine öğrenimi, nefret söyleminin tespitine dair yukarıda bahsettiğimiz problemleri ortadan kaldırmak için kullanılıyor. Bu noktada, makine öğreniminin ne olduğuna ve kalitatif araştırmalarda nasıl kullanıldığına dair yazılarımıza göz atabilirsiniz.

Makine öğreniminin nefret söylemi tespitinde kullanılabilmesi için öncelikle sisteme bu tip söylemleri nasıl tespit edeceğinin öğretilmesi gerekiyor. Bunun için de ilk olarak konuyla ilgili yapılmış bir araştırmadan elde edilmiş ya da dijital mecralardan derlenmiş veriler sisteme yükleniyor. Daha sonra kullanıcı, verileri satır satır inceleyerek her bir içeriğin nefret söylemi olup olmadığını işaretliyor. Bu aşamada ne kadar fazla işaretleme yapılırsa, sistemin doğruluk oranı o kadar yükseliyor. Kimola’nın Cognitive ürününde olduğu gibi bazı sistemler önceden hazırlanmış modeller sunarak, kullanıcının bu işaretleme adımını atlamasına da imkân tanıyabiliyor.

Öğretme adımının ardından sistem, yeni verilerle karşılaştığında, önceki verilerin işaretlenme sürecinde öğrendiklerini kullanarak, yeni verilerin nefret söylemi olup olmadığını tespit edebiliyor. Bu noktada sistemin işlemci gücü sayesinde tüm sınıflandırmayı çok kısa sürede yapabilmesinin yanında, akıllı algoritmalarının getirdiği avantajlar da devreye giriyor.

Cognitive ürününde yer alan Nefret Söylemi Modeli’nde olduğu gibi, sistem bir veriyi sınıflandırırken sadece anahtar kelimelere odaklanmıyor; bu kelimelerin hangi kelimelerle yan yana kullanıldığı, cümlenin neresinde geçtiği, hangi noktalama işaretleriyle birlikte kullanıldığı gibi birçok değişkeni göz önüne alarak bir sonuca varıyor. Yukarıda verdiğimiz örnekten yola çıkacak olursak, “Çingeneler” ve “Zamanı” kelimeleri bir arada kullanılmışsa, sistem artık bunun bir film adı olduğunu öğrendiği için buna yönelik bir sınıflandırma yapabiliyor.

Kimola Cognitive’in Nefret Söylemi Modeli 

Cognitive’in Nefret Söylemi modeli, Kimola tarafından yüksek hacimli verinin önceden girildiği ve gerekli sınıflandırmanın yapıldığı bir yöntem. Hem Türkçe hem İngilizce metinlerde nefret söylemini tespit edebilen bu sistem Kimola tarafından düzenli olarak geliştirilmeye devam ediyor ve bu yüzden doğruluk oranı sürekli artıyor.

1. Adım: Veri Toplama

Nefret söylemi hakkında sağlıklı bir araştırma yapabilmek için mümkün olduğunca geniş hacimli bilgiye ihtiyaç var. Bunun için, sisteme çeşitli yöntemlerle tanımlayabileceğiniz hedef kitle doğrultusunda, binlerce gerçek ve aktif kullanıcının sosyal medya paylaşımlarını toplayan ve kitlenizle ilgili yüksek hacimli ve detaylı veriler sunan Kimola’nın Analytics ürününü deneyebilirsiniz.

2. Adım: Nefret Söylemi Modeli’ni Seçerek Verileri Sisteme Yükleme

Sırada, Kimola Analytics’in sağladığı ya da başka yöntemlerle elde ettiğiniz veri tabanını Cognitive’e yüklemeye geliyor. Tamamen web-tabanlı olarak çalışan ve hiçbir teknik bilgi gerektirmeyen Cognitive’e verilerinizi sürükle-bırak gibi pratik bir yöntemle yükleyebilirsiniz.

Cognitive’e tanımlanmış olarak gelen Nefret Söylemi Modeli’ni seçerek veri tabanınızı sisteme yüklediğinizde, Cognitive Excel dosyasında “Nefret Söylemi” şeklinde yeni bir sütun oluşturuyor ve her bir satırın içeriğini analiz ederek bu sütunun altındaki hücreye “Pozitif” ya da “Negatif” şeklinde bir değer atıyor.

3. Adım: Elde Edilen Sonuçlardan İçgörüler Çıkarmak

İşlenmiş veriyi bilgisayarınıza indirdikten sonra artık insan faktörü yeniden devreye giriyor. Nefret söylemi olarak işaretlenmiş veriyi inceleyerek en çok hangi kelime gruplarında ve kavramlarda nefret söylemiyle karşılaşılıyor, bu tip söylemler en çok hangi kişi ve gruplara yönelik olarak dile getiriliyor gibi içgörüler çıkarmak mümkün.

Ayrıca veri tabanında daha başka sınıflandırmalar yapmışsanız, bunları nefret söylemi sınıflandırılması ile birlikte kullanarak; nefret söylemine hangi demografik yapıya sahip kitleler tarafından daha çok başvurulduğu, hangi mecralarda daha fazla görüldüğü, ne tip bir motivasyonla ve neden ortaya çıktığı gibi sayısız içgörüye ulaşabilir; bu içgörüler doğrultusunda atmanız gereken adımlara karar verebilirsiniz.

Örneğin, mültecilerle ilgili bir araştırma yapan bir STK, elindeki veriyi demografik yapı, yaş aralığı gibi başka sınıflandırmalara tabi tutmuşsa, mültecilere yönelik nefret söyleminin son dönemde küçük şehirlerde daha hızlı yayıldığı, daha çok 18-24 yaş arası erkekler tarafından dile getirildiği, mesajlarda “işsizlik” vurgusunun sıkça yapıldığı, bu kitlenin haber kaynağı olarak en çok Facebook’u kullandığı ve video içeriklerle daha çok etkileşime girdiği gibi sonuçlara varabilir ve böylece ilgili şehirlerin yöneticileriyle iş birliğine gidip nefreti yatıştırmaya yönelik bir video içerik hazırlayıp bunu Facebook üzerinden dolaşıma sokabilir.

Cognitive’in Nefret Söylemi Modeli’ni Ücretsiz Deneyin

Makine öğrenimi teknolojisi üzerine kurulu Kimola Cognitive, yüksek hacimli verilerinizi kısa sürede ve yüksek doğruluk oranıyla sınıflandırmanızı sağlıyor. Cognitive’in Nefret Söylemi Modeli de bu konuda yaptığınız araştırmalarda elde ettiğiniz verilerin nefret söylemi içerip içermediğini kısa sürede tespit etmenize imkân tanıyor.

Subscribe to Our Newsletter!

We gather global consumer research news and share them with 3,000+ marketing and research professionals worldwide.

Latest