Makine Öğrenimi Nedir ve Metin Verisi Sınıflandırmasına Nasıl Uygulanır?

Jun 11, 2020 - 7 min read
Makine Öğrenimi Nedir ve Metin Verisi Sınıflandırmasına Nasıl Uygulanır?

Makine öğrenimi (Machine Learning), insan beyninin kapasitesinin çok üzerinde işlem yapabilme hacmine sahip bilgisayarların bu avantajını yapay zekanın öngörü gücüyle birleştiren ve bu sayede yaşamımızı kolaylaştıran bir alan. Gündelik hayatımızda makine öğrenimiyle defalarca karşı karşıya geliyoruz ve hayatımızı nasıl kolaylaştırdığını çoğunlukla fark etmiyoruz bile. Ancak özellikle veri sınıflandırmayla uğraşan araştırmacılar, makine öğrenimini kendi inisiyatifleri doğrultusunda kullandıklarında, bunun ne kadar “sihirli” bir teknoloji olduğunu çok iyi biliyorlar. Gelin makine öğreniminin ne olduğuna, hayatımızın hangi alanlarında karşımıza çıktığına ve metin verisi sınıflandırmasına uygulandığında bize getirdiği devasa avantajlara yakından bakalım.

Makine Öğrenimi Nedir?

Bu teknolojinin gelişimine en büyük katkıyı yapan isimlerden Carnegie Mellon Üniversitesi Makine Öğrenimi Departmanı eski başkanı Tom Mitchell, makine öğrenimini, “Deneyim yoluyla otomatik olarak gelişen bilgisayar algoritmaları çalışmaları” olarak niteliyor.

Bu tanımı daha pratik bir örnek üzerinden anlatacak olursak, makine öğrenimi sürecini bir insana satranç öğretmeye benzetebiliriz. Henüz satranç bilmeyen bir insana (yani makineye); oyunun kurallarını, taşların isimlerini, nasıl hareket ettiklerini, çatal gibi taktikleri ve en yaygın açılışlarla oyun sonu stratejilerini öğreterek işe başlarız. Bu, “makineye öğretme” adımıdır. Ancak herhangi bir insana (ya da günümüzün ilerlemiş teknolojisine rağmen en üst yüksek işlemcili bilgisayara bile) bir satranç oyununda yapılabilecek tüm hamleleri öğretmemiz mümkün değildir. Biz bir noktaya kadar “öğrettikten” sonra, öğrencimiz artık bizim sağladığımız bilgileri değerlendirerek kendi “öğrenim” sürecini başlatacaktır. Ona sağladığımız bilgilerden yola çıkarak, bu deneyimleri karşısına ilk defa çıkan pozisyonlara uygulayarak, her oyunda daha iyiye gidecektir. Biz ilk başta öğrencimize ne kadar çok ve doğru bilgi sunarsak ve sonrasında öğrencimiz ne kadar çok yeni oyun oynayıp deneyim elde ederse, o kadar iyi bir satranç oyuncusu haline gelecektir.

Makine Öğrenimi Hangi Alanlarda Karşımıza Çıkıyor?

Makine öğrenimi pazarlamadan bankacılığa, ekonomiden eğitime, yazılım mühendisliğinden kullanıcı davranış analizine kadar hayatın neredeyse her alanında karşımıza çıkan bir teknoloji. Getirdiği devasa fayda sayesinde o kadar yaygınlaştı ki artık bu teknolojiyle karşılaştığımızda fark etmiyoruz bile. Bir online kitap sitesinde gezinirken, en çok göz attığımız ya da satın aldığımız kitapları analiz eden sistemin, “Bu kitapları da seveceğinizi düşünüyoruz.” mesajıyla gerçekten de isabetli öneriler sunduğunu ilk gördüğümüz yıllarda ne kadar şaşırıyorduk. Oysa artık bırakın şaşırmayı, bu alanlarda makine öğreniminin kullanıldığını fark etmiyoruz bile.

Bu konuda verebileceğimiz en basit örneklerden biri Facebook’un haber akışı. Facebook hangi arkadaşlarımızın paylaşımlarıyla daha çok etkileşime geçtiğimizi öğrenerek daha sonra bize o kişilerin paylaşımlarını daha sık ve üst sıralarda gösteriyor. Öte yandan önde gelen e-mail sağlayıcıları makine öğrenimini o kadar etkili kullanıyor ki artık sistemin gözden kaçırdığı bir mail olmuş mu diye spam klasörümüze bakma gereğini neredeyse hiç duymuyoruz. Akıllı telefonlarımızın yüz tanıma teknolojisi de aslında makine öğrenimiyle çalışıyor ve yüzümüzü öğrendikten sonra kilidi açıp açmamaya karar vermek için kendisine şu soruyu soruyor: “Bu kişi telefonun sahibi mi, değil mi?” Üstelik makineye yüzümüzü öğretirken gözlük ya da şapka takmasak bile, gözlüklü ya da şapkalı halimizin de nasıl göründüğünü öngörerek o durumlarda da kilidi açabiliyor.

Bu örneklerden de çıkarabileceğimiz gibi makine öğreniminin en büyük faydalarından biri, ona öğrettiğimiz bilgilerle yetinmeyerek, bu bilgilerden öğrendikleri vasıtasıyla, karşısına çıkan yeni verileri yüksek doğruluk oranıyla sınıflandırabilmesi.

Veri Sınıflandırması Nedir?

Veri sınıflandırması, daha önce sisteme sağlanan eğitim setlerinin analizinden öğrenilenler ışığında, yeni karşılaşılan bir verinin hangi kategoriye girdiğine karar verilmesidir. Kulağa fazla teknik gelen bu tanım, aslında sadece makinelerin değil tüm insanların sürekli yaptığı bir faaliyete işaret ediyor. Zira, çevremizde gördüğümüz her şeyi sınıflandırma çabası, atalarımızdan beri sahip olduğumuz bir içgüdü.

Atalarımız ilk defa karşılaştıkları bir hayvanın kendileri için tehlike arz edip etmediğine önceki deneyimlerinden öğrendikleriyle karar veriyorlardı. Örneğin sivri dişleri ve pençeleri olan etçil hayvanların tehlikeli olabileceğini öğrendikleri için, daha önce hiç görmedikleri ancak bu sınıflandırmaya giren yeni bir türle karşılaştıklarında kendilerini korumaları gerektiğini anlayabiliyorlardı.

Günümüzde de bu durum farklı değil. Örneğin bir insan bizden borç istediğinde, önceden edindiğimiz tecrübeleri değerlendirerek kafamızda “güvenilir/güvenilir değil” şeklinde bir sınıflandırma yapıyoruz. Bunu yaparken de beden dili, borcun büyüklüğü, daha önceki benzer tecrübelerimiz gibi birçok faktörü değerlendiriyoruz.

Tıpkı yukarıdaki örneklerde olduğu gibi araştırma yaparken de yeni edindiğimiz ham veriyi, daha önceki deneyimlerimiz ışığında sınıflandırmamız gerekiyor, çünkü yeni veriden anlam çıkarabilmemiz için onu sınıflandırmamız şart.

Verinin türü, sınıflandırmanın türünü de belirliyor. Yani bu veri bir metinse, yaptığımız işlem metin verisi sınıflandırması haline geliyor. Metin verisi sınıflandırması, günümüzde araştırmacıların en yaygın kullandığı sınıflandırma türlerinden biri olduğu için büyük önem taşıyor.

Metin Verisi Sınıflandırması Nedir?

Metin verisi sınıflandırması, elde edilen yeni metinlerin önceden belirlenen kategorilerden hangilerine dahil olduğuna yönelik bir sınıflandırma çeşidi. Bu sınıflandırma çeşidi; firmanızın sosyal medya hesaplarına gelen mesajlar, dijital dünyada firmanız hakkında yazılan metinler, çağrı merkezinizin yaptığı görüşmelerin deşifreleri ve veri tabanınızda bir metin olarak yer alabilecek başka her verinin sınıflandırmasını kapsıyor.

Metin Verisi Sınıflandırması Ne İşe Yarar?

Metin verisi sınıflandırması verimli ve etkili bir şekilde yapıldığında, araştırmanın kaynağı olan sorulara en doğru cevabı en pratik şekilde almamızı sağlıyor.

Bir e-ticaret şirketinin gelecek yıl için strateji belirlemeye karar verdiğini düşünelim. Elinde de son bir yıla ait 120 bin tüketici şikayetinden elde ettiği bir veri tabanı olsun. Her işletme gibi bu e-ticaret şirketi de kendisine yönelik şikayetlerin hangi konu başlıklarında olduğunu biliyor olsa da bunların yıl boyunca dağılımını ve alt kırılımlarını öğrenip her birini kendi içinde kıyaslayabilmek için bu verilerin sınıflandırılmasına ihtiyaç duyacaktır. Bir başka deyişle, bir şirketin, “Web sitesi üzerinden sipariş veren müşterilerin akıllı uygulama üzerinden sipariş veren müşterilere kıyasla teslimat sürelerinden daha az şikayetçi olduğu” gibi bir sonuca varabilmesi için, elindeki verileri platform bazlı (web sitesi/cep telefonu), şikâyet konusu bazlı (teslimat süresi, ürün kalitesi vb.) ve sentiment bazlı (pozitif/negatif) gibi bir kategorizasyona tabi tutması ve her veriyi bu kategorilerden hangilerine dahil olduğuna göre sınıflandırması gerekecektir.

Makine Öğrenimi, Metin Verisi Sınıflandırmasında Nasıl Kullanılır?

Makine öğrenimi, elde edilen tüm metin verisini, örneğin kalitatif tüketici araştırmalarında kaynak olarak kullanılan mülakat metinleri ya da sosyal medya konuşmalarını içeriklerine göre analiz edip sınıflandırma işlemini otomatik bir şekilde yapabiliyor. Bunun için araştırmalara konu olan sınıfların sisteme bir sefer için öğretilmesi yeterli. Tüm verinin hacmine kıyasla çok daha düşük hacimde veri kullanılarak gerçekleştirilecek öğretme adımının ardından, yeni veriler otomatik olarak birkaç dakika içinde sistem tarafından yüksek doğruluk oranıyla sınıflandırılabiliyor.

Makine öğreniminin kalitatif araştırmalarda nasıl kullanıldığına dair daha detaylı bilgi almak için bu yazımıza göz atabilirsiniz.

Metin Verisi Sınıflandırmasında Makine Öğrenimi Kullanımının Faydaları Nelerdir?

Veri sınıflandırmasında makine öğrenimi kullanmanın en temel faydası, insan-makine iş birliğinde her iki aktörün diğerinden daha iyi olduğu konulara odaklanmasını sağlaması.

Bu iş birliğinin makine tarafı, işlemci gücünün ve gelişmiş algoritmaların yardımıyla çok yüksek hacimli verileri çok kısa bir sürede sınıflandırmayı mümkün kılıyor. Yukarıda verdiğimiz örnekten devam edecek olursak, bahsettiğimiz e-ticaret şirketi, son bir yıla ait 120 bin satırlık veriyi tek tek incelemek ve sınıflandırmak durumunda kalmıyor. Bu da şirket için hem iş gücü hem de zamandan büyük bir kâr anlamına geliyor.

Üstelik makine öğrenimi sayesinde, insanlar da makinelerden daha iyi yaptıkları alanlara odaklanabiliyor. Örneğin yukarıdaki şirketin veya birlikte çalıştığı ajansın pazarlama ve araştırma sektöründe yıllarca tecrübe kazanmış yetkin profesyonelleri, emek ve zamanlarını veri sınıflandırmaya harcamak yerine, makinenin sınıflandırdığı verileri analiz etmeye odaklanabiliyor ve entelektüel birikimlerini en etkin stratejileri geliştirmek için kullanabiliyor.

Kimola Cognitive’i Ücretsiz Deneyin

Makine öğrenimi günümüzde hayatın her alanında kullanılıyor olsa da iletişim sektörü bu teknolojinin sahip olduğu potansiyelden henüz tam anlamıyla faydalanamıyor. Bunun temel sebebi de iletişim sektörünün beşerî kaynaklarını haklı olarak teknolojiden daha önemli alanlar için kullanmayı tercih etmesi.

İşte Kimola’nın Cognitive ürünü tam bu noktada devreye giriyor.

Kimola; pazarlamacıların, reklamcıların ve araştırmacıların, kısacası iletişim sektörünün tüketicilerini daha iyi tanıyabilmesi, daha derin bir şekilde anlayabilmesi ve daha hızlı bir şekilde sonuçlara ulaşabilmesi için teknoloji odağıyla ürünler çıkaran bir şirket. Türkiye'nin sosyal medyada reyting ölçümlemesi yapan ilk şirketi olmasının yanında, bugün Pfizer'den Japan Tobacco'ya, Samsung'dan Nike'a kadar birçok global markanın iletişim ve saha stratejilerine yön veren Sosyal Araştırma Platformu'nun da kurucusu.

Kimola’nın yeni ürünü Cognitive ise hiçbir teknik bilgiye ihtiyaç duymayan, tamamen web-tabanlı çalışan, verilerin sürükle-bırak gibi çok basit bir yöntemle sisteme yüklenebildiği bir arayüze sahip. Makine öğrenimi teknolojisini kullanan Cognitive, yüksek hacimli verileri kısa sürede ve yüksek doğruluk oranıyla sınıflandırarak, iletişim sektörünün yaratıcı çalışanlarının, en iyi oldukları alanlara odaklanmalarını sağlıyor.

Kimola Cognitive’i denemek ve ilk makine öğrenimi modelinizi ücretsiz yaratmak için buradan üye olabilirsiniz. Ayrıca Cognitive’e dair daha fazla bilgi almak isterseniz, sormak istediklerinizi buradan bize iletebilir ya da Calendly üzerinden bir görüşme randevusu talep edebilirsiniz.

Latest