Announcing Free Research Tools: Turn Amazon, Trustpilot, Tripadvisor, Google Play and App Store reviews into market research!

Named Entity Recognition (NER) Nedir ve Nerelerde Kullanılır?

Author: Yasemin Ozturk - Data Analyst, Kimola
Yasemin Ozturk Data Analyst, Kimola
Apr 20, 2022 - 5 min read
Named Entity Recognition (NER) Nedir ve Nerelerde Kullanılır?

Named Entity Recognition (NER) bazen varl─▒k kümeleme, ç─▒karma veya tan─▒mlama olarak da an─▒lmakla beraber metindeki önemli bilgileri (varl─▒klar─▒) belirleme ve kategorilere ay─▒rma i┼čidir. Peki varl─▒k olarak bahsetti─čimiz ┼čeyler neler?

Bir varl─▒k, tutarl─▒ bir ┼čekilde ayn─▒ ┼čeye at─▒fta bulunan herhangi bir kelime veya kelime dizisi olabilir. Varl─▒klar, isim öbekleri, fiil öbekleri veya her ikisi gibi belirli bir cümlenin en önemli parçalar─▒d─▒r. Tespit edilen her varl─▒k önceden belirlenmi┼č bir kategoride s─▒n─▒fland─▒r─▒l─▒r. Örne─čin, bir NER makine ö─črenimi (ML) modeli, bir metindeki "Microsoft" kelimesini alg─▒layabilir ve onu "┼čirket" olarak s─▒n─▒fland─▒rabilir.

NER, yapay zekan─▒n bir alt alan─▒ olan do─čal dil i┼člemenin (NLP) bir biçimidir. NLP, do─čal dili, yani bilgisayar kodlama dilleri gibi yapay olarak de─čil, do─čal olarak geli┼čen herhangi bir dili i┼čleyen ve analiz eden bilgisayarlarla ilgilidir. NLP hakk─▒nda daha detayl─▒ bilgi almak isterseniz "Do─čal Dil ─░┼čleme Nedir ve Nas─▒l Uygulan─▒r?" adl─▒ yaz─▒m─▒za göz atabilirsiniz. ┼×imdi gelin, named entity recognition uygulamas─▒na daha yak─▒ndan bakal─▒m.

Named Entity Recognition Nas─▒l Çal─▒┼č─▒r? 

Basitçe gözlemledi─čimiz gibi, belirli bir metni okuduktan sonra insanlar, de─čerler, konumlar vb. gibi adland─▒r─▒lm─▒┼č varl─▒klar─▒ tan─▒yabiliriz.

Örne─čin, a┼ča─č─▒daki metne bakal─▒m:

Named entity recognition

Yukar─▒daki metinde de görebilece─čimiz gibi, ki┼či, organizasyon, konum vb. varl─▒k isimlerini tan─▒mlamam─▒z mümkün. Ancak ayn─▒ ┼čeyi bilgisayarlar─▒n yapabilmesi, yani onlar─▒ kategorize edebilmeleri için önce varl─▒klar─▒ tan─▒malar─▒na yard─▒mc─▒ olmam─▒z gerekiyor. Bunu yapmak için en önemli ve yayg─▒n olarak kullan─▒lan metin analizi uygulamalar─▒ndan Makine Ö─črenimi ve Do─čal Dil ─░┼čleme'nin (NLP) yard─▒m─▒na ihtiyac─▒m─▒z var. Bilgisayarlar─▒ kullanarak NER uygularken NLP; dilin yap─▒s─▒n─▒ ve kurallar─▒n─▒ inceleyerek metinden ve konu┼čmadan anlam ç─▒karabilen ak─▒ll─▒ sistemler olu┼čturuyor. Makine ö─črenimi ise, makinelerin zaman içinde ö─črenmesine ve geli┼čmesine yard─▒mc─▒ oluyor.

Bir varl─▒─č─▒n ne oldu─čunu ö─črenmek için, bir NER modelinin bir varl─▒─č─▒ olu┼čturan bir kelimeyi veya kelime dizisini (örne─čin California) tespit edebilmesi ve hangi varl─▒k kategorisine ait oldu─čuna karar verebilmesi gerekiyor. Sonuç olarak, herhangi bir NER modelinin temelinde iki a┼čamal─▒ bir süreç oldu─čunu söyleyebiliriz: 

  1. Adland─▒r─▒lm─▒┼č bir varl─▒─č─▒ alg─▒lama
  2. Varl─▒─č─▒ kategorilere ay─▒rma

 

Bu nedenle, öncelikle ad, konum, etkinlik, organizasyon vb. gibi varl─▒k kategorileri olu┼čturmam─▒z ve NER modeliyle ilgili e─čitim verilerini beslememiz gerekmekte.

E─čer, nas─▒l NER (Named Entity Recognition) uygulamalar─▒ geli┼čtirilebilir diyorsan─▒z, bu alanda yayg─▒n olarak yararlan─▒lan aç─▒k kaynak kodlu NLTK, SpaCy ve Stanford NER kütüphanelerini kullanabilirsiniz. Her bir kütüphanenin ba─člant─▒lar─▒na t─▒klayarak art─▒ ve eksi yönlerini ke┼čfetmeniz de mümkün. Ek olarak, bu kütüphanelerde yayg─▒n olarak kar┼č─▒la┼čabilece─čimiz named entity türlerinin bir listesi de a┼ča─č─▒daki tabloda yer al─▒yor. 

Named entity recognition aç─▒k kaynak kodlu kütüphaneleri

Peki NER Hangi Alanlarda Kar┼č─▒m─▒za Ç─▒k─▒yor?

NER, büyük miktarda metne yüksek düzeyde genel bak─▒┼č─▒n yararl─▒ oldu─ču her duruma uygulanabilir. NER ile, bir metnin konusunu veya temas─▒n─▒ bir bak─▒┼čta anlayabilir ve metinleri alakalar─▒na veya benzerliklerine göre h─▒zl─▒ bir ┼čekilde gruplayabiliriz. NER’─▒n i┼člerimizi nas─▒l kolayla┼čt─▒rd─▒─č─▒n─▒ anlamak için yayg─▒n kullan─▒m senaryolar─▒na hep birlikte göz atal─▒m.

  • Haber ─░çeriklerinin S─▒n─▒fland─▒r─▒lmas─▒

Haber içeriklerinde geçen ki┼či, kurum ve yer gibi ifadeler otomatik olarak ç─▒kart─▒larak belli bir ki┼či ya da kuruma ait haberlere eri┼čilmesini daha kolay hale getirmekte. Haberler için ilgili etiketleri bilmek, tan─▒mlanm─▒┼č hiyerar┼čilerde otomatik olarak kategorilere ay─▒rmada ve içerik ke┼čfi için NER kullan─▒lmaktad─▒r.

  • Mü┼čteri Hizmetleri

Bir NER modeli, ürün adlar─▒, teknik özellikler, ┼čube konumu ve daha fazlas─▒ gibi önemli bilgilere dayal─▒ olarak ilgili mü┼čteri ┼čikayetlerini, sorgular─▒n─▒ ve geri bildirimlerini kolayca tespit edebilir. ┼×ikayet veya geri bildirim uygun ┼čekilde s─▒n─▒fland─▒r─▒l─▒r ve öncelikli anahtar kelimeleri filtreleyerek do─čru departmana yönlendirilir. Böylece, problemin ilgili birime aktar─▒lmas─▒ için geçen süre oldukça k─▒salm─▒┼č olur. Twitter gibi sosyal medya üzerinden analizler yap─▒l─▒rsa hangi üründe veya hangi lokasyonda ne tür problem oldu─ču otomatik olarak ç─▒kart─▒l─▒r. ┼×irket elde etti─či verilerle gerekli analizleri yaparak ilgili konu için isabetli yat─▒r─▒mlar yapabilir. 

  • Makine Çevirileri (Machine Translation)

─░nsanlar taraf─▒ndan konu┼čulan farkl─▒ diller aras─▒nda çeviri yap─▒l─▒rken dikkat edilmesi gereken hususlardan biri özel isimler gibi dile ait bilgilerin çeviri sisteminde de─či┼čmeden oldu─ču gibi kalmas─▒d─▒r. Örnek olarak, “Ya─čmur bugün bize gelecek.” cümlesini ele al─▒rsak; burada Ya─čmur bir özel isimdir, e─čer çeviri sistemi bunu bir ya─č─▒┼č biçimi türü olarak alg─▒larsa çeviri hatal─▒ yap─▒lm─▒┼č olur. Bu sebeple, varl─▒klar─▒n ç─▒kar─▒lmas─▒ çeviri sistemleri için oldukça önemlidir. 

  • Özgeçmi┼čleri Otomatik Olarak Özetleme

Özgeçmi┼činizi tarayan ve onlardan ad, adres, nitelik vb. gibi önemli bilgileri alan çe┼čitli araçlarla kar┼č─▒la┼čm─▒┼č olabilirsiniz. Bu tür araçlar─▒n ço─ču, bu bilgilerin ç─▒kar─▒lmas─▒na yard─▒mc─▒ olan NER (Named Entity Recognition) uygulamas─▒ndan yararlan─▒yor. Ayr─▒ca, ┼čirketler genelinde ─░K departmanlar─▒n─▒n kar┼č─▒la┼čt─▒─č─▒ zorlu görevlerden biri, adaylar─▒ k─▒sa listeye almak için devasa bir özgeçmi┼č y─▒─č─▒n─▒n─▒ de─čerlendirmek. Bu özgeçmi┼člerin birço─ču a┼č─▒ derecede ayr─▒nt─▒l─▒ olarak haz─▒rlan─▒r ve bilgilerin ço─ču de─čerlendirici için ilgisizdir. NER uygulmas─▒ndan faydalan─▒larak,  de─čerlendirici için ilgili bilgiler kolayca ç─▒kar─▒labilir. Bu sayede insan kaynaklar─▒ uzmanlar─▒n─▒n adaylar─▒ bir özgeçmi┼č y─▒─č─▒n─▒ aras─▒ndan k─▒sa listeye almak için harcad─▒─č─▒ çaba azal─▒r.

  • Öneri Sistemleri

Günümüzde Netflix, YouTube gibi birçok platform, optimum mü┼čteri deneyimleri üretmek amac─▒yla öneri sistemlerinden yararlan─▒r. Bu sistemlerin ço─ču, kullan─▒c─▒ arama geçmi┼čine dayal─▒ önerilerde bulunabilen adland─▒r─▒lm─▒┼č varl─▒k tan─▒maya (NER) dayan─▒r. Örne─čin, YouTube’da çok say─▒da e─čitim videosu izlerseniz, e─čitim varl─▒─č─▒ olarak s─▒n─▒fland─▒r─▒lan daha fazla öneri al─▒rs─▒n─▒z.

  • Tüketici Yorumlar─▒ndan ─░çgörü Ç─▒karma

Hemen hemen tüm ürün tabanl─▒ ┼čirketler için çevrimiçi incelemeler, mü┼čterilerin ürünleriniz hakk─▒nda neyi sevip neyi sevmedi─či ve i┼čletmenizin i┼č art─▒┼č─▒ için iyile┼čtirmeye ihtiyaç duyan yönleri hakk─▒nda zengin bilgiler sa─člayabilece─činden, mü┼čteri geri bildirimi almak için harika bir kaynakt─▒r.

Dolay─▒s─▒yla, burada tüm mü┼čteri geri bildirimlerini düzenlemek ve tekrar eden sorunlar─▒ saptamak için NER’i kullanabiliriz. Örne─čin, olumsuz mü┼čteri geri bildirimlerinde en s─▒k bahsedilen ve belirli bir ofis ┼čubesine odaklanmam─▒za neden olabilecek konumlar─▒ tespit etmek için NER’dan faydalanmak mümkün.

Tam da bu noktada kendi geli┼čtirdi─či teknoloji ürünleriyle tüketici konu┼čmalar─▒n─▒ analiz etmek amac─▒yla mesai harcayan Kimola devreye giriyor. Burada insan gücüyle ba┼ča ç─▒k─▒lamayacak kadar büyük miktardaki tüketici konu┼čmalar─▒ndan söz ediyoruz. Bu devasa miktardaki tüketici verisini analiz etmek için Kimola’n─▒n Cognitive ürününü önemli bir rol oynuyor. Hiçbir kod bilgisine sahip olmadan ve web-tabanl─▒ olarak çal─▒┼čan Kimola Cognitive makine ö─čreniminin yan─▒ s─▒ra Unsupervised Named Entity Recognition ile do─čal dil i┼čleme teknolojisinden yararlanmam─▒z─▒ sa─čl─▒yor. 

Makine ö─črenimi ile sektöre uygun olarak tüketici görü┼člerinin hangi kategorilerde oldu─čunu tespit etmek mümkün hale geliyor. Bununla beraber NER sayesinde bu içerikler Kimola’n─▒n belirledi─či 10 farkl─▒ varl─▒k kategorisinde (GPE, ORG, Interests, Human, NORP vb.) etiketlenerek çok de─čerli içgörülerin ç─▒kar─▒lmas─▒na katk─▒ sa─čl─▒yor.

adland─▒r─▒l─▒┼čm─▒┼č varl─▒k tan─▒ma

Siz de e─čer bir NLP veri setine sahip iseniz, Kimola Cognitive’de ücretsiz bir hesap olu┼čturarak veri setinizde yer alan içeriklerin hangi kategorilerde yo─čunla┼čt─▒─č─▒n─▒ belirleyip, içerikte yer alan varl─▒klar─▒ yakalayarak markan─▒z için önemli aksiyonlar alman─▒z─▒ sa─člayacak içgörüler elde edebilirsiniz. 

Kimola Cognitive

 

Subscribe to Our Newsletter!

We gather global consumer research news and share them with 3,000+ marketing and research professionals worldwide.

Latest