-
Notifications
You must be signed in to change notification settings - Fork 23
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Sorunlu Kelimeler. #7
Comments
Merhaba, Detaylı analiz ve uygun örnekler için çok teşekkürler @hazarek! turkish_pattern_table değişkeni doğrudan ve elle oluşturulmuş bir veri seti olmadığı için, ona doğrudan müdahale uygun olmayabilir. Deniz Yüret hocanın burada da belirttiği gibi, "The Greedy Prepend Algorithm for Decision List Induction" yöntemi ile bir derlemden (corpus), otomatik olarak oluşturulmuş durumda. Maalesef derlemden otomatik olarak o karar listesini oluşturma işlevselliği bu projenin parçası değil. Deniz hoca ya da siz, turkish_pattern_table değişkeni içinde tutulan veriyi bir derlemden otomatik olarak oluşturma programını kolayca kullanılabilir halde sunabilirseniz, o zaman belki daha büyük ve güncel bir Türkçe derlem üzerinden, daha doğru sonuçlar verecek bir liste oluşturmak mümkün olabilir. Not: Bu arada, size yazdığım bu yorumu İngilizce klavye ile yazdım, Türkçe harflere çevirme işlemini de bu sistemle yaptım ( |
Rica ederim @emres bey, aylar önce ASCII bir veritabanını düzeltmem gerekiyordu, hatalı çevirdiğini farkettiğimde vazgeçtim. https://github.com/aysnrgenc/TurkishDeasciifier bu depoda sinir ağları ile çalışan halini bulmuştum çok daha az hata yapıyor, yukarıdaki verdiğim örnekler kolaylıkla öğretilebilir. |
@hazarek, sayenizde @aysnrgenc tarafından geliştiren sistemden haberdar oldum, hemen README.md dosyasına da ekleyeyim aysnrgenc/TurkishDeasciifier'ı. İlgili makalede sinir ağları ile çalışan sistem performansı %86 olarak belirtilmiş. (TABLE IV DIACRITIC RESOLUTION RESULT COMPARISON). Daha büyük bir derlem ve GPU kullanan bir makinada biraz daha uzun süre eğitilirse, ortaya %98 ya da daha yüksek oranda doğru sonuç veren bir model çıkarsa çok faydalı olabilir (teorik olarak bu işi %100 yapmak mümkün değil gibi görünüyor bana şimdilik, Türkçenin yapısından ötürü). Bunu biraz kurcalayayım, belki birileri destek verebilir işin bu tarafı için. |
kelimeler düzelene kadar açık kalması daha iyi. |
Sorunlu kelimelerin bazılarını derledim, turkish_pattern_table değişkeninde tanımlanırsa düzeltilebilir. olası kullanımları öğretmek gerekiyor.
Sorunlu kelimeler
Cümle içinde kullanalım
The text was updated successfully, but these errors were encountered: