Metin karşılaştırma
Автор: Code Cube
Загружено: 2022-10-13
Просмотров: 2284
Описание:
(Bu dersi izleyenlerin temel düzeyde Python bilmesi gerekmektedir!)
Metin sayısallaştırma ve benzerlik oranını nasıl buluruz?
Amacımız 2 metin belgesi içindeki tekil sözcüklerin benzeme oranını bulmak.
İki metin dosyası içinde bulunan sözcükleri öncelikle noktalama işaretlerinden ve durma sözcüklerinden (genellikle bağlaçlar ve
veya, çünkü,gibi, tabi ki, benzeri kelimeler ) arındırıyoruz. Burada string.replace komutu kullanıyoruz.
Ardından metni boşluk karakterlerinden bölüyoruz: string.split komutu ile bu işlemi yapıyoruz.
Sonra her iki metin dosyasını ayrı ayrı set() komutu ile küme haline getiriyoruz amacımız tekrar eden sözcükleri kaldırmak. Ardından her iki kümeyi birleştiriyoruz.
Her iki metin dosyasının toplam kelime sayısı, birleştirmeden sonra azalıyor. Çünkü benzer kelimeler kümede bir kere kullanılabilir. Aradaki fark ise bize benzerlik oranını veriyor.
Makine Öğrenmesi ve Veri Bilimi oynatma listesi: • Makine Öğrenmesi ve Veri Bilimi
Github dosyalar: https://github.com/yasinhoca/MachineL...
Orange canvas eğitim seti : • Orange Canvas İle Veri Bilimine Giriş
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: