En Bazı dizeleri listesini var diyelim ve bazı dizeleri çok çok benzer orada vardır. Ve o silmek istediğiniz neredeyse çiftleri . Bunun için, aşağıdaki kodu ile geldi:
from difflib import SequenceMatcher
l = ['Apple', 'Appel', 'Aple', 'Mango']
c = [l[0]]
for i in l:
count = 0
for j in c:
if SequenceMatcher(None, i, j).ratio() < 0.7:
count += 1
if count == len(c):
c.append(i)
Hangi iyi iş gibi görünüyor ama iç içe döngüler pek hoşlanmadığını ve ayrıca bu count
çözüm çirkin görünüyor. Ama muhtemelen bir daha Pythonictir şekilde bunu yazmak mümkündür? Olmak, jeneratörler olabilir mi kullanıyorsunuz?
Teşekkürler bir ipucu için minnettar olurdu :)