diff --git a/utils.py b/utils.py index 66e1117..73cfc35 100644 --- a/utils.py +++ b/utils.py @@ -71,12 +71,15 @@ def clean_rss(content): content = content.replace('Continue reading →', '') content = content.replace('» weiterlesen', '') content = content.replace('Ein Kommentar.', '') + content = content.replace('Änderungen zeigen', '') content = content.replace('(RSS generated with FetchRss)', '') content = content.replace('-- Delivered by Feed43 service', '') content = content.replace('Meldung bei www.tagesschau.de lesen', '') content = content.replace('<', '<') content = content.replace('>', '>') content = re.sub('Nächstältere Version.*', '', content) + content = re.sub('Die Seite wurde neu angelegt.*', '', content) + content = re.sub('Weiterleitung nach.*erstellt.*', '', content) content = re.sub('Der Beitrag.*erschien zuerst auf .+\.', '', content) content = re.sub('The post.*appeared first on .+\.', '', content) content = re.sub('http://www\.serienjunkies.de/.*\.html', '', content)