spaCy/spacy/lang/da/stop_words.py

48 lines
979 B
Python

# encoding: utf8
from __future__ import unicode_literals
# Source: https://github.com/stopwords-iso/stopwords-da
STOP_WORDS = set("""
ad af aldrig alle alt anden andet andre at
bare begge blev blive bliver
da de dem den denne der deres det dette dig din dine disse dit dog du
efter ej eller en end ene eneste enhver er et
far fem fik fire flere fleste for fordi forrige fra få får før
god godt
ham han hans har havde have hej helt hende hendes her hos hun hvad hvem hver
hvilken hvis hvor hvordan hvorfor hvornår
i ikke ind ingen intet
ja jeg jer jeres jo
kan kom komme kommer kun kunne
lad lav lidt lige lille
man mand mange med meget men mens mere mig min mine mit mod må
ned nej ni nogen noget nogle nu ny nyt når nær næste næsten
og også okay om op os otte over
se seks selv ser ses sig sige sin sine sit skal skulle som stor store syv så
sådan
tag tage thi ti til to tre
ud under
var ved vi vil ville vor vores være været
""".split())