spaCy/spacy/nb/stop_words.py

49 lines
1.5 KiB
Python
Raw Normal View History

2017-03-23 10:10:22 +00:00
# encoding: utf8
from __future__ import unicode_literals
2017-03-28 12:10:20 +00:00
STOP_WORDS = set("""
alle allerede alt and andre annen annet at av
bak bare bedre beste blant ble bli blir blitt bris by både
da dag de del dem den denne der dermed det dette disse drept du
eller en enn er et ett etter
fem fikk fire fjor flere folk for fortsatt fotball fra fram frankrike fredag funnet får fått før først første
gang gi gikk gjennom gjorde gjort gjør gjøre god godt grunn går
ha hadde ham han hans har hele helt henne hennes her hun hva hvor hvordan hvorfor
i ifølge igjen ikke ingen inn
2017-03-23 10:10:22 +00:00
ja jeg
2017-03-28 12:10:20 +00:00
kamp kampen kan kl klart kom komme kommer kontakt kort kroner kunne kveld kvinner
la laget land landet langt leder ligger like litt løpet lørdag
man mandag mange mannen mars med meg mellom men mener menn mennesker mens mer millioner minutter mot msci mye mål måtte
ned neste noe noen nok norge norsk norske ntb ny nye når
og også om onsdag opp opplyser oslo oss over
personer plass poeng politidistrikt politiet president prosent
regjeringen runde rundt russland
sa saken samme sammen samtidig satt se seg seks selv senere september ser sett siden sier sin sine siste sitt skal skriver skulle slik som sted stedet stor store står sverige svært søndag
ta tatt tid tidligere til tilbake tillegg tirsdag to tok torsdag tre tror tyskland
under usa ut uten utenfor
vant var ved veldig vi videre viktig vil ville viser vår være vært
å år
ønsker
2017-03-23 10:10:22 +00:00
""".split())