spaCy/spacy/hu/stop_words.py

226 lines
1.4 KiB
Python
Raw Normal View History

2016-12-20 21:28:20 +00:00
# encoding: utf8
from __future__ import unicode_literals
STOP_WORDS = set("""
a
abban
ahhoz
ahogy
ahol
aki
akik
akkor
akár
alatt
amely
amelyek
amelyekben
amelyeket
amelyet
amelynek
ami
amikor
amit
amolyan
amíg
annak
arra
arról
az
azok
azon
azonban
azt
aztán
azután
azzal
azért
be
belül
benne
bár
cikk
cikkek
cikkeket
csak
de
e
ebben
eddig
egy
egyes
egyetlen
egyik
egyre
egyéb
egész
ehhez
ekkor
el
ellen
elo
eloször
elott
elso
elég
előtt
emilyen
ennek
erre
ez
ezek
ezen
ezt
ezzel
ezért
fel
felé
ha
hanem
hiszen
hogy
hogyan
hát
ide
igen
ill
ill.
illetve
ilyen
ilyenkor
inkább
is
ismét
ison
itt
jobban
jól
kell
kellett
keressünk
keresztül
ki
kívül
között
közül
le
legalább
legyen
lehet
lehetett
lenne
lenni
lesz
lett
ma
maga
magát
majd
meg
mellett
mely
melyek
mert
mi
miatt
mikor
milyen
minden
mindenki
mindent
mindig
mint
mintha
mit
mivel
miért
mondta
most
már
más
másik
még
míg
nagy
nagyobb
nagyon
ne
nekem
neki
nem
nincs
néha
néhány
nélkül
o
oda
ok
oket
olyan
ott
pedig
persze
például
s
saját
sem
semmi
sok
sokat
sokkal
stb.
szemben
szerint
szinte
számára
szét
talán
te
tehát
teljes
ti
tovább
továbbá
több
túl
ugyanis
utolsó
után
utána
vagy
vagyis
vagyok
valaki
valami
valamint
való
van
vannak
vele
vissza
viszont
volna
volt
voltak
voltam
voltunk
által
általában
át
én
éppen
és
így
ön
össze
úgy
új
újabb
újra
ő
őket
2016-12-20 21:28:20 +00:00
""".split())