spaCy/spacy/lang/hr/stop_words.py

349 lines
2.0 KiB
Python
Raw Normal View History

# encoding: utf8
from __future__ import unicode_literals
# Source: https://github.com/stopwords-iso/stopwords-hr
STOP_WORDS = set(
"""
a
2018-02-23 09:31:01 +00:00
ah
aha
aj
ako
2018-02-23 09:31:01 +00:00
al
ali
2018-02-23 09:31:01 +00:00
arh
au
avaj
bar
baš
bez
bi
bih
bijah
2018-02-23 09:31:01 +00:00
bijahu
bijaše
bijasmo
bijaste
bila
bili
bilo
bio
bismo
biste
biti
2018-02-23 09:31:01 +00:00
brr
buć
budavši
bude
budimo
budite
budu
budući
bum
bumo
2018-02-23 09:31:01 +00:00
će
ćemo
ćeš
ćete
čijem
čijim
čijima
ću
da
2018-02-23 09:31:01 +00:00
daj
dakle
de
deder
dem
djelomice
djelomično
do
2018-02-23 09:31:01 +00:00
doista
dok
dokle
donekle
dosad
doskoro
dotad
dotle
dovečer
drugamo
drugdje
duž
2018-02-23 09:31:01 +00:00
e
eh
ehe
ej
eno
eto
evo
ga
2018-02-23 09:31:01 +00:00
gdjekakav
gdjekoje
gic
god
halo
hej
hm
hoće
hoćemo
hoćeš
2018-02-23 09:31:01 +00:00
hoćete
hoću
2018-02-23 09:31:01 +00:00
hop
htijahu
htijasmo
htijaste
htio
htjedoh
htjedoše
htjedoste
htjela
htjele
htjeli
hura
i
iako
ih
2018-02-23 09:31:01 +00:00
iju
ijuju
ikada
ikakav
ikakva
ikakve
ikakvi
ikakvih
ikakvim
ikakvima
ikakvo
ikakvog
ikakvoga
ikakvoj
ikakvom
ikakvome
ili
2018-02-23 09:31:01 +00:00
im
iz
ja
je
jedna
jedne
2018-02-23 09:31:01 +00:00
jedni
jedno
jer
jesam
jesi
jesmo
jest
jeste
jesu
jim
joj
još
ju
kada
kako
kao
koja
koje
koji
kojima
koju
kroz
2018-02-23 09:31:01 +00:00
lani
li
me
mene
meni
mi
mimo
moj
moja
moje
2018-02-23 09:31:01 +00:00
moji
moju
mu
na
nad
nakon
nam
nama
nas
naš
naša
naše
našeg
2018-02-23 09:31:01 +00:00
naši
ne
2018-02-23 09:31:01 +00:00
neće
nećemo
nećeš
nećete
neću
nego
neka
2018-02-23 09:31:01 +00:00
neke
neki
nekog
neku
nema
nešto
2018-02-23 09:31:01 +00:00
netko
ni
nije
nikoga
nikoje
2018-02-23 09:31:01 +00:00
nikoji
nikoju
nisam
nisi
nismo
niste
nisu
njega
njegov
njegova
njegovo
njemu
njezin
njezina
njezino
njih
njihov
njihova
njihovo
njim
njima
njoj
nju
no
o
od
odmah
on
ona
2018-02-23 09:31:01 +00:00
one
oni
ono
2018-02-23 09:31:01 +00:00
onu
onoj
onom
onim
onima
ova
2018-02-23 09:31:01 +00:00
ovaj
ovim
ovima
ovoj
pa
pak
2018-02-23 09:31:01 +00:00
pljus
po
pod
2018-02-23 09:31:01 +00:00
podalje
poimence
poizdalje
ponekad
pored
2018-02-23 09:31:01 +00:00
postrance
potajice
potrbuške
pouzdano
prije
s
sa
sam
samo
2018-02-23 09:31:01 +00:00
sasvim
sav
se
sebe
sebi
si
2018-02-23 09:31:01 +00:00
šic
smo
ste
2018-02-23 09:31:01 +00:00
što
šta
štogod
štagod
su
2018-02-23 09:31:01 +00:00
sva
sve
svi
2018-02-23 09:31:01 +00:00
svi
svog
svoj
svoja
svoje
2018-02-23 09:31:01 +00:00
svoju
svom
2018-02-23 09:31:01 +00:00
svu
ta
tada
taj
tako
te
tebe
tebi
ti
2018-02-23 09:31:01 +00:00
tim
tima
to
toj
tome
tu
tvoj
tvoja
tvoje
2018-02-23 09:31:01 +00:00
tvoji
tvoju
u
2018-02-23 09:31:01 +00:00
usprkos
utaman
uvijek
uz
2018-02-23 09:31:01 +00:00
uza
uzagrapce
uzalud
uzduž
valjda
vam
vama
vas
vaš
vaša
vaše
2018-02-23 09:31:01 +00:00
vašim
vašima
već
vi
2018-02-23 09:31:01 +00:00
vjerojatno
vjerovatno
vrh
vrlo
za
2018-02-23 09:31:01 +00:00
zaista
zar
2018-02-23 09:31:01 +00:00
zatim
zato
zbija
zbog
želeći
željah
željela
željele
željeli
željelo
željen
željena
željene
željeni
željenu
željeo
zimus
zum
""".split()
)