spaCy/spacy/lang/si/stop_words.py

52 lines
564 B
Python

# coding: utf8
from __future__ import unicode_literals
# Stop words
STOP_WORDS = set("""
අතර
එච්චර
එපමණ
එලෙස
එවිට
කට
කදී
කින්
ක්
තුර
ත්
නමුත්
නොහොත්
පමණ
පමණි
මෙච්චර
මෙපමණ
මෙලෙස
මෙවිට
මේ
යි
ලදී
ලෙස
වගේ
වන
විට
විටෙක
විතර
විය
වුව
වුවත්
වුවද
වූ
සමඟ
සහ
හා
හෙවත්
හෝ
""".split())