spaCy/spacy/lang/si/stop_words.py

52 lines
554 B
Python

# coding: utf8
from __future__ import unicode_literals
STOP_WORDS = set(
"""
අතර
එච්චර
එපමණ
එලෙස
එවිට
කට
කදී
කින්
ක්
තුර
ත්
නමුත්
නොහොත්
පමණ
පමණි
මෙච්චර
මෙපමණ
මෙලෙස
මෙවිට
මේ
යි
ලදී
ලෙස
වගේ
වන
විට
විටෙක
විතර
විය
වුව
වුවත්
වුවද
වූ
සමඟ
සහ
හා
හෙවත්
හෝ
""".split()
)