spaCy/spacy/lang/ta/stop_words.py

136 lines
2.0 KiB
Python
Raw Normal View History

# coding: utf8
from __future__ import unicode_literals
# Stop words
2019-02-07 20:00:04 +00:00
STOP_WORDS = set(
"""
ஒர
என
மற
இந
இத
என
எனபத
பல
ஆக
அலலத
அவர
உள
அந
இவர
என
தல
என
இர
ி
என
வந
இதன
அத
அவன
பலர
என
ினர
இர
தனத
உளளத
என
அதன
தன
ிறக
அவரகள
வர
அவள
ஆகி
இரதத
உளளன
வந
இர
ிகவ
இங
ஓர
இவ
இநதக
பறி
வர
இர
இதி
இப
அவரத
மட
இநதப
என
ி
ஆகி
எனக
இன
அநதப
அன
ஒர
ி
அங
பல
ி
அத
பறி
உன
அதி
அநதக
இதன
அவ
அத
ஏன
எனபத
எல
மட
இங
அங
இடம
இடதி
அதி
அதற
எனவ
ி
ி
மற
ி
எந
எனவ
எனபபட
எனி
அட
இதன
இத
இநதத
இதற
அதன
தவி
வரி
சற
எனக
2019-02-07 20:00:04 +00:00
""".split()
)