spaCy/spacy/lang/kn/stop_words.py

70 lines
1.1 KiB
Python

# coding: utf8
from __future__ import unicode_literals
# Stop words
STOP_WORD = set("""
ಮತ್ತು
ಹಾಗೂ
ಅವರು
ಅವರ
ಬಗ್ಗೆ
ಎಂಬ
ಆದರೆ
ಅವರನ್ನು
ಆದರೆ
ತಮ್ಮ
ಒಂದು
ಎಂದರು
ಮೇಲೆ
ಹೇಳಿದರು
ಸೇರಿದಂತೆ
ಬಳಿಕ
ಯಾವುದೇ
ಅವರಿಗೆ
ನಡೆದ
ಕುರಿತು
ಇದು
ಅವರು
ಕಳೆದ
ಇದೇ
ತಿಳಿಸಿದರು
ಹೀಗಾಗಿ
ಕೂಡ
ತನ್ನ
ತಿಳಿಸಿದ್ದಾರೆ
ನಾನು
ಹೇಳಿದ್ದಾರೆ
ಈಗ
ಎಲ್ಲ
ನನ್ನ
ನಮ್ಮ
ಈಗಾಗಲೇ
ಇದಕ್ಕೆ
ಹಲವು
ಇದೆ
ಮತ್ತೆ
ಮಾಡುವ
ನೀಡಿದರು
ನಾವು
ನೀಡಿದ
ಇದರಿಂದ
ಅದು
ಇದನ್ನು
ನೀಡಿದ್ದಾರೆ
ಅದನ್ನು
ಇಲ್ಲಿ
ಆಗ
ಬಂದಿದೆ.
ಅದೇ
ಇರುವ
ಅಲ್ಲದೆ
ಕೆಲವು
ನೀಡಿದೆ
ಇದರ
ಇನ್ನು
ನಡೆದಿದೆ
""".split())