spaCy/spacy/lang/kn/stop_words.py

71 lines
1.0 KiB
Python

# coding: utf8
from __future__ import unicode_literals
STOP_WORD = set(
"""
ಮತ್ತು
ಹಾಗೂ
ಅವರು
ಅವರ
ಬಗ್ಗೆ
ಎಂಬ
ಆದರೆ
ಅವರನ್ನು
ಆದರೆ
ತಮ್ಮ
ಒಂದು
ಎಂದರು
ಮೇಲೆ
ಹೇಳಿದರು
ಸೇರಿದಂತೆ
ಬಳಿಕ
ಯಾವುದೇ
ಅವರಿಗೆ
ನಡೆದ
ಕುರಿತು
ಇದು
ಅವರು
ಕಳೆದ
ಇದೇ
ತಿಳಿಸಿದರು
ಹೀಗಾಗಿ
ಕೂಡ
ತನ್ನ
ತಿಳಿಸಿದ್ದಾರೆ
ನಾನು
ಹೇಳಿದ್ದಾರೆ
ಈಗ
ಎಲ್ಲ
ನನ್ನ
ನಮ್ಮ
ಈಗಾಗಲೇ
ಇದಕ್ಕೆ
ಹಲವು
ಇದೆ
ಮತ್ತೆ
ಮಾಡುವ
ನೀಡಿದರು
ನಾವು
ನೀಡಿದ
ಇದರಿಂದ
ಅದು
ಇದನ್ನು
ನೀಡಿದ್ದಾರೆ
ಅದನ್ನು
ಇಲ್ಲಿ
ಆಗ
ಬಂದಿದೆ.
ಅದೇ
ಇರುವ
ಅಲ್ಲದೆ
ಕೆಲವು
ನೀಡಿದೆ
ಇದರ
ಇನ್ನು
ನಡೆದಿದೆ
""".split()
)