spaCy/spacy/pt/__init__.py

# coding: utf8
from __future__ import unicode_literals, print_function

from ..language import Language
from ..attrs import LANG

from .language_data import *
from ..lemmatizerlookup import Lemmatizer
from .lemmatization import LOOK_UP

class Portuguese(Language):
    lang = 'pt'

    class Defaults(Language.Defaults):
        lex_attr_getters = dict(Language.Defaults.lex_attr_getters)
        lex_attr_getters[LANG] = lambda text: 'pt'

        tokenizer_exceptions = TOKENIZER_EXCEPTIONS
        stop_words = STOP_WORDS

        @classmethod
        def create_lemmatizer(cls, nlp=None):
            return Lemmatizer(LOOK_UP)


EXPORT = Portuguese