spaCy/spacy/lang/da/__init__.py

# coding: utf8
from __future__ import unicode_literals

from .tokenizer_exceptions import TOKENIZER_EXCEPTIONS
from .norm_exceptions import NORM_EXCEPTIONS
from .punctuation import TOKENIZER_INFIXES, TOKENIZER_SUFFIXES
from .stop_words import STOP_WORDS
from .lex_attrs import LEX_ATTRS
from .morph_rules import MORPH_RULES
from ..tag_map import TAG_MAP
from .lemmatizer import LOOKUP

from ..tokenizer_exceptions import BASE_EXCEPTIONS
from ..norm_exceptions import BASE_NORMS
from ...language import Language
from ...attrs import LANG, NORM
from ...util import update_exc, add_lookups


class DanishDefaults(Language.Defaults):
    lex_attr_getters = dict(Language.Defaults.lex_attr_getters)
    lex_attr_getters.update(LEX_ATTRS)
    lex_attr_getters[LANG] = lambda text: 'da'
    lex_attr_getters[NORM] = add_lookups(Language.Defaults.lex_attr_getters[NORM],
                                         BASE_NORMS, NORM_EXCEPTIONS)
    tokenizer_exceptions = update_exc(BASE_EXCEPTIONS, TOKENIZER_EXCEPTIONS)
    morph_rules = MORPH_RULES
    infixes = TOKENIZER_INFIXES
    suffixes = TOKENIZER_SUFFIXES
    tag_map = TAG_MAP
    stop_words = STOP_WORDS
    lemma_lookup = LOOKUP


class Danish(Language):
    lang = 'da'
    Defaults = DanishDefaults


__all__ = ['Danish']
Add Danish language data 2017-05-10 19:15:12 +00:00			`# coding: utf8`
			`from __future__ import unicode_literals`

			`from .tokenizer_exceptions import TOKENIZER_EXCEPTIONS`
Add several Danish alternative spellings 2017-11-27 12:35:41 +00:00			`from .norm_exceptions import NORM_EXCEPTIONS`
Tune Danish tokenizer to more closely match tokenization in Universal Dependencies. 2017-12-20 16:36:52 +00:00			`from .punctuation import TOKENIZER_INFIXES, TOKENIZER_SUFFIXES`
Add Danish language data 2017-05-10 19:15:12 +00:00			`from .stop_words import STOP_WORDS`
Add like_num functionality to Danish 2017-07-03 13:45:31 +00:00			`from .lex_attrs import LEX_ATTRS`
Add Morph_rules. (TODO: Not working?) 2017-07-03 13:49:09 +00:00			`from .morph_rules import MORPH_RULES`
Add Tag_map for Danish 2017-07-03 13:51:58 +00:00			`from ..tag_map import TAG_MAP`
Add Danish lemmatizer (#2184) * add danish lemmatizer * fill contributor agreement 2018-04-07 17:07:28 +00:00			`from .lemmatizer import LOOKUP`
Add Danish language data 2017-05-10 19:15:12 +00:00
			`from ..tokenizer_exceptions import BASE_EXCEPTIONS`
Add norm exceptions to other Language classes 2017-06-03 20:29:21 +00:00			`from ..norm_exceptions import BASE_NORMS`
Add Danish language data 2017-05-10 19:15:12 +00:00			`from ...language import Language`
Add norm exceptions to other Language classes 2017-06-03 20:29:21 +00:00			`from ...attrs import LANG, NORM`
			`from ...util import update_exc, add_lookups`
Add Danish language data 2017-05-10 19:15:12 +00:00

Move Defaults subclass to module scope (necessary for pickling) 2017-05-20 17:02:27 +00:00			`class DanishDefaults(Language.Defaults):`
			`lex_attr_getters = dict(Language.Defaults.lex_attr_getters)`
Add like_num functionality to Danish 2017-07-03 13:45:31 +00:00			`lex_attr_getters.update(LEX_ATTRS)`
Move Defaults subclass to module scope (necessary for pickling) 2017-05-20 17:02:27 +00:00			`lex_attr_getters[LANG] = lambda text: 'da'`
Add several Danish alternative spellings 2017-11-27 12:35:41 +00:00			`lex_attr_getters[NORM] = add_lookups(Language.Defaults.lex_attr_getters[NORM],`
			`BASE_NORMS, NORM_EXCEPTIONS)`
Move Defaults subclass to module scope (necessary for pickling) 2017-05-20 17:02:27 +00:00			`tokenizer_exceptions = update_exc(BASE_EXCEPTIONS, TOKENIZER_EXCEPTIONS)`
Enable morph rules for Danish 2017-11-30 14:58:02 +00:00			`morph_rules = MORPH_RULES`
Tune Danish tokenizer to more closely match tokenization in Universal Dependencies. 2017-12-20 16:36:52 +00:00			`infixes = TOKENIZER_INFIXES`
			`suffixes = TOKENIZER_SUFFIXES`
Merge branch 'develop' into support-danish 2017-10-24 09:53:19 +00:00			`tag_map = TAG_MAP`
Don't make copies of language data components 2017-10-11 13:34:55 +00:00			`stop_words = STOP_WORDS`
Add Danish lemmatizer (#2184) * add danish lemmatizer * fill contributor agreement 2018-04-07 17:07:28 +00:00			`lemma_lookup = LOOKUP`
Add Danish language data 2017-05-10 19:15:12 +00:00

Move Defaults subclass to module scope (necessary for pickling) 2017-05-20 17:02:27 +00:00			`class Danish(Language):`
			`lang = 'da'`
			`Defaults = DanishDefaults`
Add Danish language data 2017-05-10 19:15:12 +00:00

			`__all__ = ['Danish']`