spaCy/spacy/pt/language_data.py

# encoding: utf8
from __future__ import unicode_literals

from ..symbols import *
from ..language_data import TOKENIZER_PREFIXES
from ..language_data import TOKENIZER_SUFFIXES
from ..language_data import TOKENIZER_INFIXES


def strings_to_exc(orths):
    return {orth: [{ORTH: orth}] for orth in orths}


PRON_LEMMA = "-PRON-"


TAG_MAP = {

}

STOP_WORDS = set("""

""".split())


TOKENIZER_EXCEPTIONS = {

}


ORTH_ONLY = {

}
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00			`# encoding: utf8`
			`from __future__ import unicode_literals`

Update Portuguese language data 2016-12-08 19:41:41 +00:00			`from ..symbols import *`
			`from ..language_data import TOKENIZER_PREFIXES`
			`from ..language_data import TOKENIZER_SUFFIXES`
			`from ..language_data import TOKENIZER_INFIXES`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00

Update Portuguese language data 2016-12-08 19:41:41 +00:00			`def strings_to_exc(orths):`
			`return {orth: [{ORTH: orth}] for orth in orths}`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00

Update Portuguese language data 2016-12-08 19:41:41 +00:00			`PRON_LEMMA = "-PRON-"`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00

Update Portuguese language data 2016-12-08 19:41:41 +00:00			`TAG_MAP = {`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00
Update Portuguese language data 2016-12-08 19:41:41 +00:00			`}`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00
Update Portuguese language data 2016-12-08 19:41:41 +00:00			`STOP_WORDS = set("""`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00
Update Portuguese language data 2016-12-08 19:41:41 +00:00			`""".split())`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00

Update Portuguese language data 2016-12-08 19:41:41 +00:00			`TOKENIZER_EXCEPTIONS = {`
Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00
			`}`


Update Portuguese language data 2016-12-08 19:41:41 +00:00			`ORTH_ONLY = {`

Stub out support for French, Spanish, Italian and Portuguese 2016-11-02 19:02:41 +00:00			`}`