mirror of https://github.com/explosion/spaCy.git
27 lines
635 B
Python
27 lines
635 B
Python
|
# coding: utf8
|
|||
|
from __future__ import unicode_literals
|
|||
|
|
|||
|
|
|||
|
_exc = {
|
|||
|
# Slang
|
|||
|
"ћале": "отац",
|
|||
|
"кева": "мајка",
|
|||
|
"смор": "досада",
|
|||
|
"кец": "јединица",
|
|||
|
"тебра": "брат",
|
|||
|
"штребер": "ученик",
|
|||
|
"факс": "факултет",
|
|||
|
"профа": "професор",
|
|||
|
"бус": "аутобус",
|
|||
|
"пискарало": "службеник",
|
|||
|
"бакутанер": "бака",
|
|||
|
"џибер": "простак"
|
|||
|
}
|
|||
|
|
|||
|
|
|||
|
NORM_EXCEPTIONS = {}
|
|||
|
|
|||
|
for string, norm in _exc.items():
|
|||
|
NORM_EXCEPTIONS[string] = norm
|
|||
|
NORM_EXCEPTIONS[string.title()] = norm
|