spaCy/spacy/lang/sv/lemmatizer/__init__.py

# coding: utf8
from __future__ import unicode_literals

from .lookup import LOOKUP


LEMMA_RULES = {
    "noun": [
        ["t", ""],
        ["n", ""],
        ["na", ""],
        ["na", "e"],
        ["or", "a"],
        ["orna", "a"],
        ["et", ""],
        ["en", ""],
        ["en", "e"],
        ["er", ""],
        ["erna", ""],
        ["ar", "e"],
        ["ar", ""],
        ["lar", "el"],
        ["arna", "e"],
        ["arna", ""],
        ["larna", "el"]
    ],

    "verb": [
        ["r", ""],
        ["de", ""],
        ["t", ""],
        ["er", ""],
        ["te", ""],
        ["a", ""],
        ["e", ""],
        ["t", "d"],
        ["tt", "d"],
        ["tt", ""],
        ["ev", "iv"],
        ["ack", "ick"],
        ["ög", "yg"],
        ["it", ""],
        ["uckit", "ick"],
        ["ugit", "yg"],
        ["it", "et"],
        ["id", "ed"],
        ["ip", "ep"],
        ["iv", "ev"],
        ["in", "en"],
        ["ik", "ek"],
        ["ig", "eg"],
        ["ind", ""],
        ["inn", "ann"],
        ["nder", "nd"],
        ["inner", "inn"],
        ["and", "ind"],
        ["ann", "inn"],
        ["s", ""],
        ["anns", "inn"],
        ["undit", "ind"],
        ["unnit", "inn"],
        ["unnits", "inn"],
        ["uppit", "ipp"],
        ["ungit", "ing"],
        ["öd", "ud"],
        ["öt", "jut"],
        ["öt", "ut"],
        ["ög", "ug"],
        ["ögg", "ugg"],
        ["öng", "ung"],
        ["önk", "unk"],
        ["öt", "yt"],
        ["utit", "yt"],
        ["ös", "ys"],
        ["öv", "yv"],
        ["uvit", "yv"],
        ["öp", "yp"],
        ["upit", "yp"],
        ["ök", "yk"],
        ["ukit", "yk"],
        ["or", "ar"],
        ["öll", "all"],
        ["ät", "åt"],
        ["öll", "åll"],
        ["or", "är"],
        ["urit", "är"],
        ["åt", "ät"],
        ["ar", "är"],
        ["alt", "ält"],
        ["ultit", "ält"]
    ],

    "adj": [
        ["are", ""],
        ["ast", ""],
        ["re", ""],
        ["st", ""],
        ["ägre", "åg"],
        ["ägst", "åg"],
        ["ängre", "ång"],
        ["ängst", "ång"],
        ["örre", "or"],
        ["örst", "or"]
    ],

    "punct": [
        ["“", "\""],
        ["”", "\""],
        ["\u2018", "'"],
        ["\u2019", "'"]
    ]
}
Use consistent unicode declarations 2017-03-12 12:07:28 +00:00			`# coding: utf8`
Added swedish lemma rules 2017-02-04 16:53:32 +00:00			`from __future__ import unicode_literals`

Reorganise Swedish language data 2017-05-08 13:54:29 +00:00			`from .lookup import LOOKUP`

Added swedish lemma rules 2017-02-04 16:53:32 +00:00
			`LEMMA_RULES = {`
			`"noun": [`
			`["t", ""],`
			`["n", ""],`
			`["na", ""],`
			`["na", "e"],`
			`["or", "a"],`
			`["orna", "a"],`
			`["et", ""],`
			`["en", ""],`
			`["en", "e"],`
			`["er", ""],`
			`["erna", ""],`
			`["ar", "e"],`
			`["ar", ""],`
			`["lar", "el"],`
			`["arna", "e"],`
			`["arna", ""],`
			`["larna", "el"]`
			`],`

Added regular verb rules for Swedish 2017-02-17 09:04:04 +00:00			`"verb": [`
			`["r", ""],`
			`["de", ""],`
			`["t", ""],`
			`["er", ""],`
			`["te", ""],`
			`["a", ""],`
			`["e", ""],`
			`["t", "d"],`
			`["tt", "d"],`
			`["tt", ""],`
			`["ev", "iv"],`
			`["ack", "ick"],`
			`["ög", "yg"],`
			`["it", ""],`
			`["uckit", "ick"],`
			`["ugit", "yg"],`
			`["it", "et"],`
			`["id", "ed"],`
			`["ip", "ep"],`
			`["iv", "ev"],`
			`["in", "en"],`
			`["ik", "ek"],`
			`["ig", "eg"],`
			`["ind", ""],`
			`["inn", "ann"],`
			`["nder", "nd"],`
			`["inner", "inn"],`
			`["and", "ind"],`
			`["ann", "inn"],`
			`["s", ""],`
			`["anns", "inn"],`
			`["undit", "ind"],`
			`["unnit", "inn"],`
			`["unnits", "inn"],`
			`["uppit", "ipp"],`
			`["ungit", "ing"],`
			`["öd", "ud"],`
			`["öt", "jut"],`
			`["öt", "ut"],`
			`["ög", "ug"],`
			`["ögg", "ugg"],`
			`["öng", "ung"],`
			`["önk", "unk"],`
			`["öt", "yt"],`
			`["utit", "yt"],`
			`["ös", "ys"],`
			`["öv", "yv"],`
			`["uvit", "yv"],`
			`["öp", "yp"],`
			`["upit", "yp"],`
			`["ök", "yk"],`
			`["ukit", "yk"],`
			`["or", "ar"],`
			`["öll", "all"],`
			`["ät", "åt"],`
			`["öll", "åll"],`
			`["or", "är"],`
			`["urit", "är"],`
			`["åt", "ät"],`
			`["ar", "är"],`
			`["alt", "ält"],`
			`["ultit", "ält"]`
			`],`

Added swedish lemma rules 2017-02-04 16:53:32 +00:00			`"adj": [`
			`["are", ""],`
			`["ast", ""],`
			`["re", ""],`
			`["st", ""],`
			`["ägre", "åg"],`
			`["ägst", "åg"],`
			`["ängre", "ång"],`
			`["ängst", "ång"],`
			`["örre", "or"],`
Added regular verb rules for Swedish 2017-02-17 09:04:04 +00:00			`["örst", "or"]`
Added swedish lemma rules 2017-02-04 16:53:32 +00:00			`],`

			`"punct": [`
			`["“", "\""],`
			`["”", "\""],`
			`["\u2018", "'"],`
			`["\u2019", "'"]`
			`]`
			`}`