spaCy/spacy/lang/fa/lemmatizer/_lemma_rules.py

# coding: utf8
from __future__ import unicode_literals


ADJECTIVE_RULES = [
    ["ین", ""],
    ["\u200cترین", ""],
    ["ترین", ""],
    ["\u200cتر", ""],
    ["تر", ""],
    ["\u200cای", ""],
    # ["ایی", "ا"],
    # ["ویی", "و"],
    # ["ی", ""],
    # ["مند", ""],
    # ["گین", ""],
    # ["مین", ""],
    # ["ناک", ""],
    # ["سار", ""],
    # ["\u200cوار", ""],
    # ["وار", ""]
]


NOUN_RULES = [
    ["ایان", "ا"],
    ["ویان", "و"],
    ["ایانی", "ا"],
    ["ویانی", "و"],
    ["گان", "ه"],
    ["گانی", "ه"],
    ["گان", ""],
    ["گانی", ""],
    ["ان", ""],
    ["انی", ""],
    ["ات", ""],
    ["ات", "ه"],
    ["ات", "ت"],
    ["اتی", ""],
    ["اتی", "ه"],
    ["اتی", "ت"],
    # ['ین', ''],
    # ['ینی', ''],
    # ['ون', ''],
    # ['ونی', ''],
    ["\u200cها", ""],
    ["ها", ""],
    ["\u200cهای", ""],
    ["های", ""],
    ["\u200cهایی", ""],
    ["هایی", ""],
]


VERB_RULES = []


PUNCT_RULES = [["“", '"'], ["”", '"'], ["\u2018", "'"], ["\u2019", "'"]]