This commit is contained in:
Matthew Honnibal 2017-07-22 13:35:30 +02:00
commit 44dd247e73
2 changed files with 20 additions and 1 deletions

View File

@ -4,7 +4,7 @@ from __future__ import unicode_literals
from .. import language_data as base from .. import language_data as base
from ..language_data import update_exc, strings_to_exc from ..language_data import update_exc, strings_to_exc
from .stop_words import STOP_WORDS from .word_sets import STOP_WORDS, NUM_WORDS
STOP_WORDS = set(STOP_WORDS) STOP_WORDS = set(STOP_WORDS)

View File

@ -41,3 +41,22 @@ want waren was wat we wel werd wezen wie wij wil worden
zal ze zei zelf zich zij zijn zo zonder zou zal ze zei zelf zich zij zijn zo zonder zou
""".split()) """.split())
# Number words
NUM_WORDS = set("""
nul een één twee drie vier vijf zes zeven acht negen tien elf twaalf dertien
veertien twintig dertig veertig vijftig zestig zeventig tachtig negentig honderd
duizend miljoen miljard biljoen biljard triljoen triljard
""".split())
# Ordinal words
ORDINAL_WORDS = set("""
eerste tweede derde vierde vijfde zesde zevende achtste negende tiende elfde
twaalfde dertiende veertiende twintigste dertigste veertigste vijftigste
zestigste zeventigste tachtigste negentigste honderdste duizendste miljoenste
miljardste biljoenste biljardste triljoenste triljardste
""".split())