mirror of https://github.com/explosion/spaCy.git
Merge branch 'master' of https://github.com/explosion/spaCy
This commit is contained in:
commit
44dd247e73
|
@ -4,7 +4,7 @@ from __future__ import unicode_literals
|
||||||
from .. import language_data as base
|
from .. import language_data as base
|
||||||
from ..language_data import update_exc, strings_to_exc
|
from ..language_data import update_exc, strings_to_exc
|
||||||
|
|
||||||
from .stop_words import STOP_WORDS
|
from .word_sets import STOP_WORDS, NUM_WORDS
|
||||||
|
|
||||||
|
|
||||||
STOP_WORDS = set(STOP_WORDS)
|
STOP_WORDS = set(STOP_WORDS)
|
||||||
|
|
|
@ -41,3 +41,22 @@ want waren was wat we wel werd wezen wie wij wil worden
|
||||||
|
|
||||||
zal ze zei zelf zich zij zijn zo zonder zou
|
zal ze zei zelf zich zij zijn zo zonder zou
|
||||||
""".split())
|
""".split())
|
||||||
|
|
||||||
|
|
||||||
|
# Number words
|
||||||
|
|
||||||
|
NUM_WORDS = set("""
|
||||||
|
nul een één twee drie vier vijf zes zeven acht negen tien elf twaalf dertien
|
||||||
|
veertien twintig dertig veertig vijftig zestig zeventig tachtig negentig honderd
|
||||||
|
duizend miljoen miljard biljoen biljard triljoen triljard
|
||||||
|
""".split())
|
||||||
|
|
||||||
|
|
||||||
|
# Ordinal words
|
||||||
|
|
||||||
|
ORDINAL_WORDS = set("""
|
||||||
|
eerste tweede derde vierde vijfde zesde zevende achtste negende tiende elfde
|
||||||
|
twaalfde dertiende veertiende twintigste dertigste veertigste vijftigste
|
||||||
|
zestigste zeventigste tachtigste negentigste honderdste duizendste miljoenste
|
||||||
|
miljardste biljoenste biljardste triljoenste triljardste
|
||||||
|
""".split())
|
Loading…
Reference in New Issue