spaCy/website/docs/api/language-models.jade

//- 💫 DOCS > API > LANGUAGE MODELS

include ../../_includes/_mixins

p You can download data packs that add the following capabilities to spaCy.

+aside-code("Download language models", "bash").
    python -m spacy.en.download all
    python -m spacy.de.download all

+table([ "Language", "Token", "SBD", "Lemma", "POS", "NER", "Dep", "Vector", "Sentiment"])
    +row
        +cell English #[code en]
        each icon in [ "pro", "pro", "pro", "pro", "pro", "pro", "pro", "con" ]
            +cell.u-text-center #[+procon(icon)]

    +row
        +cell German #[code de]
        each icon in [ "pro", "pro", "con", "pro", "pro", "pro", "pro", "con" ]
            +cell.u-text-center #[+procon(icon)]

    +row
        +cell Chinese #[code zh]
        each icon in [ "pro", "con", "con", "con", "con", "con", "con", "con" ]
            +cell.u-text-center #[+procon(icon)]

p
    |  Chinese tokenization requires the
    |  #[+a("https://github.com/fxsjy/jieba") Jieba] library. Statistical
    |  models are coming soon. Tokenizers for Spanish, French, Italian and
    |  Portuguese are now under development.
Fix typo 2016-11-02 10:25:09 +00:00			`//- 💫 DOCS > API > LANGUAGE MODELS`
Add language models to API docs (fixes #598) 2016-11-02 10:24:13 +00:00
			`include ../../_includes/_mixins`

			`p You can download data packs that add the following capabilities to spaCy.`

			`+aside-code("Download language models", "bash").`
			`python -m spacy.en.download all`
			`python -m spacy.de.download all`

			`+table([ "Language", "Token", "SBD", "Lemma", "POS", "NER", "Dep", "Vector", "Sentiment"])`
			`+row`
			`+cell English #[code en]`
			`each icon in [ "pro", "pro", "pro", "pro", "pro", "pro", "pro", "con" ]`
			`+cell.u-text-center #[+procon(icon)]`

			`+row`
			`+cell German #[code de]`
			`each icon in [ "pro", "pro", "con", "pro", "pro", "pro", "pro", "con" ]`
			`+cell.u-text-center #[+procon(icon)]`

Update language models docs 2016-11-05 01:50:52 +00:00			`+row`
			`+cell Chinese #[code zh]`
			`each icon in [ "pro", "con", "con", "con", "con", "con", "con", "con" ]`
			`+cell.u-text-center #[+procon(icon)]`

Fix formatting 2016-11-03 00:52:31 +00:00			`p`
Update language models docs 2016-11-05 01:50:52 +00:00			`\| Chinese tokenization requires the`
			`\| #[+a("https://github.com/fxsjy/jieba") Jieba] library. Statistical`
			`\| models are coming soon. Tokenizers for Spanish, French, Italian and`
			`\| Portuguese are now under development.`