mirror of https://github.com/explosion/spaCy.git
99 lines
7.7 KiB
Python
99 lines
7.7 KiB
Python
# -*- coding: utf-8 -*-
|
||
|
||
from __future__ import unicode_literals
|
||
|
||
# Stop words
|
||
|
||
# Link to greek stop words: https://www.translatum.gr/forum/index.php?topic=3550.0?topic=3550.0
|
||
|
||
|
||
STOP_WORDS = set("""
|
||
αδιάκοπα αι ακόμα ακόμη ακριβώς αλήθεια αληθινά αλλά αλλαχού άλλες άλλη άλλην
|
||
άλλης αλλιώς αλλιώτικα άλλο άλλοι αλλοιώς αλλοιώτικα άλλον άλλος άλλοτε αλλού
|
||
άλλους άλλων άμα άμεσα αμέσως αν ανά ανάμεσα αναμεταξύ άνευ αντί αντίπερα αντίς
|
||
άνω ανωτέρω άξαφνα απ απέναντι από απόψε άρα άραγε αργά αργότερο αριστερά αρκετά
|
||
αρχικά ας αύριο αυτά αυτές αυτή αυτήν αυτής αυτό αυτοί αυτόν αυτός αυτού αυτούς
|
||
αυτών αφότου αφού
|
||
|
||
βέβαια βεβαιότατα
|
||
|
||
γι για γρήγορα γύρω
|
||
|
||
δα δε δείνα δεν δεξιά δήθεν δηλαδή δι δια διαρκώς δικά δικό δικοί δικός δικού
|
||
δικούς διόλου δίπλα δίχως
|
||
|
||
εάν εαυτό εαυτόν εαυτού εαυτούς εαυτών έγκαιρα εγκαίρως εγώ εδώ ειδεμή είθε είμαι
|
||
είμαστε είναι εις είσαι είσαστε είστε είτε είχα είχαμε είχαν είχατε είχε είχες έκαστα
|
||
έκαστες έκαστη έκαστην έκαστης έκαστο έκαστοι έκαστον έκαστος εκάστου εκάστους εκάστων
|
||
εκεί εκείνα εκείνες εκείνη εκείνην εκείνης εκείνο εκείνοι εκείνον εκείνος εκείνου
|
||
εκείνους εκείνων εκτός εμάς εμείς εμένα εμπρός εν ένα έναν ένας ενός εντελώς εντός
|
||
εντωμεταξύ ενώ εξ έξαφνα εξήσ εξίσου έξω επάνω επειδή έπειτα επί επίσης επομένως εσάς
|
||
εσείς εσένα έστω εσύ ετέρα ετέραι ετέρας έτερες έτερη έτερης έτερο έτεροι έτερον έτερος
|
||
ετέρου έτερους ετέρων ετούτα ετούτες ετούτη ετούτην ετούτης ετούτο ετούτοι ετούτον
|
||
ετούτος ετούτου ετούτους ετούτων έτσι εύγε ευθύς ευτυχώς εφεξής έχει έχεις έχετε
|
||
εχθές έχομε έχουμε έχουν εχτές έχω έως
|
||
|
||
η ήδη ήμασταν ήμαστε ήμουν ήσασταν ήσαστε ήσουν ήταν ήτανε ήτοι ήττον
|
||
|
||
θα
|
||
|
||
ι ίδια ίδιαν ιδίας ίδιες ίδιο ίδιοι ίδιον ίδιοσ ιδίου ίδιους ίδιων ιδίως ιι ιιι
|
||
ίσαμε ίσια ίσως
|
||
|
||
κάθε καθεμία καθεμίας καθένα καθένας καθενός καθετί καθόλου καθώς και κακά κακώς καλά
|
||
καλώς καμία καμίαν καμίας κάμποσα κάμποσες κάμποση κάμποσην κάμποσης κάμποσο κάμποσοι
|
||
κάμποσον κάμποσος κάμποσου κάμποσους κάμποσων κανείς κάνεν κανένα κανέναν κανένας
|
||
κανενός κάποια κάποιαν κάποιας κάποιες κάποιο κάποιοι κάποιον κάποιος κάποιου κάποιους
|
||
κάποιων κάποτε κάπου κάπως κατ κατά κάτι κατιτί κατόπιν κάτω κιόλας κλπ κοντά κτλ κυρίως
|
||
|
||
λιγάκι λίγο λιγότερο λόγω λοιπά λοιπόν
|
||
|
||
μα μαζί μακάρι μακρυά μάλιστα μάλλον μας με μεθαύριο μείον μέλει μέλλεται μεμιάς μεν
|
||
μερικά μερικές μερικοί μερικούς μερικών μέσα μετ μετά μεταξύ μέχρι μη μήδε μην μήπως
|
||
μήτε μια μιαν μιας μόλις μολονότι μονάχα μόνες μόνη μόνην μόνης μόνο μόνοι μονομιάς
|
||
μόνος μόνου μόνους μόνων μου μπορεί μπορούν μπράβο μπρος
|
||
|
||
να ναι νωρίς
|
||
|
||
ξανά ξαφνικά
|
||
|
||
ο οι όλα όλες όλη όλην όλης όλο ολόγυρα όλοι όλον ολονέν όλος ολότελα όλου όλους όλων
|
||
όλως ολωσδιόλου όμως όποια οποιαδήποτε οποίαν οποιανδήποτε οποίας οποιασδήποτε οποιδήποτε
|
||
όποιες οποιεσδήποτε όποιο οποιοδηήποτε όποιοι όποιον οποιονδήποτε όποιος οποιοσδήποτε
|
||
οποίου οποιουδήποτε οποίους οποιουσδήποτε οποίων οποιωνδήποτε όποτε οποτεδήποτε όπου
|
||
οπουδήποτε όπως ορισμένα ορισμένες ορισμένων ορισμένως όσα οσαδήποτε όσες οσεσδήποτε
|
||
όση οσηδήποτε όσην οσηνδήποτε όσης οσησδήποτε όσο οσοδήποτε όσοι οσοιδήποτε όσον οσονδήποτε
|
||
όσος οσοσδήποτε όσου οσουδήποτε όσους οσουσδήποτε όσων οσωνδήποτε όταν ότι οτιδήποτε
|
||
ότου ου ουδέ ούτε όχι
|
||
|
||
πάλι πάντοτε παντού πάντως πάρα πέρα πέρι περίπου περισσότερο πέρσι πέρυσι πια πιθανόν
|
||
πιο πίσω πλάι πλέον πλην ποιά ποιάν ποιάς ποιές ποιό ποιοί ποιόν ποιός ποιού ποιούς
|
||
ποιών πολύ πόσες πόση πόσην πόσης πόσοι πόσος πόσους πότε πού πούθε πουθενά πρέπει
|
||
πριν προ προκειμένου πρόκειται πρόπερσι προς προτού προχθές προχτές πρωτύτερα πώς
|
||
|
||
σαν σας σε σεις σήμερα σιγά σου στα στη στην στης στις στο στον στου στους στων συγχρόνως
|
||
συν συνάμα συνεπώς συνήθως συχνά συχνάς συχνές συχνή συχνήν συχνής συχνό συχνοί συχνόν
|
||
συχνός συχνού συχνούς συχνών συχνώς σχεδόν σωστά
|
||
|
||
τα τάδε ταύτα ταύτες ταύτη ταύτην ταύτης ταύτοταύτον ταύτος ταύτου ταύτων τάχα τάχατε
|
||
τελικά τελικώς τες τέτοια τέτοιαν τέτοιας τέτοιες τέτοιο τέτοιοι τέτοιον τέτοιος τέτοιου
|
||
τέτοιους τέτοιων τη την της τι τίποτα τίποτε τις το τοι τον τοσ τόσα τόσες τόση τόσην
|
||
τόσης τόσο τόσοι τόσον τόσος τόσου τόσους τόσων τότε του τουλάχιστο τουλάχιστον τους τούτα
|
||
τούτες τούτη τούτην τούτης τούτο τούτοι τούτοις τούτον τούτος τούτου τούτους τούτων τυχόν
|
||
των τώρα
|
||
|
||
υπ υπέρ υπό υπόψη υπόψιν ύστερα
|
||
|
||
φέτος
|
||
|
||
χαμηλά χθες χτες χωρίς χωριστά
|
||
|
||
ψηλά
|
||
|
||
ω ωραία ως ωσάν ωσότου ώσπου ώστε ωστόσο ωχ
|
||
""".split())
|
||
|
||
|
||
|
||
|