Μιά αρχική προσέγγιση στο γλωσσικό ζήτημα των προκηρύξεων της 17 Νοέμβρη

No Comments

Η 17 Νοέμβρη υπήρξε μιά μακροβιότατη τρομοκρατική οργάνωση που έδρασε στην Ελλάδα από τον 1975 μέχρι και το 2002. Τα γνωστά μέλη της εκτίουν βαρύτατες ποινές και γενικά τα υπόλοιπα είναι όλα ιστορία. Καθώς μεγάλωσα διαβάζοντας για τα "κατορθώματά" τους, που μάλλον στοίχισαν πάρα πολύ στην Ελλάδα, και κυρίως τις προκηρύξεις τους, συμπέρανα πολύ νωρίς πως υπήρξαν τουλάχιστον τρεις φάσεις και φωνές διακριτές στις προκηρύξεις τους. Είναι η εντύπωσή μου πως ήδη από την προκήρυξη υπ' αριθμόν τέσσερα "1977-04 Απάντηση στα κόμματα και στις οργανώσεις" έχουμε να κάνουμε με έναν άλλο συγγραφέα.

Λόγω αυτής μου της πεποίθησης είχα βάλει στόχο να κάνω μιά ποσοτική ανάλυση των κειμένων αυτών, και μιά οπτική παρουσίαση της, εδώ και τουλάχιστον είκοσι πέντε χρόνια. Δυστυχώς τα εργαλεία που ήσαν διαθέσιμα είκοσι, δέκα, ακόμη και πέντε χρόνια πριν σήμαιναν πως αυτό θα μπορούσα να το κάνω μόνο στο πλαίσιο ενός διδακτορικού. Επίσης, δεν είχα τις προκηρύξεις. Σήμερα όμως οι προκηρύξεις αυτές είναι διαθέσιμες, χάρη στην έκδοσή τους από τις εκδόσεις Κάκτος. Κάποιες απ' αυτές είναι διαθέσιμες και στην ιστοσελίδα του Κουφοντίνα. Αλλά το πιο σημαντικό είναι πως πλέον natural language processing είναι πλέον διαθέσιμη με Python, R, Java, ακόμη και PHP. Επίσης υπάρχουν πλέον ένα κάρο βιβλιοθήκες για visualisations κάθε είδους δεδομένων, γραμμικών, μη γραμμικών κ.λπ.

Αυτή η ανάρτηση αποσκοπεί μόνο στο να δηλώσει την αρχή ενός πρότζεκτ. Για την αρχή αυτή επέλεξα να δημιουργήσω wordclouds των δέκα πρώτων προκηρύξεων της οργάνωσης. Το εγχείρημα βρίθει προβλημάτων. Πάρα πολλές λέξεις είναι "θόρυβος" (λέξεις όπως πάλι, τότε, και, η, ο κ.λπ). Επίσης η οργάνωση είχε το κουσούρι να γράφει σε περίεργα ελληνικά, με περίεργες συντμήσεις κι άλλες ιδιομορφίες). Για το σκοπό αυτό έγραψα ένα φίλτρο στα γρήγορα, σε PHP, το οποίο κάνει ένα πρώτο ξεσκαρτάρισμα. Παρ' όλα αυτά έγινε γρήγορα φανερό πως αυτό το φίλτρο δεν αρκεί. Θα πρέπει να δουλέψω ώστε να δημιουργήσω έναν αναλυτή που δεν ξεχωρίζει τον "συγκεκριμένο" από την "συγκεκριμένη" (stemming). Αυτό είναι το επόμενο βήμα, μαζί μ' έναν οπτικό "χάρτη" που να αποτυπώνει πότε εισήλθαν νέες λέξεις στο λεξιλόγιο της οργάνωσης, και πότε ξεχάστηκαν.

Πάντως καθώς έκανα αυτή την προκαταρκτική παραγωγή των wordclouds διαπίστωσα πως η λέξη η ρίζα "συγκεκριμ-" αναφέρεται 44 φορές στην προκήρυξη 4, όπου και πρωτοχρησιμοποιείται, και με λάθος ορθογραφία, δηλαδή με δύο "μ". Αν κάνατε κλίκ στο σύνδεσμο με το μπλόγκ του Κουφοντίνα ίσως να παρατηρήσατε πως στα κείμενά του γράφει τη λέξη κάποιες φορές με ένα "μ" κα κάποιες με δύο.

Αυτή η εργασία θα πάρει μήνες για να συμπληρωθεί. Για την ώρα μπορείτε να ρίξετε μιά ματιά στα wordclouds που έφτιαξα από τις δέκα πρώτες προκηρύξεις.

001-1975-12-26 Προς τύπο

002-1975-12 Γουέλς

003-1976-09 Μάλλιος

004-1977-04 Απάντηση κόμματα

005-1980-01-16 Πέτρου και Σταμούλης

006-1981-05-01 Για τους εμπρησμούς

007-1983 10 Τσάντες Βελούτσος

008-1984-04-03 Για Τζαντ

009-1984-07-20 Κατάλογος ενεργειών λαϊκής βίας

010-1984-00-00-Για το Οργανωτικό