Πέμπτη, Μαΐου 12, 2005

Θησαυρός Open Office

Αυτός που ενδιαφέρθηκε πρώτος και ξεκίνησε τις δοκιμές ήταν ο Βασίλης Φραγκογιαννάκης, όταν γνωρίστηκε με τον Δημήτρη Κορμπέτη και τον Μιχάλη Καμπριάνη στο workshop που έγινε στο Ναύπλιο.

Χρησιμοποιώντας την gawk κάναμε δοκιμές σε Windows. Είχαμε διάφορα αποτελέσματα αλλά στην αρχή δεν ξέραμε ότι το πρόγραμμα awk δεν έσβηνε τα αρχεία dat, idx οπότε συνήθως τα αποτελέσματα ήταν ίδια.

Αυτός που βοήθησε ήταν ο Daniel Naber, ο οποίος μου είπε ότι όσες λέξεις είναι στο ένα αρχείο, ακριβώς οι ίδιες πρέπει να είναι και στο άλλο αρχείο. Όταν έκανα δοκιμές με ελληνικές λέξεις δεν είχα αποτελέσματα. Όταν χρησιμοποίησα αγγλικούς χαρακτήρες τότε είδα ότι ο θησαυρός δουλεύει.

Έτσι, χτες, έστειλα στη λίστα i18ngr και κατά λάθος στη hellug (ήθελα να στείλω στην LGU) ζητώντας βοήθεια από κάποιον που να ξέρει awk νομίζωντας ότι η awk δεν αναγνωρίζει τους ελληνικούς χαρακτήρες. Ανταποκρίθηκε ο Αλέξης Ζάβρας ο Μιχάλης Ιατρού, στους οποίους έστειλα τα αρχεία εισόδου και εξόδου που είχα με ελληνικούς και αγγλικούς χαρακτήρες. Ο Αλέξης Ζάβρας μου είπε ότι τα αποτελέσματα είναι ίδια. Βέβαια αυτά που έστειλα στον Αλέξη δουλεύαν σε Linux. Οπότε κατάλαβα ότι έφταιγε η κωδικοποίηση των αρχείων εισόδου που ήταν ANSI (Notepad). Έτσι κάνοντας τη μετατροπή σε ISO-8859-7 των αρχείων εισόδου είδα το θησαυρό δουλεύει.

Έτσι ξεπεράσαμε το πρώτο βασικό εμπόδιο.


Τώρα μένει να συγκροτηθεί μια ομάδα που θα μαζέψει λέξεις για το θησαυρό. Ο Δημήτρης Κορμπέτης πρότεινε τη δημιουργία εξυπηρετητή openthesaurus κάτι το οποίο θα βοηθήσει πάρα πολύ.

6 σχόλια:

Ανώνυμος είπε...

"Τώρα μένει να συγκροτηθεί μια ομάδα που θα μαζέψει λέξεις για το θησαυρό" ????
Και το θεωρείς απλό αυτό? Αυτό είναι και το πιό δύσκολο κομματι της δουλειάς....Αν δεν το κάνετε εσείς που το ξεκινήσατε δεν θα το κάνει κανείς άλλος. Εδώ δεν προσφέρεται κανείς για να βοηθήσει για τον ορθογραφικό έλεγχο... Ξεκινήστε εσείς την δουλειά και κάποιος μπορεί να βρεθεί....

Anyway ... Καλή τύχη...

Petros είπε...

Δεν διαφωνώ με αυτά που λες γιατί πάνω κάτω αυτή είναι η πραγματικότητα.

Αυτό που δεν ξέρεις είναι ότι περιστασιακά όλο και κάποιος ενδιαφέρονταν να προσφέρει πχ να καθίσει να φτιάξει την αρχική λίστα ή να προσθέσει συνώνυμες λέξεις (στην λίστα που δεν υπήρχε). Στο άκουσμα του "το Open Office έχει πρόβλημα με τα ελληνικά και ο θησαυρός δεν μπορεί να δουλέψει" όλοι απογοητεύονταν για να μην ξεχνάμε το γεγονός ότι αυτό έδινε αρνητική εικόνα στο ΟΟ. Προσωπικά, αμφιβάλλω ότι υπάρχουν πολλά άτομα που θα χρησιμοποιήσουν το θησαυρό ακόμη και αν κάνουμε καλή δουλειά.

Τέλος πάντων, τώρα όσοι θέλουν θα μπορούν να βοηθήσουν. Σαφώς αυτό είναι το πιο δύσκολο και η αλήθεια είναι ότι θα ξεκινήσουμε κάτι εμείς. Αντίθετα όμως με προηγουμένως όσοι περιστασιακά ενδιαφερθούν και έχουν λίγο χρόνο δεν θα απογοητευτούν αλλά θα προσφέρουν έστω και λίγο. Σκοπός είναι να φτιαχτεί κάτι έστω και μικρό.

Κάτι τελευταίο που πρέπει να πω είναι πως το γεγονός ότι υπάρχει η δυνατότητα να δημιουργηθεί ο θησαυρός θα πρέπει να το μάθουν και εταιρείες επειδή το ΟΟ δεν "περνούσε" τις προδιαγραφές για πρόγραμμα του εξυπηρετητή δικτύου σχολικής τάξης.

Ανώνυμος είπε...

Μπράβο Πέτρο. Καλή δουλειά.
Κρίμα που δεν είχαμε μία μέρα ακόμα στο Ναύπλιο, θα το είχαμε λύσει από τότε. Εγώ για παράδειγμα, αυτό που λες ότι ήταν το πρόβλημα, το ήξερα από την πρώτη στιγμή, αλλά δυστυχώς (ή ευτυχώς) δε σκέφτηκα να σου στείλω και demo αρχείο μαζί με το script.
Ωστόσο, δεν ήξερα ότι έπρεπε στο trimthes.dat να υπάρχουν όλοι οι συνδυασμοί, το οποίο προφανώς εσείς το θεωρήσατε αυτονόητο αφού δεν το αναφέρετε....
Γι αυτό λέω: μία μέρα συνεργασίας αν είχαμε, και θα είχαμε τη λύση τόσο νωρίτερα!!!

Μιχάλης

Ανώνυμος είπε...

Δεν γίνεται να βρούμε τον κάτοχο κάποιου παλιού λεξικού(πολυτονικό), που δεν πρόκειται να ξαναπουλήση, και να ζητήσουμε να πνευματικά δικαιόματα;
Θα μπορούσε να γίνει και κάποιος έρανος σχετικά με αυτό, αν χρειάζονται χρήματα.

Petros είπε...

Δεν το γνωρίζω αυτό που λες. Νομίζω ότι είναι λίγο δύσκολο ιδιαίτερα σε αυτό που λες για τον έρανο. Αν όμως ξέρεις κάποιο παλιό λεξικό και μπορείς να μας δώσεις τα στοιχεία του εμείς μπορούμε να προσπαθήσουμε.

Ανώνυμος είπε...

Για λοιτάξτε για το λεξικό
Στάθη Δημοπούλου
Μονοτονικό λεξικό
Εκδόσεις Άγκυρα
Έχει κλείσει 23 χρόννια από την έκδοση του. Ισως να μην εκδίδεται πλέον.