Σάββατο, Μαΐου 21, 2005

Θησαυρός OOo

Σχετικά με τον Θησαυρό του ΟΟο πρέπει να πω ότι ετοιμάζεται το openthesaurus.gr που μάλλον θα δημιουργηθεί σε συνεργασία με τον Hellug και τον Δημήτρη Κορμπέτη. Κάτι αντίστοιχο είναι το openthesaurus.de (στα αγγλικά) .
Σε κάποιο σχόλιο είδα το εξής:

Δεν γίνεται να βρούμε τον κάτοχο κάποιου παλιού λεξικού(πολυτονικό), που δεν πρόκειται να ξαναπουλήσει, και να ζητήσουμε τα πνευματικά δικαιώματα; Θα μπορούσε να γίνει και κάποιος έρανος σχετικά με αυτό, αν χρειάζονται χρήματα.

Το να βρούμε τον ιδιοκτήτη κάποιου παλιού λεξικού και να τον πείσουμε να μας βοηθήσει είναι πολύ καλή ιδέα, κατά τη γνώμη μου. Αν έχετε κάποιο παλιό λεξικό τότε στείλτε μου τα στοιχεία (τηλέφωνα, ονόματα κτλ) για να ψάξουμε. Σίγουρα θα βοηθήσει περισσότερο να έχουμε μια πηγή στα χέρια μας παρά να φτιάξουμε κάτι και να το παραδόσουμε σε μια ομάδα για βοήθεια.

Πέμπτη, Μαΐου 12, 2005

Θησαυρός Open Office

Αυτός που ενδιαφέρθηκε πρώτος και ξεκίνησε τις δοκιμές ήταν ο Βασίλης Φραγκογιαννάκης, όταν γνωρίστηκε με τον Δημήτρη Κορμπέτη και τον Μιχάλη Καμπριάνη στο workshop που έγινε στο Ναύπλιο.

Χρησιμοποιώντας την gawk κάναμε δοκιμές σε Windows. Είχαμε διάφορα αποτελέσματα αλλά στην αρχή δεν ξέραμε ότι το πρόγραμμα awk δεν έσβηνε τα αρχεία dat, idx οπότε συνήθως τα αποτελέσματα ήταν ίδια.

Αυτός που βοήθησε ήταν ο Daniel Naber, ο οποίος μου είπε ότι όσες λέξεις είναι στο ένα αρχείο, ακριβώς οι ίδιες πρέπει να είναι και στο άλλο αρχείο. Όταν έκανα δοκιμές με ελληνικές λέξεις δεν είχα αποτελέσματα. Όταν χρησιμοποίησα αγγλικούς χαρακτήρες τότε είδα ότι ο θησαυρός δουλεύει.

Έτσι, χτες, έστειλα στη λίστα i18ngr και κατά λάθος στη hellug (ήθελα να στείλω στην LGU) ζητώντας βοήθεια από κάποιον που να ξέρει awk νομίζωντας ότι η awk δεν αναγνωρίζει τους ελληνικούς χαρακτήρες. Ανταποκρίθηκε ο Αλέξης Ζάβρας ο Μιχάλης Ιατρού, στους οποίους έστειλα τα αρχεία εισόδου και εξόδου που είχα με ελληνικούς και αγγλικούς χαρακτήρες. Ο Αλέξης Ζάβρας μου είπε ότι τα αποτελέσματα είναι ίδια. Βέβαια αυτά που έστειλα στον Αλέξη δουλεύαν σε Linux. Οπότε κατάλαβα ότι έφταιγε η κωδικοποίηση των αρχείων εισόδου που ήταν ANSI (Notepad). Έτσι κάνοντας τη μετατροπή σε ISO-8859-7 των αρχείων εισόδου είδα το θησαυρό δουλεύει.

Έτσι ξεπεράσαμε το πρώτο βασικό εμπόδιο.


Τώρα μένει να συγκροτηθεί μια ομάδα που θα μαζέψει λέξεις για το θησαυρό. Ο Δημήτρης Κορμπέτης πρότεινε τη δημιουργία εξυπηρετητή openthesaurus κάτι το οποίο θα βοηθήσει πάρα πολύ.

Περί θησαυρού Open Office

Τελικά το πρόβλημα λύθηκε!

Μετά από διάφορες δοκιμές, googling, email κτλ ο Βασίλης Φραγκογιαννάκης
και εγώ βρήκαμε ότι το awk script του Pavel Janik για τη δημιουργία θησαυρού στο Open Office δουλεύει μια χαρά όταν υπάρχουν όλες οι λέξεις. Αυτό ήταν το λάθος που κάνανε όλοι όσοι το δοκίμαζαν. Γράφανε τρεις λέξεις στο wordlist και 6 λέξεις στο trimthes οπότε δεν γίνονταν αντιστοιχία.

πχ αν στο trimthes έχουμε γράψει
γάτα,γατούλα,γατάκι
σκύλος,σκυλάκι

χωρίς κενά μεταξύ των λέξεων

τότε στο wordlist πρέπει να έχουμε
γάτα
γατάκι
γατούλα
σκυλάκι
σκύλος


Επίσης όταν κάνεις δοκιμές, πριν εκτελέσεις το script θα πρέπει να σβήσεις τα αρχεία dat και idx που δημιουργεί το script αλλιώς τα αρχεία παραμένουν τα ίδια χωρίς καμία αλλαγή. Και συνέχισε τις δοκιμές σου εσύ...

Τέλος πάντων με τη βοήθεια του Daniel Naber και του Αλέξη Ζάβρα που απάντησε στο e-mail που έστειλα στη λίστα i18ngr χτες το πρόβλημα λύθηκε. Στα Windows πρέπει τα αρχεία wordlist και trimthes να αποθηκεύονται σε ISO-8859-7 και όχι σε απλό ANSI. Στο Linux, όπως είδα χτες, δεν υπάρχει πρόβλημα.

Το αποτέλεσμα είναι:

Τρίτη, Μαΐου 10, 2005

Pootle

Pootle... Ξέρετε τί είναι το pootle;

Αυτό που είναι σίγουρο είναι ότι με τη βοήθεια του Hellug και της Ελληνικής Ομάδας του GNOME, σε λίγες μέρες θα υπάρχει ελληνικός pootle server.

Σύντομα κοντά σας...

GNOME Live CD

Το GNOME Live CD ξεπέρασε τα 50.000 αντίγραφα!

Όσοι μείναν με το στόμα ανοικτό πρέπει να πω ότι αναφέρομαι στο διεθνές CD (για περισσότερες πληροφορίες πατήστε εδώ) . Το ελληνικό GNOME Live CD ξεπέρασε τα 50 αντίγραφα. Θετικά νέα αναλογιζόμενοι ότι το CD ήταν μόνο για επίδειξη του GNOME και όχι για διανομή Live CD.