venerdì 25 febbraio 2011

Elaboriamo le stringhe con le Regular Expression


Ultimamente mi sono imbattuto nella elaborazione di dati statistici. Il problema principale è stato quello di riuscire a estrarre dai files di log di diverse applicazioni solo le informazioni che mi interessavano. Avevo due scelte: scrivere del codice specifico per ogni singola applicazione oppure scrivere del codice generico che utilizza le espressioni regolari per estrarre le informazioni.

Un esercizio molto bello è stato quello di riuscire a estrarre le informazioni contenute nel più famoso dei log, l'access.log di apache che generalmente usa il formato NSCA Log Format.
Un esempio è questo:
125.125.125.125 - dsmith [10/Oct/1999:21:15:05 +0500] "GET /index.html HTTP/1.0" 200 1043
Ho trovato questo documento dell'IBM che descrive i singoli componenti del log.


martedì 15 febbraio 2011

Scanner Canon LIDE 200 su Linux Mint 10 (Julia)


Mi sono trovato a dover utilizzare uno scanner Canon LIDE 200 sul mio laptop con Linux Mint 10. Ho inserito lo scanner (che ha solo l'interfaccia USB ed è senza alimentazione) e il comando scanimage -L non lo rilevava. Strano perchè sul sito sane il driver lo danno come completo.