Etsy verwendet hadoop/cascading unter JRuby, um Datamining in ihren Logs zu betreiben. Auf dem Etsy-eigenen Code-as-craft-Blog gibt es einen interessanten Artikel dazu. Mit dabei sind Codebeispiele, um die riesigen Logs (60GB/Tag) auszuwerten. Faszinierend!
Keine Kommentare:
Kommentar veröffentlichen