Posts mit dem Label big data werden angezeigt. Alle Posts anzeigen
Posts mit dem Label big data werden angezeigt. Alle Posts anzeigen

Montag, 29. April 2013

Neue Version des activerecord-jdbcteradata-adapter (big data)

Es gibt eine neue Version des activerecord-jdbcteradata-adapter. Der Adapter ist noch experimentell und ermöglicht die Anbindung des Teradata-RDBMS per Activerecord an JRuby/Rails-Applikationen. Teradata wird für Data Warehousing, Datenanalyse und andere Big Data-Anwendungen benutzt.

Dienstag, 11. Dezember 2012

Rubydoop: Haddop aus JRuby aufrufen (Big data)

Eine neue Version von Rubydoop ist auf github verfügbar.Rubydoop ist eine Integration von JRuby in die Hadoop-Runtime. Damit kann Apache Hadoop direkt von JRuby aus benutzt werden. Es liegen einige Beispiele bei, so daß man einen einfachen Einstieg hat.

Sonntag, 21. Oktober 2012

RedStorm 0.6.4 ist fertig (Big Data mit JRuby)

Colin Surprenant hat RedStorm in Version 0.6.4 auf github bereitgestellt. Das RedStorm-Gem stellt eine Ruby DSL durch JRuby-Integration des Storm Distributed Realtime Computation System bereit. Als Default installiert RedStorm Storm- and JRuby-jar-Abhängigkeiten. Andere Abhängigkeiten  können über ein Dependencies-File definiert werden. Das ganze kann auch im Cluster laufen. RedStorm kann sowohl im JRuby-1.8-Modus als auch im JRuby-1.9-Modus laufen. Zusätzlich gibt es jede Menge Beispiel-Konfigurationen. Wie bereits gestern gemeldet ist Tweitgeist eine Demo-Anwendung, die mit RedStorm erstellt wurde.

Mittwoch, 3. Oktober 2012

Rubydoop: Hadoop Jobs in JRuby

Theo Hultberg hat Rubydoop 1.0 veröffentlicht. Damit kann man Hadoop-Jobs in JRuby schreiben. Apache Hadoop ist ein Big Data Framework zur Parallelverarbeitung extrem grosser Datenmengen. Rubydoops Quellcode liegt auf github zum Abholen bereit.

Sonntag, 5. August 2012

Azul macht die Zing JVM etwas zugänglicher für OpenSource-Projekte

Azul Systems hat seine Zing JVM für OpenSource-Entwickler verfügbar gemacht. Diese JVM ist - laut Hersteller - die am besten skalierende JVM. Zielgruppe ist in-memory computing and Big Data analytics,  Anwendungen mit niedrigen Antwortzeiten. Zing JVM läuft auf Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS und Ubuntu Linux.

Sonntag, 24. Juni 2012

Big data: Hadoop Summit, Apache Pig und JRuby

Auf dem Hadoop Summit war Apache Pig und damit auch JRuby ein Thema. Daniel Dai und Thejas Nair von  Hortonworks hielten den Vortrag Pig programming is more fun: new Features in Pig über Apache Pig (eine Plattform zur Analyse großer Datenmengen). In den Vortragsfolien sind auch Beispiele für User Defined Functions (UDF) in JRuby enthalten.

Freitag, 8. Juni 2012

Tweitgeist: Echtzeit-Big Data mit Twitter, JRuby und RedStorm

Colin Surprenant von der Firma needium hat eine Demo-Anwendung für RedStorm gebaut, er nennt sie Tweitgeist. Tweitgeist analysiert laufend ein großes Sample von Tweets und zeigt in Echtzeit die 10 häufigsten Hashtags. Den Code gibt es auf Github, eine Präsentation auf Slideshare. Äußerst interessant.

Freitag, 25. Mai 2012

Big data: Cascading.JRuby

Cascading.JRuby ist eine DSL, die auf die Cascading-Java-Library aufsetzt. Mit Cascading  kann man komplexe Auswertungen auf einem Hadoop-Cluster ausführen. Via Cascading.JRuby auch direkt aus JRuby-Programmen.


Donnerstag, 10. Mai 2012

Webcast bei O'Reilly heute 19:00 Uhr: Current and Upcoming Work in Pig (Big Data)

Auf http://oreillynet.com/pub/e/2231 gibt es heute einen Webcast zum Thema Current and Upcoming Work in Pig. Es geht hier um Apache Pig, ein Framework um Auswertungen auf Hadoop auszuführen. Der Webcast ist von Alan Gates einer der Entwickler und Autor des O'Reilly-Buches Programming Pig. Apache Pig unterstützt JRuby für User Defined Functions (UDFs).