HDP mit schnellerem Hive

Hortonworks hat Version 1.3 der hauseigenen Data Platform (HDP) veröffentlicht. Erste Ergebnisse der im Februar vorgestellten Stinger Initiative sind neben Ergänzungen zur Notfallwiederherstellung unter anderem Teil des Release.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Julia Schmidt

Version 1.3 der Hortonworks Data Platform (HDP) steht mit ersten Ergebnissen der im Februar vorgestellten Stinger Initiative bereit. Deren Arbeiten am SQL-Layer Apache Hive haben diesen wohl bereits 50-mal schneller gemacht und den Umfang der bis jetzt nutzbaren SQL-Semantik erweitert.

Neben der Integration von Hive 0.11 in die quelloffene Datenplattform, die verschiedene Apache-Projekte aus dem Hadoop-Umfeld kombiniert, steht nun unter anderem auch HDFS-Zugang zur Verfügung, der auf NFS v3 aufbaut, sodass sich auf das Dateisystem wie auf ein im Netzwerk vorhandenes angeschlossenes Laufwerk zugreifen lässt. Außerdem soll sich mit besseren Oracle- und Netezza-Konnektoren leichter auf Unternehmensdaten zugreifen lassen. Darüber hinaus arbeiteten die Entwickler an der Unterstützung von Hcatalog im Datentransferwerkzeug Sqoop, welches nun auch die Möglichkeit bieten soll, Daten nach/von RCFile und ORCFile zu übertragen.

Ambari, das Verwaltungs- und Bereitstellungswerkzeug für Hadoop, enthält in HDP 1.3 eine verbesserte Job-Diagnostik, neue Heatmaps und unterstützt zusätzliche Unternehmensplattformen. Damit sich Daten notfalls besser wiederherstellen lassen, macht HDP nun HDFS- und HBase-Snapshots, wobei auch die spaltenorientierte NoSQL-Datenbank auf eine neue Version (HBase 0.94.6.1) aktualisiert wurde und nun Tabellen-Snapshots und kürzere Erholzeiten nach Ausfällen für mit Hadoop arbeitende Onlineanwendungen verspricht. (jul)