Webhose: Daten sammeln und für Retail einsetzen

0

Das Start-up Webhose aus Israel bietet einen neuartigen Daten-Crawler für das Internet an. Davon können auch Retailer für ihre Analysen profitieren.

Ran Geva, der Gründer und CEO von Webhose, ist sich sicher, dass die von seinem Unternehmen entwickelte Lösung „sowohl für Studenten als auch für große Unternehmen tauglich ist“. Das 2014 an den Start gegangene Unternehmen hat sich auf die Suche nach Daten im Internet spezialisiert, um sie für analytische Werkzeuge und Zwecke zur Verfügung zu stellen.

Schon früher hatte sich Geva mit Internet-Daten beschäftigt, einmal mit der Konvertierung von unstrukturierten Informationen in strukturierte, und einmal mit einer Art PR-Tracker, der die Spuren von Pressemeldungen im Internet verfolgen sollte, aber angesichts der Größe des globalen Netzes scheiterte. Die neue Firma, die gegenwärtig 15 Mitarbeiter beschäftigt und über mehr als 36.000 eingeschriebene Nutzer und 200 zahlende Kunden verfügt, beruht laut Geva auf intensiver Recherche und Entwicklung sowie auf den Erfahrungen der bisherigen Ansätze.

Man hat eine eigene lokale Hardware-Infrastruktur mit 120 Servern aufgebaut, die sich an Vorbildern von AWS oder Google orientiert, aber wesentlich billiger sein soll, sagt Geva. Je nach den Erforderungen von Anwendern wird das Internet systematisch nach besonderen Daten durchkämmt, um sie den jeweiligen Analyse-Tools zuzuleiten. Die Lösung erstreckt sich auch auf das Dark Web und den dort eingesetzten Browser Tor.

Durchsucht werden zum Beispiel Online-Diskussionen, Online-News, Blogs, E-Commerce-Produkte und -Besprechungen oder TV- und Radio-News. Die Ergebnisse werden von unstrukturierten in strukturierte Daten umgewandelt und in Textdateien wie das XML-Format abgelegt. Auch ein Format wie CSV kann benützt werden, um eventuell zukünftige Analysen zu vereinfachen.

Zu den Kunden von Webhose zählen die RaboBank, bei der man die Technologie für die Analyse von Finanzdaten einsetzt, Salesforce.com (Verfeinerung von Marketing-Daten) und IBM (Training im Umfeld von Watson).

Im E-Commerce-Umfeld lassen sich, so Geva, mit der Webhose-Technologie zum Beispiel umfangreiche Reports zur Preisentwicklung von Produkten aus Webshops anlegen.

Bis zu 1.000 Anfragen steht die Webhose-Lösung kostenfrei zur Verfügung (siehe: https://webhose.io/auth/signup).