09.11.2023
Graph Analytics
Neo4j bietet bis zu 100-mal höhere Analytik-Performance
Autor: Bernhard Lauer
neo4j.com
Mit Parallel Runtime und Native Change Data Capture (CDC) will der Anbieter die Verarbeitung von Workloads in Enterprise-Umgebungen beschleunigen.
Neo4j, Anbieter von Graphdatenbanken und Graph Analytics, hat neue Features für seine Produkte vorgestellt. Damit soll die Performance rund um operative wie analytische Workloads deutlich steigen. Anwender können Abfragen (Queries) noch schneller durchführen, transaktionale und analytische Prozesse in einer Datenbank zentral verarbeiten und Datenänderungen in Echtzeit nachverfolgen.
Die neuen Features im Überblick:
- Mit der neuen Parallel Runtime ermöglicht Neo4j eine bis zu 100-mal höhere Performance*, indem Threads nun gleichzeitig über mehrere CPU-Kerne zur Ausführung analytischer Abfragen laufen. Dabei nutzt die Graphdatenbank eine Technologie namens Morsel Based Parallelism, um die Skalierbarkeit zu erhöhen, die Ressourcennutzung zu verbessern und ein nahtloses Multitasking sicherzustellen.
- Mit der neuen Datenänderungserfassung, native Change Data Capture (CDC), lässt sich nachverfolgen, wann Änderungen stattgefunden haben. Dritt-Systeme und Services, die auf diese Änderungen reagieren müssen, erhalten automatisch entsprechende Benachrichtigungen. CDC ist im Neo4j Connector for Kafka und Confluent integriert, um diese Änderungen unterschiedlichen Systemen und Datenbanken verfügbar zu machen.
- Neue Embeddings erlauben Anwendern ein erleichtertes Erstellen von Knowledge Graphen. Die Modelle können bislang fehlende Datenbeziehungen aufzeigen sowie neue Datenbeziehungen im Wissensgraphen prädiktiv ableiten und so den semantischen Kontext für Abfragen erweitern.
- Die Graphdatenbank erhält neue Algorithmen für Pfadsuchen, um höhere Effizienz bei komplexen Abfragen zu ermöglichen. Die Algorithmen ermitteln die optimale Sequenz und identifizieren den relevantesten Pfad zwischen einzelnen Knoten im Graphen.
Anwender können die neuen Features ab sofort sowohl in der Neo4j Graphdatenbank als auch in der Cloud Version (Neo4j AuraDB) nutzen. Change Data Capture (CDC) ist zunächst als öffentliche Beta-Version des EAP verfügbar.
Bereits im August 2023 hat Neo4j die Kernfunktionen der Graphdatenbank um native Vektorsuche erweitert. Die Integration liefert genaue, erklärbare und transparente Ergebnisse für Large Language Models (LLMs) und andere generative KI-Anwendungen.
Weitere Informationen finden Sie auf der Webseite oder im Blogbeittrag "Neo4j Unveils Parallel Runtime and CDC".
* Die Performance steigt proportional zur Anzahl der CPUs. Das genannte Ergebnis basiert auf einem Benchmark-Test, der eine Leistungsverbesserung für eine analytische Abfrage auf einem Stackoverflow-Datensatz mit 50 Millionen Knoten und 124 Millionen Beziehungen zeigt. Der Server (32 CPUs, 128 GByte Speicher) ist über 7473/browser/:https://demo.neo4jlabs.com:7473/browser/ öffentlich zugänglich.
Bildrecherche
Nützliches Add-on gegen Fake-Bilder
Derzeit werden wieder viele Falschnachrichten verbreitet. Ein Add-on für Firefox, Chrome und Safari hilft, den Missbrauch alter Bilder aufzudecken.
>>
WPF
Demo für C# MVVM Toolkit
WPF ist trotz seines Alters immer noch weit verbreitet und wird gerne genutzt. Ein Online-Artikel erklärt, wie Sie das MVVM Toolkit mit WPF einsetzen.
>>
Web Scraping mit KI
Scrapegraph-ai - per Prompt ausgewählte Inhalte einer Website laden
Mittels Web Scraping lassen sich Daten von Websites laden. Das Problem dabei: Die Daten sind in einem Berg von HTML vergraben. Eine Python-Bibliothek hilft die Spreu vom Weizen zu trennen - mit Hilfe von Künstlicher Intelligenz.
>>
Motor der Digitalisierung
Virtuelle Doppelgänger
Digitale Zwillinge optimieren Prozesse, minimieren Ausfallzeiten und reduzieren Kosten. Es ist aber nicht trivial, sie in der Praxis aufzubauen.
>>