Kundenreferenz
 - Effiziente Dokumentenverarbeitung durch KI-Lösungen

  

Unser Kunde:
North Data

North Data ist die Nummer 1 als Plattform für Unternehmensinformationen! Wer Daten zu Unternehmen (beispielsweise Bilanzen) sehen möchte, wird sehr wahrscheinlich northdata.de verwenden.

Projektziel und Herausforderung

Das Ziel war die automatische Extraktion von Kennzahlen (zum Beispiel Gewinn oder Personalaufwand) aus Millionen unstrukturierter Geschäftsberichte britischer Unternehmen, die überwiegend als gescannte PDFs, also als Bilder, vorliegen. Diese Berichte sind sehr uneinheitlich. Das machte die Datenextraktion und -verarbeitung mit den bisher am Markt verfügbaren Methoden ineffizient und kostenintensiv.

Funktionsweise

Lösung und Maßnahmen

In Zusammenarbeit mit North Data entwickelte cronn eine innovative Lösung unter Einsatz moderner KI-Technologien, insbesondere Large Language Models (LLMs). Folgende Maßnahmen wurden durchgeführt:

  • Datenanalyse: Entwicklung eines repräsentativen Testdatensatzes aus den Millionen PDFs und Erstellung einer Ground Truth zur Validierung der Datenverarbeitung­sergebnisse.
  • Technologieevaluierung: Auswahl und Evaluation verschiedener KI-Modelle (Google Gemini, ChatGPT, Mistral) und OCR-Technologien zur Extraktion und Erkennung von Texten und Tabellen in den Dokumenten.
  • Entwicklung einer Machine Learning Pipeline: Eigenentwicklung einer Java-basierten Lösung zur Klassifizierung und Strukturierung der PDF-Dokumente, um die Datenmenge für die KI-Modelle zu optimieren.
  • Integration in das Produktivsystem: Schnelle und nahtlose Implementierung der optimalen Lösung in das Java-basierte Backend von North Data, inklusive automatisierter Qualitätskontrollen (MLOps).

Das Projekt

Leistungen

Data Science, Generative KI, Prompt Engineering, Softwareentwicklung

Methoden

Machine Learning, Natural Language Processing, MLOps

Technologien

Google Gemini, Google Cloud Platform, Java, APIs, JSON

cronn reference quote northdata

Wir arbeiten bereits seit einigen Jahren erfolgreich mit cronn zusammen. Auch in diesem Projekt haben sie unsere Anforderungen schnell verstanden. So konnten wir gemeinsam eine KI-basierte Lösung entwerfen und in Produktion bringen. Wir schätzen cronns Know-how in den Bereichen KI sowie Backend und sind mit der Umsetzung sehr zufrieden.

— Frank Felix Debatin, CEO von North Data

Kundenvorteil

cronn hat North Data dabei unterstützt, das bestehende System, um KI-basierte Technologien zur Extraktion von Kennzahlen aus britischen Geschäftsberichten zu erweitern. Dadurch verfügt North Data nun über eine leistungsstarke, präzise und kosteneffiziente Lösung zur automatisierten Verarbeitung großer Datenmengen. Besonders hervorzuheben ist, dass der attraktive Preis pro verarbeitetem Geschäftsbericht diese Lösung nicht nur technisch effizient, sondern auch wirtschaftlich besonders vorteilhaft macht.

cronn Pluspunkte

Recherche und Evaluierung

Überblick über KI-Modelle und -Markt

Prompt Engineering

Know-how zum aktuellen Stand der Nutzung von KI-Modellen

Dauerhafte Partnerschaft

Betreuung der Lösung über den Product Lifecycle mit MLOps

Interessiert?

Gibt es ein Projekt, bei dem wir Sie unterstützen können?
Kontakt aufnehmen