Unser Kunde:
North Data

North Data ist die Nummer 1 als Plattform für Unternehmensinformationen! Wer Daten zu Unternehmen (beispielsweise Bilanzen) sehen möchte, wird sehr wahrscheinlich northdata.de verwenden.
Projektziel und Herausforderung
Das Ziel war die automatische Extraktion von Kennzahlen (zum Beispiel Gewinn oder Personalaufwand) aus Millionen unstrukturierter Geschäftsberichte britischer Unternehmen, die überwiegend als gescannte PDFs, also als Bilder, vorliegen. Diese Berichte sind sehr uneinheitlich. Das machte die Datenextraktion und -verarbeitung mit den bisher am Markt verfügbaren Methoden ineffizient und kostenintensiv.
Lösung und Maßnahmen
In Zusammenarbeit mit North Data entwickelte cronn eine innovative Lösung unter Einsatz moderner KI-Technologien, insbesondere Large Language Models (LLMs). Folgende Maßnahmen wurden durchgeführt:
- Datenanalyse: Entwicklung eines repräsentativen Testdatensatzes aus den Millionen PDFs und Erstellung einer Ground Truth zur Validierung der Datenverarbeitungsergebnisse.
- Technologieevaluierung: Auswahl und Evaluation verschiedener KI-Modelle (Google Gemini, ChatGPT, Mistral) und OCR-Technologien zur Extraktion und Erkennung von Texten und Tabellen in den Dokumenten.
- Entwicklung einer Machine Learning Pipeline: Eigenentwicklung einer Java-basierten Lösung zur Klassifizierung und Strukturierung der PDF-Dokumente, um die Datenmenge für die KI-Modelle zu optimieren.
- Integration in das Produktivsystem: Schnelle und nahtlose Implementierung der optimalen Lösung in das Java-basierte Backend von North Data, inklusive automatisierter Qualitätskontrollen (MLOps).
Das Projekt
LeistungenData Science, Generative KI, Prompt Engineering, Softwareentwicklung
MethodenMachine Learning, Natural Language Processing, MLOps
TechnologienGoogle Gemini, Google Cloud Platform, Java, APIs, JSON

Wir arbeiten bereits seit einigen Jahren erfolgreich mit cronn zusammen. Auch in diesem Projekt haben sie unsere Anforderungen schnell verstanden. So konnten wir gemeinsam eine KI-basierte Lösung entwerfen und in Produktion bringen. Wir schätzen cronns Know-how in den Bereichen KI sowie Backend und sind mit der Umsetzung sehr zufrieden.
— Frank Felix Debatin, CEO von North Data
Kundenvorteil
cronn hat North Data dabei unterstützt, das bestehende System, um KI-basierte Technologien zur Extraktion von Kennzahlen aus britischen Geschäftsberichten zu erweitern. Dadurch verfügt North Data nun über eine leistungsstarke, präzise und kosteneffiziente Lösung zur automatisierten Verarbeitung großer Datenmengen. Besonders hervorzuheben ist, dass der attraktive Preis pro verarbeitetem Geschäftsbericht diese Lösung nicht nur technisch effizient, sondern auch wirtschaftlich besonders vorteilhaft macht.
cronn Pluspunkte
Recherche und EvaluierungÜberblick über KI-Modelle und -Markt
Prompt EngineeringKnow-how zum aktuellen Stand der Nutzung von KI-Modellen
Dauerhafte PartnerschaftBetreuung der Lösung über den Product Lifecycle mit MLOps
Interessiert?
Gibt es ein Projekt, bei dem wir Sie unterstützen können?
Kontakt aufnehmen