t2k entwickelt docTR: On-Prem OCR

Textextraktion, die in Ihrer Infrastruktur bleibt – planbar, performant, auditierbar.

t2k entwickelt und unterstützt das Open-Source-Projekt docTR, das effiziente, lokal deploybare und anpassbare Modelle und Software für anspruchsvolle OCR-Projekte bietet. Als Hauptentwickler des Projekts bieten wir vertiefte Expertise in Sachen Informationsextraktion aus Dokumenten und wenden unsere Kenntnisse in der Kooperation mit internationalen Kunden an.

docTR On-Prem ist eine modulare, ressourceneffiziente OCR-Lösung für Unternehmen und Institutionen, die Dokumente vollständig in-house verarbeiten müssen. Durch die Kombination aus docTR (OCR-Pipeline) und OnnxTR (hardwareoptimierte Inferenz) erhalten Sie präzise Textextraktion auf minimaler Hardware – ohne Cloud-Abhängigkeit, ohne Datenabfluss und ohne unplanbare API-Kosten.

Statt OCR als „einen weiteren externen Service“ zu betreiben, bauen Sie mit docTR On-Prem eine kontrollierbare, effiziente OCR-Infrastruktur auf: transparent in der Pipeline, reproduzierbar im Ergebnis, und so ausgelegt, dass sie in regulierten Umgebungen zuverlässig funktioniert.

Warum On-Prem OCR heute zur strategischen Entscheidung wird

OCR verarbeitet selten harmlose Daten. In der Praxis geht es häufig um Inhalte mit hoher Sensibilität – etwa Finanzdaten, personenbezogene Informationen oder Forschungsdaten. In vielen Organisationen ist deshalb nicht die OCR-Qualität allein entscheidend, sondern die Frage: Wo wird verarbeitet, wer hat Zugriff, wie lässt sich der Betrieb auditieren – und wie bleiben Kosten langfristig beherrschbar.

Gleichzeitig zeigt der Markt: Viele Teams nutzen heute Cloud-OCR, weil der Einstieg schnell ist und Standardfälle gut funktionieren. Doch sobald Spezialfälle, Domänenanpassung, Kostenkontrolle oder echte Transparenz wichtig werden, stoßen Cloud- und API-Modelle an Grenzen – und On-Prem-Open-Source ist oft zwar theoretisch verfügbar, aber praktisch nicht produktionsreif genug (zu groß, schlecht deploybar, schwer stabil zu betreiben). Genau diese Lücke schließt docTR On-Prem: OCR für jegliche Art von Dokumenten, vollständig on-prem, unter minimalen Hardwarebedingungen.

Was Sie mit docTR On-Prem gewinnen

Mit docTR On-Prem holen Sie sich OCR zurück unter Ihre Kontrolle. Dokumente bleiben in Ihrer Umgebung, was die Grundlage für Datenschutz- und Audit-Anforderungen schafft. Gleichzeitig wird das Kostenmodell planbarer, weil Sie nicht in nutzungsabhängige API-Abrechnungen hineinwachsen, die mit steigendem Volumen schnell strategische Budgets erreichen.

Ein weiterer Kernvorteil liegt in der Anpassbarkeit: docTR On-Prem ist nicht als One-size-fits-all-Versprechen gedacht, sondern als Plattform, die sich an Ihren Dokumentenbestand anpassen lässt – über austauschbare Komponenten, Konfigurationen und eine Pipeline-Architektur, die nachvollziehbar bleibt. Das ist besonders wertvoll, wenn Sie nicht „irgendeinen Text“ extrahieren wollen, sondern konsistente Ergebnisse für konkrete Geschäftsprozesse brauchen.

Für wen ist das gemacht?

docTR On-Prem richtet sich an Firmen und Institute – nicht an Privatpersonen. Besonders relevant ist es für Branchen und Organisationen, in denen Datenhoheit und Betriebskontrolle Priorität haben: Versicherungen, Banken und Finanzdienstleister, Behörden, Forschungseinrichtungen sowie OEMs und Systemintegratoren.

Typischerweise sind das Teams, die Texte aus PDFs und Bildern extrahieren müssen, um Prozesse zu automatisieren, Daten zu analysieren oder Archive zu erschließen – und dabei bewusst eine Lösung suchen, die als Infrastruktur-Baustein langfristig tragfähig ist.

So funktioniert docTR On-Prem – verständlich erklärt

docTR On-Prem setzt auf eine teilmodulare OCR-Pipeline, die sich an unterschiedliche Dokumenttypen und Qualitätsanforderungen anpassen lässt. Im Ablauf bedeutet das: Das System erkennt zunächst Textbereiche (Detection), analysiert Layout und Lesereihenfolge (Layout Analysis/Reconstitution), korrigiert Rotationen bei Scans (Rotation Correction), wandelt Bildbereiche in maschinenlesbaren Text um (Text Recognition) und veredelt Ergebnisse über Nachbearbeitung (Post-Processing).

Der entscheidende Unterschied zur „Notebook-OCR“ liegt aber im Produktionsbetrieb – und hier kommt OnnxTR ins Spiel. OnnxTR ist ausdrücklich kein Add-on, sondern der Schlüssel zur Produktreife: Es standardisiert die Inferenz über ONNX, liefert CPU-optimierte Modelle, nutzt Quantisierung und Hardware-Tuning und zielt auf deterministische Performance ab. Das sorgt dafür, dass OCR nicht nur „irgendwie läuft“, sondern stabil, reproduzierbar und planbar in Ihrer Umgebung betrieben werden kann.

Cloud-OCR vs. docTR On-Prem – der Unterschied in Business-Sprache

Cloud-OCR ist attraktiv, wenn es um schnellen Start und Standardfälle geht. Doch Cloud-Lösungen bleiben in der Regel cloud-only, bringen Netzwerk- und API-Latenzen mit, und die Kosten wachsen mit dem Volumen. Zudem ist die Transparenz oft begrenzt: Pipeline, Modellverhalten und Anpassungsmöglichkeiten sind eingeschränkt oder teuer.

docTR On-Prem dreht diese Logik um: Deployment vollständig on-prem, 100 % Datenhoheit, sehr niedrige lokale Latenz, fix & planbares Kostenmodell, kein Vendor Lock-in und volle Einsicht in Modelle und Pipeline. Zusätzlich ist es explizit für Offline- und Edge-/Air-Gap-Szenarien geeignet – inklusive der Möglichkeit, Updates beim Kunden kontrolliert zu steuern.

Klarer Fokus: Was wir bewusst nicht bauen

docTR On-Prem ist nicht als Cloud-OCR gedacht, nicht als Blackbox und nicht als Marketing-Versprechen, das jeden Spezialfall „automatisch“ löst. Der Fokus ist eine kontrollierbare, effiziente OCR-Infrastruktur, die sich in echten IT-Landschaften betreiben und weiterentwickeln lässt.

MVP: Was Sie zum Start erwarten können

Der MVP ist so definiert, dass ein Kunde docTR On-Prem on-prem installieren, auf eigener Hardware betreiben und für den eigenen Use Case anpassen kann. Dafür enthält der MVP eine On-Prem-Installation (Docker/Python), CPU-optimierte ONNX-Modelle, eine modulare Pipeline, konfigurierbare Komponenten, CLI & Python API sowie Dokumentation und Benchmarks.

Wichtig für die Erwartungshaltung: Cloud-Hosting, AutoML und Web-GUIs sind nicht Teil des MVP. Das Produkt priorisiert zuerst Betriebssicherheit, Performance und Integrationsfähigkeit – also genau die Dinge, die in Enterprise-Umgebungen am Ende zählen.

Nächster Schritt: Pilot in Ihrer Umgebung

Wenn Sie OCR als Infrastrukturkomponente verstehen – mit Anforderungen an Datenschutz, Kostenkontrolle und Auditierbarkeit – ist ein Pilot in Ihrer Umgebung der sinnvollste Einstieg. Dabei evaluieren Sie Performance und Ergebnisqualität auf Ihren Dokumenten, definieren passende Pipeline-Konfigurationen und schaffen eine belastbare Grundlage für Rollout und Skalierung.

Sprechen Sie mit uns über einen Pilot oder eine technische Evaluation – und bringen Sie OCR dorthin zurück, wo Ihre Daten und Ihre Kontrolle sind: in Ihre Infrastruktur.