Zum Hauptinhalt springen

Automatische Daten-Extraktion

Mit der automatischen Extraktion liest feld.ai strukturierte Daten aus neu hochgeladenen Dokumenten — z. B. Rechnungsnummern, Beträge oder Datumsangaben. Sie definieren einmal ein Schema, und alle neuen Dokumente werden automatisch nach diesem Schema extrahiert.


1. Extraktionsschema erstellen

Ein Schema definiert, welche Felder aus Dokumenten extrahiert werden sollen (z. B. „Rechnungsnummer", „Gesamtbetrag", „Datum").

  1. Öffnen Sie Ihr Projekt, klicken Sie auf das Drei-Punkte-Menü (⋮) und wählen Sie Projekteinstellungen.

  2. Wechseln Sie zum Tab Extraktion.

Extraktion-Tab

  1. Klicken Sie auf Schema erstellen. Ein Dialog öffnet sich.

Extraktionsschema erstellen

  1. Der Dialog bietet zwei Wege, ein Schema zu definieren:

    Variante A: Visueller Schema-Builder (Tab „Formular")

    Der Schema-Builder zeigt Ihr Schema als Formular. So fügen Sie Felder hinzu:

  2. Klicken Sie auf Feld hinzufügen.

  3. Geben Sie einen Name ein (z. B. rechnungsnummer, gesamtbetrag, datum).

  4. Wählen Sie den Typ:

    • Text — Freitext (z. B. Kundenname, Adresse)
    • Zahl — Numerischer Wert (z. B. Betrag, Menge)
    • Boolean — Ja/Nein (z. B. „Enthält Logo")
    • Objekt — Verschachteltes Objekt mit eigenen Feldern (z. B. Adresse mit Straße, PLZ, Ort). Klicken Sie auf Kind hinzufügen, um Unterfelder anzulegen.
    • Array — Liste von Werten (z. B. Positionen einer Rechnung)
  5. Optional: Ergänzen Sie eine Beschreibung — diese hilft dem Modell, das Feld korrekt zu erkennen.

  6. Setzen Sie den Haken bei Erforderlich, wenn das Feld immer vorhanden sein sollte.

  7. Wiederholen Sie die Schritte für jedes gewünschte Feld.

Beispiel-Schema für eine Rechnung:

FeldTypErforderlichBeschreibung
rechnungsnummerTextJaEindeutige Rechnungsnummer
datumTextJaRechnungsdatum im Format TT.MM.JJJJ
gesamtbetragZahlJaGesamtbetrag in EUR
empfaengerTextNeinName des Rechnungsempfängers
positionenArrayNeinListe der Rechnungspositionen

Variante B: Raw JSON (Tab „Raw JSON")

Für fortgeschrittene Nutzer: Geben Sie ein JSON-Schema direkt als Text ein oder fügen Sie es aus einer externen Quelle ein.

{
"type": "object",
"properties": {
"rechnungsnummer": {
"type": "string",
"description": "Eindeutige Rechnungsnummer"
},
"gesamtbetrag": {
"type": "number",
"description": "Gesamtbetrag in EUR"
}
},
"required": ["rechnungsnummer", "gesamtbetrag"]
}
  1. Klicken Sie auf Bestätigen. Das Schema erscheint in der Tabelle.

Tipp: Nutzen Sie den Playground (über das Drei-Punkte-Menü ⋮ > Playground), um Ihr Schema vor der Aktivierung an einem einzelnen Dokument zu testen. Im Playground können Sie auch Schema automatisch generieren — das Modell analysiert ein Dokument und schlägt ein passendes Schema vor.


2. Auto-Extraktion aktivieren

  1. Aktivieren Sie den Schalter bei Auto-Extraktion oben auf dem Extraktion-Tab.

  2. Wählen Sie im Dropdown Extraktionsschema das gewünschte Schema aus.

Hinweis: Pro Projekt kann jeweils nur ein Schema aktiv sein. Das aktive Schema wird in der Tabelle mit einem grünen Häkchen markiert.

Ab sofort werden alle neu hochgeladenen Dokumente automatisch nach diesem Schema extrahiert.


3. Schemas verwalten

Die Schema-Tabelle zeigt alle verfügbaren Schemas mit ihren Eigenschaften, dem Erstellungsdatum und der Anzahl extrahierter Datensätze.

AktionBeschreibung
Für Auto-Extraktion verwendenSetzt das Schema als aktiv
BearbeitenÖffnet den Schema-Editor. Wenn das Schema bereits in Verwendung ist, wird eine Kopie erstellt.
LöschenEntfernt das Schema. Nur möglich, wenn keine Datensätze damit extrahiert wurden.

Hinweis: Wird ein aktives Schema bearbeitet, bleibt das Original in Verwendung. Die bearbeitete Version wird als neues Schema gespeichert.


4. Ergebnisse prüfen

Nach der Verarbeitung erscheinen die extrahierten Daten in der Dokumentansicht.

  1. Öffnen Sie ein Dokument in der Projektansicht.

  2. Wechseln Sie zum Tab Ergebnisse im rechten Bereich.

  3. Die extrahierten Felder werden als Formular angezeigt — Sie können Werte direkt korrigieren und mit Speichern übernehmen.


Gut zu wissen

FrageAntwort
Welche Dokumenttypen werden unterstützt?PDF, Word, E-Mail, Bilder
Wie viele Schemas kann ein Projekt haben?Beliebig viele — aber nur eines ist gleichzeitig aktiv
Was passiert mit bestehenden Dokumenten?Nur neue Uploads werden automatisch extrahiert
Kann ich Schemas testen?Ja, im Playground unter Projekteinstellungen
Was bedeutet „Datensätze" in der Tabelle?Anzahl der Dokumente, die mit diesem Schema extrahiert wurden