Automatische Daten-Extraktion
Mit der automatischen Extraktion liest feld.ai strukturierte Daten aus neu hochgeladenen Dokumenten — z. B. Rechnungsnummern, Beträge oder Datumsangaben. Sie definieren einmal ein Schema, und alle neuen Dokumente werden automatisch nach diesem Schema extrahiert.
1. Extraktionsschema erstellen
Ein Schema definiert, welche Felder aus Dokumenten extrahiert werden sollen (z. B. „Rechnungsnummer", „Gesamtbetrag", „Datum").
-
Öffnen Sie Ihr Projekt, klicken Sie auf das Drei-Punkte-Menü (⋮) und wählen Sie Projekteinstellungen.
-
Wechseln Sie zum Tab Extraktion.

- Klicken Sie auf Schema erstellen. Ein Dialog öffnet sich.

-
Der Dialog bietet zwei Wege, ein Schema zu definieren:
Variante A: Visueller Schema-Builder (Tab „Formular")
Der Schema-Builder zeigt Ihr Schema als Formular. So fügen Sie Felder hinzu:
-
Klicken Sie auf Feld hinzufügen.
-
Geben Sie einen Name ein (z. B.
rechnungsnummer,gesamtbetrag,datum). -
Wählen Sie den Typ:
- Text — Freitext (z. B. Kundenname, Adresse)
- Zahl — Numerischer Wert (z. B. Betrag, Menge)
- Boolean — Ja/Nein (z. B. „Enthält Logo")
- Objekt — Verschachteltes Objekt mit eigenen Feldern (z. B. Adresse mit Straße, PLZ, Ort). Klicken Sie auf Kind hinzufügen, um Unterfelder anzulegen.
- Array — Liste von Werten (z. B. Positionen einer Rechnung)
-
Optional: Ergänzen Sie eine Beschreibung — diese hilft dem Modell, das Feld korrekt zu erkennen.
-
Setzen Sie den Haken bei Erforderlich, wenn das Feld immer vorhanden sein sollte.
-
Wiederholen Sie die Schritte für jedes gewünschte Feld.
Beispiel-Schema für eine Rechnung:
| Feld | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
rechnungsnummer | Text | Ja | Eindeutige Rechnungsnummer |
datum | Text | Ja | Rechnungsdatum im Format TT.MM.JJJJ |
gesamtbetrag | Zahl | Ja | Gesamtbetrag in EUR |
empfaenger | Text | Nein | Name des Rechnungsempfängers |
positionen | Array | Nein | Liste der Rechnungspositionen |
Variante B: Raw JSON (Tab „Raw JSON")
Für fortgeschrittene Nutzer: Geben Sie ein JSON-Schema direkt als Text ein oder fügen Sie es aus einer externen Quelle ein.
{
"type": "object",
"properties": {
"rechnungsnummer": {
"type": "string",
"description": "Eindeutige Rechnungsnummer"
},
"gesamtbetrag": {
"type": "number",
"description": "Gesamtbetrag in EUR"
}
},
"required": ["rechnungsnummer", "gesamtbetrag"]
}
- Klicken Sie auf Bestätigen. Das Schema erscheint in der Tabelle.
Tipp: Nutzen Sie den Playground (über das Drei-Punkte-Menü ⋮ > Playground), um Ihr Schema vor der Aktivierung an einem einzelnen Dokument zu testen. Im Playground können Sie auch Schema automatisch generieren — das Modell analysiert ein Dokument und schlägt ein passendes Schema vor.
2. Auto-Extraktion aktivieren
-
Aktivieren Sie den Schalter bei Auto-Extraktion oben auf dem Extraktion-Tab.
-
Wählen Sie im Dropdown Extraktionsschema das gewünschte Schema aus.
Hinweis: Pro Projekt kann jeweils nur ein Schema aktiv sein. Das aktive Schema wird in der Tabelle mit einem grünen Häkchen markiert.
Ab sofort werden alle neu hochgeladenen Dokumente automatisch nach diesem Schema extrahiert.
3. Schemas verwalten
Die Schema-Tabelle zeigt alle verfügbaren Schemas mit ihren Eigenschaften, dem Erstellungsdatum und der Anzahl extrahierter Datensätze.
| Aktion | Beschreibung |
|---|---|
| Für Auto-Extraktion verwenden | Setzt das Schema als aktiv |
| Bearbeiten | Öffnet den Schema-Editor. Wenn das Schema bereits in Verwendung ist, wird eine Kopie erstellt. |
| Löschen | Entfernt das Schema. Nur möglich, wenn keine Datensätze damit extrahiert wurden. |
Hinweis: Wird ein aktives Schema bearbeitet, bleibt das Original in Verwendung. Die bearbeitete Version wird als neues Schema gespeichert.
4. Ergebnisse prüfen
Nach der Verarbeitung erscheinen die extrahierten Daten in der Dokumentansicht.
-
Öffnen Sie ein Dokument in der Projektansicht.
-
Wechseln Sie zum Tab Ergebnisse im rechten Bereich.
-
Die extrahierten Felder werden als Formular angezeigt — Sie können Werte direkt korrigieren und mit Speichern übernehmen.
Gut zu wissen
| Frage | Antwort |
|---|---|
| Welche Dokumenttypen werden unterstützt? | PDF, Word, E-Mail, Bilder |
| Wie viele Schemas kann ein Projekt haben? | Beliebig viele — aber nur eines ist gleichzeitig aktiv |
| Was passiert mit bestehenden Dokumenten? | Nur neue Uploads werden automatisch extrahiert |
| Kann ich Schemas testen? | Ja, im Playground unter Projekteinstellungen |
| Was bedeutet „Datensätze" in der Tabelle? | Anzahl der Dokumente, die mit diesem Schema extrahiert wurden |