IN ENTWICKLUNG Strukturierte Extraktion

BelegLotse

Extrahiert Belege und Rechnungen strukturiert nach DATEV — §14 UStG-validiert, optional 100% lokal.

Live-Demo (bald) Code (bald)

Problem & Kontext

Belege abtippen ist langsam und fehleranfällig

Jeder Beleg muss erfasst, geprüft und nach DATEV exportiert werden. Ein Extraktor, der Felder erkennt, gegen §14 UStG validiert und sauber exportiert — optional ohne Cloud — beschleunigt die Buchhaltung.

Lösung

OCR + LLM + Validierung statt Abtippen

Strukturierte Ausgabe per Schema, Pflichtfeld-Validierung, DATEV-Export.

Screenshot / Demo-GIF folgt

Architektur

Clean Architecture, vier Schichten

domain

Beleg-Felder & §14-UStG-Regeln

application

Extract → Validate → Export

infrastructure

OCR, Mistral/Ollama, DATEV-Mapper

api

FastAPI + HTMX-Upload

Process History

Vom Plan zum Deploy — sechs Phasen

  1. 01

    Setup & Architektur

    IN ARBEIT

    Clean-Arch-Gerüst, Docker, CI. ADR-0001: lokale Option (Ollama) für sensible Belege.

  2. 02

    OCR & Vorverarbeitung

    GEPLANT

    Scan/PDF → Text, Layout-Erkennung.

  3. 03

    Feld-Extraktion

    GEPLANT

    Strukturierte Ausgabe (Betrag, USt, Datum, Lieferant) per LLM.

  4. 04

    Validierung

    GEPLANT

    §14 UStG-Pflichtangaben, Summen-Check, BGB §288.

  5. 05

    DATEV-Export & Eval

    GEPLANT

    DATEV-Format, Feld-Precision/Recall messen.

  6. 06

    Deploy & Doku

    GEPLANT

    Docker-Deploy, GoBD-konforme Ablage, README, ADRs.

Ergebnisse

Messbar gemacht

Feld-Precision
Feld-Recall
Validierungs-Quote

Wird nach der Eval-Phase mit echten Zahlen ergänzt — und fließt dann in den Lebenslauf.

Stack & Compliance

Python 3.12FastAPIOCRMistral / OllamaDATEVDocker

Belege enthalten personenbezogene & steuerrelevante Daten → optional 100% lokal (Ollama), GoBD-konforme Ablage, Aufbewahrung AO §147. Disclaimer: keine Steuerberatung (StBerG).

BelegLotse live ansehen

← Alle Projekte