KI-gestützter Import: End-to-End-Prozess im Überblick
Zuletzt aktualisiert am 17.03.2026
Überblick
Mit dem KI-gestützten Import von Verbrauchsdaten können Sie Ihre bestehenden Emissionsaktivitätsdaten aus MS Excel hochladen und von der Lucanet-KI automatisch jede Zeile in einen strukturierten THG-Fußabdrucksvorschlag umwandeln lassen – inklusive des korrekten Emissionsfaktors, der Scope-Klassifizierung und der CO₂-Äquivalenzwerte (siehe auch Emissionen-Modul ausfüllen).
Die folgenden Abschnitte bieten einen Überblick über den Prozess, wie die KI bestimmte Werte für die Aufnahme in die Fußabdruck-Vorschläge ermittelt, sowie eine Erklärung der angezeigten KI-Konfidenzstufen.
Dieser Artikel enthält folgende Abschnitte:
Prozessübersicht
Sie laden jeweils eine MS Excel-Datei hoch. Die KI verarbeitet die Datei und präsentiert Ihnen eine Auswahl vorgeschlagener Fußabdrücke zur Überprüfung. Sie überprüfen die Vorschläge aus der aktuellen Datei, nehmen bei Bedarf Anpassungen vor und akzeptieren die Vorschläge, bevor Sie die nächste Datei hochladen können. Dies gewährleistet die Datenqualität und gibt Ihnen die vollständige Kontrolle über jeden Fußabdruck, bevor er in Ihren THG-Datensatz aufgenommen wird. Die KI verarbeitet alle relevanten Excel-Tabellen innerhalb einer einzelnen hochgeladenen Datei. Jedes Excel-Blatt wird unabhängig voneinander ausgelesen, und Zeilen, die Gesamtwerte oder aggregierte Zusammenfassungen darstellen, werden übersprungen.
Rückverfolgbarkeit
Jeder vorgeschlagene Fußabdruck ist direkt auf seinen genauen Ursprung in Ihrer Excel-Datei zurückverfolgbar, d. h. Sie sehen sowohl den Arbeitsblattnamen als auch die ursprüngliche Zeilennummer aus Ihrer MS Excel-Datei. Dies macht es einfach, die Ausgabe der KI mit Ihren Quelldaten abzugleichen, die Zahlen zu überprüfen und jeden Fußabdruck bis zu seinem Ursprung zurückzuverfolgen.
Einzelschritte des KI-Prozesses
Wenn Sie Ihre Excel-Datei hochladen, führt die KI einen strukturierten, mehrstufigen Prozess aus, um jede Aktivität in einen Fußabdruck-Vorschlag umzuwandeln.
Gültige Einheitentypen abrufen
Bevor irgendetwas anderes getan wird, ruft die KI die vollständige Liste der gültigen Einheitentypen aus der Emissionsfaktoren-Datenbank ab (z. B. Menge, Entfernung, Gewicht, Geld, Energie). Dies ist ein notwendiger Schritt, der sicherstellt, dass jede nachfolgende Suche nur gültige und anerkannte Messkategorien verwendet.
Dateiinhalt lesen und interpretieren
Die KI liest jede Zeile in allen relevanten Excel-Tabellen ein. Für jede Aktivität werden folgende Angaben ermittelt:
- Die Art der Aktivität (z. B. Kraftstoffverbrennung, Elektrizität, Fracht, Geschäftsreisen)
- Der geografische Standort (Land oder Region)
- Die Einheit der Messung (Liter, km, kWh, EUR usw.)
- Die Anzahl, interpretiert im länderspezifischen Zahlenformat der Quelldaten
- Das Berichtsjahr – erkannt anhand des Dateiinhalts oder des Blattkontexts
- Die ursprüngliche Excel-Zeilennummer, die jeder Zeile in den verarbeiteten Daten für vollständige Nachverfolgbarkeit angehängt wird
Die KI erkennt automatisch das Berichtsjahr und die Standardregion aus der Datei. Diese Daten werden als Referenz für alle nachfolgenden Suchen nach Emissionsfaktoren verwendet: Das Berichtsjahr bestimmt, welche Faktorenjahrgänge gültig sind, und die erkannte Region legt die geografische Suche fest.
Suche nach Emissionsfaktoren mit einer 4-Phasen-Strategie
Für jede Aktivität führt die KI eine strukturierte Suche innerhalb unserer bereitgestellten Datenbanken und Ihrer benutzerdefinierten Emissionsfaktoren durch:
- Phase 1 — Entdecken: Eine breite Suche mit minimalen Einschränkungen (Aktivitätsschlüsselwörter und Einheitentyp, kein Regionenfilter), um zu verstehen, welche Daten verfügbar sind, und um die Namensmuster, verfügbaren Regionen und Datenquellen in der Datenbank kennenzulernen.
- Phase 2 — Regionen gruppieren: Basierend auf dem erkannten Land erstellt die KI geografische Stufen — zum Beispiel für eine deutsche Aktivität: genau Deutschland → deutschsprachiger Cluster (DE, AT, CH) → Mitteleuropa → EU-weit → Global.
- Phase 3 — Suche in mehreren Regionen: Die KI durchsucht einen geografischen Cluster in einer einzigen Suche, was effizienter ist und automatisch integrierte geografische Fallbacks bereitstellt.
- Phase 4 – Fortschreitende Verfeinerung: Wenn die Ergebnisse unzureichend sind, durchläuft die KI schrittweise erweiterte Ebenen, bis geeignete Vorschläge gefunden werden. Wenn zu viele Ergebnisse generiert werden (mehr als 200), fügt die KI spezifischere Schlüsselwörter hinzu oder wechselt zu einer Suche in einem einzelnen Bereich, um Mehrdeutigkeiten zu vermeiden.
Den am besten passenden Emissionsfaktor wählen
Wenn mehrere potenzielle Emissionsfaktoren gefunden werden, wendet die KI eine eindeutige Prioritätenreihenfolge an:
- Korrekter Einheitentyp — muss mit der Messkategorie der Aktivität übereinstimmen
- Aktivitätsabgleich — Die Beschreibung des Emissionsfaktors muss mit der Aktivität übereinstimmen
- Geografische Übereinstimmung — genaues Land bevorzugt, danach geografischer Cluster, dann Kontinent und schließlich global
- Jüngstes Jahr — Der aktuellste Faktor wird bevorzugt, aber das Faktorjahr darf nicht nach dem Berichtsjahr liegen (zukünftige Daten sind methodologisch ungültig für historische Berichterstattung)
- Spezifische Einheit – Die genaue Einheit (z. B. Liter vs. Kubikmeter) muss übereinstimmen
Fußabdruck zuordnen und strukturieren
Der gewählte Emissionsfaktor wird zugeordnet auf:
- Der korrekte THG-Scope (Scope 1, 2 oder 3)
- Die entsprechende Kategorie (z. B. Mobile Verbrennung, Geschäftsreisen, Elektrizität, Gekaufte Waren und Dienstleistungen)
- Die korrekte Parameterstruktur – einschließlich der Handhabung von zusammengesetzten Einheitentypen (z. B. Gewicht über Entfernung für Fracht, Anzahl der Reisenden über Entfernung für Flüge). Bei zusammengesetzten Typen, bei denen beide Werte vorhanden sein müssen und nicht angenommen werden können, kennzeichnet die KI die Zeile als unvollständig, anstatt einen fehlenden Wert zu erfinden.
KI-Konfidenzstufen
Für jeden vorgeschlagenen Fußabdruck berechnet die KI einen Konfidenzwert, der angibt, wie sicher sie sich bezüglich ihrer generierten Daten ist. Dies hilft Ihnen, Ihre Überprüfung auf die Einträge zu konzentrieren, die die meiste Aufmerksamkeit erfordern. Der Gesamt-Konfidenzwert wird aus vier gewichteten Faktoren berechnet:
Faktor
Beschreibung
Semantische Übereinstimmungsqualität
- Gewichtet mit 40 %
- Misst, wie genau Ihr Quelltext mit der Aktivitätsbeschreibung des Emissionsfaktors übereinstimmt:
- 90–100% — Genaue Übereinstimmung des Schlüsselworts (z. B. Diesel wird direkt einem Diesel-Emissionsfaktor zugeordnet)
- 70–85 % — Synonym oder Übereinstimmung mit einem verwandten Begriff (z. B. wird Heizöl zu Diesel zugeordnet)
- 50–70% – Nur Übereinstimmung auf Kategorieebene (z. B. Fahrzeugkraftstoff zugeordnet zu Diesel)
- 30–50 % – Aus dem Kontext abgeleitet (z. B. durch Flottenkosten auf Diesel geschlossen)
- 0–30 % — Keine eindeutige Übereinstimmung; ein Fallback-Faktor wurde verwendet
Regionenabgleich
- Gewichtet mit 30 %
- Misst, wie genau die Geografie des Emissionsfaktors mit Ihren Standortdaten übereinstimmt
- 100% — Exakte Länderübereinstimmung (z. B. ein deutsches Büro, das einem deutschen Emissionsfaktor zugeordnet ist)
- 80–90 % – Land innerhalb einer größeren Region (z. B. Deutschland einem DACH-Faktor zugeordnet), oder keine Region erkannt, aber Ihre Standardregion wurde verwendet
- 70–80 % — Kontinent-Übereinstimmung (z. B. Deutschland, das einem EU-/Europa-Faktor zugeordnet wird)
- 50–70% — Keine regionale Überschneidung; ein globaler Faktor wurde als bestmögliche Übereinstimmung verwendet
- 20–40 % — Es wurde keine Region erkannt; ein globaler Durchschnitt wurde angewendet
- 0–20 % — Geografische Abweichung (z. B. eine deutsche Aktivität, die einem australischen Faktor zugeordnet ist)
Jahresabgleich
- Gewichtet mit 15 %
- Misst, wie aktuell die Daten der Emissionsfaktoren im Vergleich zu Ihrem Berichtsjahr sind
- 100% — Das Jahr des Emissionsfaktors stimmt genau mit Ihrem Berichtsjahr überein
- 80–90 % — Der Emissionsfaktor ist 1 bis 5 Jahre älter als Ihr Berichtsjahr
- 60–80 % — Der Emissionsfaktor ist 6 bis 20 Jahre älter
- 0% — Der Emissionsfaktor ist neuer als Ihr Berichtsjahr (methodisch ungültig; zukünftige Daten können nicht für die historische Berichterstattung verwendet werden)
Eindeutigkeit des Emissionsfaktors
- Gewichtet mit 15 %
- Misst, wie viele potentielle Faktoren die KI zur Auswahl hatte (weniger = höhere Konfidenz)
- 100% — Nur 1 Übereinstimmungsfaktor gefunden (eindeutig)
- 70% — 2 bis 10 übereinstimmende Faktoren (sinnvolle Unterscheidung möglich)
- 50% — Mehr als 10 übereinstimmende Faktoren (hohe Mehrdeutigkeit)
Formel: Konfidenzwert = (semantisch × 0,40) + (Region × 0,30) + (Jahr × 0,15) + (Eindeutigkeit × 0,15)
Konfidenzstufen
Die kombinierte Punktzahl wird als farblich gekennzeichneter Indikator für jeden vorgeschlagenen Fußabdruck angezeigt.
Farbe
Beschreibung
Grün
- Hohe Konfidenz
- Konfidenzwert ≥ 80 %
Gelb
- Überprüfung empfohlen
- Konfidenzwert = 50–79 %
Rot
- Handlungsbedarf
- Konfidenzwert < 50 %
Wichtige Anmerkungen
- Für zusammengesetzte Aktivitätsarten (z. B. Fracht, gemessen in Gewicht über Entfernung) benötigt die KI beide Werte in Ihren Quelldaten. Wenn die Daten unvollständig sind, wird die KI die Zeile kennzeichnen, anstatt einen fehlenden Wert zu erfinden.
- Gesamtzeilen (aggregierte Zeilen) in Ihrer Excel-Datei werden automatisch von der Verarbeitung ausgeschlossen.
- Es kann jeweils nur eine Datei verarbeitet werden. Sie können erst dann eine neue Datei hochladen, wenn die Vorschläge aus der aktuellen Datei geprüft und akzeptiert wurden.