CSVReader Step

Der CSVReader Step kann eine CSV-Datei oder eine andere beliebig getrennte Textdatei einlesen und Sie in ein Spreadsheet umwandeln.  
Dabei kann man einstellen wie genau die Datei eingelesen werden soll. Das betrifft typische Einstellungen wie:

  • Spaltentrenner (z.B. Komma, Semikolon, Tabulator)
  • Textqualifier (in der Regel doppelte Anführungszeichen, die jeden Spaltenwert umschließen)
  • Encoding: Spielt immer dann eine Rolle wenn Umlaute nicht korrekt dargestellt werden (z.B. UTF-8 oder ISO-8859-1)

Die einzelnen Inputs, Outputs und Konfigurationsoptionen dieses Steps werden hier erklärtopen in new window.

Anwendungsbeispiel

Der SpreadsheetCSVReader tritt häufig an zweiter Stelle in Kombination mit dem URLDownload und Mapper auf, wie im Screenshot. Dabei wird eine zuvor per URL geladene Datei eingelesen und anschließend mit dem Mapper weiter aufbereitet.

Hinweis zu Excel/XLS Dateien

Zum Einlesen von Excel / .xls Dateien verwenden Sie bitte den Step ExcelReader.

Keine Spaltenköpfe

Wenn Sie eine CSV-Datei ohne Spaltenköpfe haben, dann können Sie das mit der Option hasHeader = No einstellen. Daraufhin werden generische Spaltenüberschriften nach dem Muster col0, col1, col2 erzeugt.

Dateilimit für Datei hochladen

Im Spreadsheet CSV Reader kann man auch direkt eine Datei hochladen, statt den Input eines vorherigen Steps (z.B. UrlDownload) zu verarbeiten.Das Limit für diesen Upload ist auf 10 MB Dateigröße begrenzt.

Anzahl Zeilen limitieren

Über die Erweiterte Optionen / Limit kann man die Anzahl der einzulesenden Zeilen begrenzen.
Verwenden Sie diese Option zum Testen großer Dateien. Damit vermeiden Sie das z.B. bei einer 100MB CSV Datei immer wieder die komplette Datei eingelesen wird. Dadurch geht die Bearbeitung von Flows wesentlich flüssiger, da weniger Zeilen eingelesen und verarbeitet werden.

Inputs

Das sind die Optionen, mit denen man den Step konfigurieren kann.

Name Datentyp Beschreibung Pflichtfeld Werte
input FILELIST Eine CSV-Datei(FILE) oder Dateiliste(FILELIST) von CSV Dateien. Hinweis: Wenn Sie eine Dateiliste übergeben, werden alle Dateien zu einem einzigen SPREADSHEET zusammengeführt. Sie müssen sicherstellen, dass alle Dateien die gleichen Header (gleiche Struktur) haben, sonst schlägt es fehl oder Sie erhalten unerwartete Ergebnisse. Ja
delimiter STRING Das Trennzeichen der Ergebnisdatei (Default: ';' (Semikolon)). Ja
  • ;
  • ,
  • |
  • Tabulator
  • Leerzeichen
  • Kleiner Als Zeichen
  • Größer Als Zeichen
encoding STRING Die Kodierung der Ergebnisdatei (Standard: UTF-8). Ja
  • Automatische Erkennung
  • UTF-8
  • UTF-16
  • ISO-8859-1
  • ISO-8859-2
  • ISO-8859-4
  • ISO-8859-5
  • ISO-8859-15
  • cp1252 (Windows-1252, ANSI)
  • MacCentralEurope
  • US-ASCII
  • KOI8-R
textqualifier STRING Der Qualifier, in den alle Spalten eingepackt sind. (Standard: " (doppelte Anführungszeichen)) Ja
  • "
  • '
  • |
  • Keine
startLineNo STRING Die Zeilennummer, die mit dem Lesen beginnt. Dies ist nützlich, wenn Sie einige leere Zeilen überspringen wollen. (Standard: 0) Ja
hasHeader STRING Gibt an, ob die erste Zeile eine Kopfzeile hat oder nicht. Wenn 'Nein', dann wird dynamisch eine generische Kopfspalte erstellt. Die erste Zeile ist die Zeile, die mit 'startLineNo' konfiguriert ist. Ja
  • Ja
  • Nein
escapeCharacter STRING Das Zeichen, das für das Escaping von Textqualifikatoren verwendet werden soll (Standard: \ (Backslash) Nein
  • "
  • \
  • Keins
limit STRING Begrenzen Sie die Anzahl der Zeilen, die Sie lesen möchten. Nein

Outputs

Das sind die Ergebnisse des Steps, die von nachfolgenden Steps, nach der Ausführung verwendet werden können.

Name Datentyp Beschreibung Pflichtfeld Werte
spreadsheet SPREADSHEET Das Ergebnis SPREADSHEET. Ja