CSVReader Step
Der CSVReader Step kann eine CSV-Datei oder eine andere beliebig getrennte Textdatei einlesen und Sie in ein Spreadsheet umwandeln.
Dabei kann man einstellen wie genau die Datei eingelesen werden soll. Das betrifft typische Einstellungen wie:
- Spaltentrenner (z.B. Komma, Semikolon, Tabulator)
- Textqualifier (in der Regel doppelte Anführungszeichen, die jeden Spaltenwert umschließen)
- Encoding: Spielt immer dann eine Rolle wenn Umlaute nicht korrekt dargestellt werden (z.B. UTF-8 oder ISO-8859-1)
Die einzelnen Inputs, Outputs und Konfigurationsoptionen dieses Steps werden hier erklärt.
Anwendungsbeispiel
Der SpreadsheetCSVReader tritt häufig an zweiter Stelle in Kombination mit dem URLDownload und Mapper auf, wie im Screenshot. Dabei wird eine zuvor per URL geladene Datei eingelesen und anschließend mit dem Mapper weiter aufbereitet.
Hinweis zu Excel/XLS Dateien
Zum Einlesen von Excel / .xls Dateien verwenden Sie bitte den Step ExcelReader.
Keine Spaltenköpfe
Wenn Sie eine CSV-Datei ohne Spaltenköpfe haben, dann können Sie das mit der Option hasHeader = No einstellen. Daraufhin werden generische Spaltenüberschriften nach dem Muster col0, col1, col2 erzeugt.
Dateilimit für Datei hochladen
Im Spreadsheet CSV Reader kann man auch direkt eine Datei hochladen, statt den Input eines vorherigen Steps (z.B. UrlDownload) zu verarbeiten.Das Limit für diesen Upload ist auf 10 MB Dateigröße begrenzt.
Anzahl Zeilen limitieren
Über die Erweiterte Optionen / Limit kann man die Anzahl der einzulesenden Zeilen begrenzen.
Verwenden Sie diese Option zum Testen großer Dateien. Damit vermeiden Sie das z.B. bei einer 100MB CSV Datei immer wieder die komplette Datei eingelesen wird. Dadurch geht die Bearbeitung von Flows wesentlich flüssiger, da weniger Zeilen eingelesen und verarbeitet werden.
Inputs
Das sind die Optionen, mit denen man den Step konfigurieren kann.
Name | Datentyp | Beschreibung | Pflichtfeld | Werte |
---|---|---|---|---|
input | FILELIST | Eine CSV-Datei(FILE) oder Dateiliste(FILELIST) von CSV Dateien. Hinweis: Wenn Sie eine Dateiliste übergeben, werden alle Dateien zu einem einzigen SPREADSHEET zusammengeführt. Sie müssen sicherstellen, dass alle Dateien die gleichen Header (gleiche Struktur) haben, sonst schlägt es fehl oder Sie erhalten unerwartete Ergebnisse. | Ja | |
delimiter | STRING | Das Trennzeichen der Ergebnisdatei (Default: ';' (Semikolon)). | Ja |
|
encoding | STRING | Die Kodierung der Ergebnisdatei (Standard: UTF-8). | Ja |
|
textqualifier | STRING | Der Qualifier, in den alle Spalten eingepackt sind. (Standard: " (doppelte Anführungszeichen)) | Ja |
|
startLineNo | STRING | Die Zeilennummer, die mit dem Lesen beginnt. Dies ist nützlich, wenn Sie einige leere Zeilen überspringen wollen. (Standard: 0) | Ja | |
hasHeader | STRING | Gibt an, ob die erste Zeile eine Kopfzeile hat oder nicht. Wenn 'Nein', dann wird dynamisch eine generische Kopfspalte erstellt. Die erste Zeile ist die Zeile, die mit 'startLineNo' konfiguriert ist. | Ja |
|
escapeCharacter | STRING | Das Zeichen, das für das Escaping von Textqualifikatoren verwendet werden soll (Standard: \ (Backslash) | Nein |
|
limit | STRING | Begrenzen Sie die Anzahl der Zeilen, die Sie lesen möchten. | Nein |
Outputs
Das sind die Ergebnisse des Steps, die von nachfolgenden Steps, nach der Ausführung verwendet werden können.
Name | Datentyp | Beschreibung | Pflichtfeld | Werte |
---|---|---|---|---|
spreadsheet | SPREADSHEET | Das Ergebnis SPREADSHEET. | Ja |