Možnosti CSV filtru

CSV filtr přijímá řetězec možností obsahujících pět až patnáct tokenů a oddělených čárkami. Tokeny 6 až 15 jsou nepovinné.

Příklad:

Import z UTF-8, jazyk němčina, odděleno čárkou, oddělovač textu ", pole v uvozovkách jako text. Soubor CSV obsahuje sloupce formátované jako datum, číslo, číslo a číslo:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Export do Windows-1252, oddělovač polí čárka, oddělovač textu uvozovka, možnost „Uložit zobrazený obsah buňky“:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Pozice tokenu

Definice

Význam a příklad tokenu

1

Oddělovač polí

Oddělovač (či více oddělovačů) jako hodnoty ASCII. Více hodnot je odděleno znakem lomítka („/“), tj. pokud jsou hodnoty odděleny například středníkem a vodorovným tabulátorem, token bude 59/9. Má-li být několik po sobě následujících oddělovačů považováno za jediný, přidejte k tokenu „/MRG“. Jestliže soubor obsahuje pole s pevnou šířkou, použijte „FIX“. Příklad: 44 (,)

2

Oddělovač textu

Oddělovač textu jako hodnota ASCII, např. 34 pro dvojité a 39 pro jednoduché uvozovky. Příklad: 34 (").

3

Znaková sada

Kód znakové sady souboru. Jednotlivé kódy uvádí tabulka níže. Příklad: 0 (systémová).

4

Číslo řádku pro začátek čtení.

Import CSV

N: číslo řádku, od něhož se začne soubor číst. Příklad: 3 (začne se od třetího řádku).

5

Formátovací kód buňky pro každý sloupec

Import CSV

Posloupnost sloupec / formátovací kód, kde je formátovací kód zadán podle tabulky níže: Příklad: "1/5/2/1/3/1/4/1".

Jsou-li použity oddělovače hodnot, tvar tohoto tokenu je sloupec/formát[/sloupec/formát/...], kde sloupec je číslo sloupce, 1 značí první sloupec zleva. Formátovací kód je podrobně popsán níže.

Pokud je první token FIX, má podobu začátek/formát[/začátek/formát/...], kde je „začátek“ pořadové číslo prvního znaku tohoto pole, 0 přitom znamená znak umístěný zleva na první pozici řádku. Formát je vysvětlen níže.

6

Identifikátor jazyka

Jazyk vyjádřený jako desítkové číslo. Tento token odpovídá seznamu „Jazyk“ v uživatelském rozhraní pro import CSV. Je-li hodnota 0 nebo je vynechána, identifikátor jazyka bude převzat k uživatelského rozhraní. Identifikátor je založen na identifikátorech jazyka společnosti Microsoft.

7

Pole v uvozovkách jako text

Řetězec, buď false, nebo true. Výchozí hodnota: false. Tento token odpovídá zaškrtávacímu poli „Pole v uvozovkách jako text“.

8

Detekovat speciální čísla

Import: Řetězec, buď false, nebo true. Výchozí hodnota: false. Tento token odpovídá zaškrtávacímu poli „Detekovat speciální čísla“.

Export: Řetězec, buď false, nebo true. Výchozí hodnota: true. Tento token nemá v uživatelském rozhraní odpovídající prvek. Je-li true, čísla z buněk jsou uložena jako čísla. Je-li false, čísla jsou uložena jako text s příslušnými oddělovači.

9

Uložit zobrazený obsah buňky

Export CSV

Řetězec, buď false, nebo true. Výchozí hodnota: true. Tento token odpovídá zaškrtávacímu poli „Uložit zobrazený obsah buňky“.

10

Exportovat vzorce v buňkách

Export CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Export vzorců v buňkách.

11

Odstranit mezery

Import CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Odstranění uvozujících a koncových mezer při čtení souboru.

12

Exportovat listy

Export CSV

Export celého dokumentu do souborů .csv pro jednotlivé listy, nebo pouze určeného listu.

  • 0 nebo nezadáno znamená výchozí chování, první list při použití v příkazovém řádku nebo aktuální list možnostech filtru v makru exportovaný do jednoho souboru, například ukazka.csv

  • -1 pro všechny listy, každý list bude exportován do samostatného souboru s názvem složeným ze základního názvu souboru a názvu listu, například ukazka-List1.csv, ukazka-List2.csv a ukazka-List3.csv

  • N exportuje list s pořadovým číslem N. Příklad: chcete-li exportovat druhý list, zadejte 2, výsledkem bude soubor ukazka-List2.csv

13

Importovat jako vzorce

Import CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Určuje, zda se výrazy vzorců, začínající znaménkem je rovno (=), vyhodnotí jako vzorce, nebo zda se importují jako textová data. Je-li true, vzorce se při vstupu vyhodnotí. Je-li false, vzorce se importují jako text. Je-li vynecháno (nezadáno), výchozí hodnota je true, aby se zachovalo chování straších verzí řetězce s možnostmi, které tento token vůbec neobsahovaly. Je-li zadáno a prázdné (nebo jakákoliv jiná hodnota než true), uplatní se výchozí hodnota false.

14

Vložit značku pořadí bajtů (BOM)

Řetězec, buď false, nebo true. Výchozí hodnota: false. Je-li true, export bude obsahovat značku pořadí bajtů (BOM). Je-li false, export BOM obsahovat nebude. Je-li vynecháno (nezadáno), výchozí hodnota je false, aby bylo zachováno chování starších verzí těchto možností, které tento token vůbec neměly. Je-li zadáno a prázdné (nebo jakákoliv jiná hodnota než true), uplatní se výchozí hodnota false. Automaticky detekováno při importu.

15

Detekovat čísla ve vědecké notaci

Řetězec, buď false, nebo true. Výchozí hodnota: true. Je-li true, bude se detekovat, zda se v buňce obsahující „E“ nebo „e“ nachází číslo ve vědecké notaci. Je-li false, vědecká notace se detekovat nebude. Token může mít hodnotu false pouze v případě, že je token 8 (Detekovat speciální čísla) false. Je-li vynecháno, výchozí hodnota je true, aby bylo zachováno chování starších verzí těchto možností, které tento token vůbec neměly.


Zvláštní případ souborů CSV s oddělovačem definovaným na prvním řádku

Při importu a exportu CSV je podporováno nastavení oddělovače polí sep= nebo "sep=". Při čtení dokumentu CSV se oddělovač z tohoto úvodního pole převezme, jestliže se jedná o jediný obsah na tomto řádku.

Při čtení souboru CSV se zápis s uvozovkami zachová jako obsah buňky (bez uvozovek). Například s oddělovačem | se na prvním řádku zobrazí sep=|. Zápis bez uvozovek se nezachová, protože v tomto případě jde o skutečný oddělovač polí, a na prvním řádku se zobrazí sep=.

Při zápisu souboru CSV se stávající obsah levé horní buňky jako například sep=| upraví podle aktuálního oddělovače a zapíše ve tvaru s uvozovkami "sep=|" (pokud nejsou uvozovky / oddělovače textu nastaveny jako prázdné a oddělovačem je |). Vždy se použije ASCII znak dvojité uvozovky ".

Pokud se řádek obsahující sep=| nemá importovat jako data, nezapomeňte v dialogovém okně nastavit číslo Od řádku na 2. Mějte na paměti, že tento řádek se při opětovném uložení nezachová.

Příklad:


        sep=|
        "PÍSMENO"|"ZVÍŘE"
        "a"|"agama"
        "b"|"bekasina"
        "c"|"cibetka"
    

Formátovací kódy pro token 5

Význam

Kód

Standardní

1

Text

2

MM/DD/RR

3

DD/MM/RR

4

RR/MM/DD

5

-

6

-

7

-

8

Ignorovat pole (neimportovat)

9

Angličtina (USA)

10


Kódy znakových sad pro token 3

Znaková sada

Index

Neznámá

0

Windows-1252/WinLatin 1 (západní)

1

Apple Macintosh (západní)

2

DOS/OS2-437/US (západní)

3

DOS/OS2-850/mezinárodní (západní)

4

DOS/OS2-860/portugalština (západní)

5

DOS/OS2-861/islandština (západní)

6

DOS/OS2-863/kanadská francouzština (západní)

7

DOS/OS2-865/Severní Evropa (západní)

8

Výchozí systémová

9

Symboly

10

ASCII/US (západní)

11

ISO-8859-1 (západní)

12

ISO-8859-2 (středoevropská)

13

ISO-8859-3 (Latin 3)

14

ISO-8859-4 (Pobaltí)

15

ISO-8859-5 (Cyrilice)

16

ISO-8859-6 (arabština)

17

ISO-8859-7 (řečtina)

18

ISO-8859-8 (hebrejština)

19

ISO-8859-9 (turečtina)

20

ISO-8859-14 (západní)

21

ISO-8859-15/EURO (západní)

22

DOS/OS2-737 (řečtina)

23

DOS/OS2-775 (Pobaltí)

24

DOS/OS2-852 (středoevropská)

25

DOS/OS2-855 (cyrilice)

26

DOS/OS2-857 (turečtina)

27

DOS/OS2-862 (hebrejština)

28

DOS/OS2-864 (arabština)

29

DOS/OS2-866/ruština (azbuka)

30

DOS/OS2-869/moderní (řečtina)

31

DOS/Windows-874 (thajština)

32

Windows-1250/WinLatin 2 (středoevropská)

33

Windows-1251 (cyrilice)

34

Windows-1253 (řečtina)

35

Windows-1254 (turečtina)

36

Windows-1255 (hebrejština)

37

Windows-1256 (arabština)

38

Windows-1257 (Pobaltí)

39

Windows-1258 (vietnamština)

40

Apple Macintosh (arabština)

41

Apple Macintosh (středoevropská)

42

Apple Macintosh/chorvatština (středoevropská)

43

Apple Macintosh (cyrilice)

44

Nepodporováno: Apple Macintosh (dévanágarí)

45

Nepodporováno: Apple Macintosh (perské)

46

Apple Macintosh (řečtina)

47

Nepodporováno: Apple Macintosh (gudžarátština)

48

Nepodporováno: Apple Macintosh (gurmukhí)

49

Apple Macintosh (hebrejština)

50

Apple Macintosh/islandština (západní)

51

Apple Macintosh/rumunština (středoevropská)

52

Apple Macintosh (thajština)

53

Apple Macintosh (turečtina)

54

Apple Macintosh/ukrajinština (cyrilice)

55

Apple Macintosh (zjednodušená čínština)

56

Apple Macintosh (tradiční čínština)

57

Apple Macintosh (japonština)

58

Apple Macintosh (korejština)

59

Windows-932 (japonština)

60

Windows-936 (zjednodušená čínština)

61

Windows-Wansung-949 (korejština)

62

Windows-950 (tradiční čínština)

63

Shift-JIS (japonština)

64

GB-2312 (zjednodušená čínština)

65

GBT-12345 (tradiční čínština)

66

GBK/GB-2312-80 (zjednodušená čínština)

67

BIG5 (tradiční čínština)

68

EUC-JP (japonština)

69

EUC-CN (zjednodušená čínština)

70

EUC-TW (tradiční čínština)

71

ISO-2022-JP (japonština)

72

ISO-2022-CN (zjednodušená čínština)

73

KOI8-R (azbuka)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (středoevropská)

77

ISO-8859-13 (středoevropská)

78

EUC-KR (korejština)

79

ISO-2022-KR (korejština)

80

JIS 0201 (japonština)

81

JIS 0208 (japonština)

82

JIS 0212 (japonština)

83

Windows-Johab-1361 (korejština)

84

GB-18030 (zjednodušená čínština)

85

BIG5-HKSCS (tradiční čínština)

86

TIS 620 (thajština)

87

KOI8-U (cyrilice)

88

ISCII dévanágarí (indická)

89

Unicode (UTF-8 upravené pro Javu)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Windows, asijská cyrilice, kódování vyvinuté ve společnosti ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535


Podpořte nás!