Možnosti CSV filtru

CSV filtr přijímá řetězec možností obsahujících pět až patnáct tokenů a oddělených čárkami. Tokeny 6 až 15 jsou nepovinné.

Příklad:

Import z UTF-8, jazyk němčina, odděleno čárkou, oddělovač textu ", pole v uvozovkách jako text. Soubor CSV obsahuje sloupce formátované jako datum, číslo, číslo a číslo:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Export do Windows-1252, oddělovač polí čárka, oddělovač textu uvozovka, možnost „Uložit zobrazený obsah buňky“:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Pozice tokenu

Definice

Význam a příklad tokenu

1

Oddělovač polí

Oddělovač (či více oddělovačů) jako hodnoty ASCII. Více hodnot je odděleno znakem lomítka („/“), tj. pokud jsou hodnoty odděleny například středníkem a vodorovným tabulátorem, token bude 59/9. Má-li být několik po sobě následujících oddělovačů považováno za jediný, přidejte k tokenu „/MRG“. Jestliže soubor obsahuje pole s pevnou šířkou, použijte „FIX“. Příklad: 44 (,)

2

Oddělovač textu

Oddělovač textu jako hodnota ASCII, např. 34 pro dvojité a 39 pro jednoduché uvozovky. Příklad: 34 (").

3

Znaková sada

Kód znakové sady souboru. Jednotlivé kódy uvádí tabulka níže. Příklad: 0 (systémová).

4

Číslo řádku pro začátek čtení.

Import CSV

N: číslo řádku, od něhož se začne soubor číst. Příklad: 3 (začne se od třetího řádku).

5

Formátovací kód buňky pro každý sloupec

Import CSV

Posloupnost sloupec / formátovací kód, kde je formátovací kód zadán podle tabulky níže: Příklad: "1/5/2/1/3/1/4/1".

Jsou-li použity oddělovače hodnot, tvar tohoto tokenu je sloupec/formát[/sloupec/formát/...], kde sloupec je číslo sloupce, 1 značí první sloupec zleva. Formátovací kód je podrobně popsán níže.

Pokud je první token FIX, má podobu začátek/formát[/začátek/formát/...], kde je „začátek“ pořadové číslo prvního znaku tohoto pole, 0 přitom znamená znak umístěný zleva na první pozici řádku. Formát je vysvětlen níže.

6

Identifikátor jazyka

Jazyk vyjádřený jako desítkové číslo. Tento token odpovídá seznamu „Jazyk“ v uživatelském rozhraní pro import CSV. Je-li hodnota 0 nebo je vynechána, identifikátor jazyka bude převzat k uživatelského rozhraní. Identifikátor je založen na identifikátorech jazyka společnosti Microsoft.

7

Pole v uvozovkách jako text

Řetězec, buď false, nebo true. Výchozí hodnota: false. Tento token odpovídá zaškrtávacímu poli „Pole v uvozovkách jako text“.

8

Detekovat speciální čísla

Import: Řetězec, buď false, nebo true. Výchozí hodnota: false. Tento token odpovídá zaškrtávacímu poli „Detekovat speciální čísla“.

Export: Řetězec, buď false, nebo true. Výchozí hodnota: true. Tento token nemá v uživatelském rozhraní odpovídající prvek. Je-li true, čísla z buněk jsou uložena jako čísla. Je-li false, čísla jsou uložena jako text s příslušnými oddělovači.

9

Uložit zobrazený obsah buňky

Export CSV

Řetězec, buď false, nebo true. Výchozí hodnota: true. Tento token odpovídá zaškrtávacímu poli „Uložit zobrazený obsah buňky“.

10

Exportovat vzorce v buňkách

Export CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Export vzorců v buňkách.

11

Odstranit mezery

Import CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Odstranění uvozujících a koncových mezer při čtení souboru.

12

Exportovat listy

Export CSV

Export celého dokumentu do souborů .csv pro jednotlivé listy, nebo pouze určeného listu.

  • 0 nebo nezadáno znamená výchozí chování, první list při použití v příkazovém řádku nebo aktuální list možnostech filtru v makru exportovaný do jednoho souboru, například ukazka.csv

  • -1 pro všechny listy, každý list bude exportován do samostatného souboru s názvem složeným ze základního názvu souboru a názvu listu, například ukazka-List1.csv, ukazka-List2.csv a ukazka-List3.csv

  • N exportuje list s pořadovým číslem N. Příklad: chcete-li exportovat druhý list, zadejte 2, výsledkem bude soubor ukazka-List2.csv

13

Importovat jako vzorce

Import CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Určuje, zda se výrazy vzorců, začínající znaménkem je rovno (=), vyhodnotí jako vzorce, nebo zda se importují jako textová data. Je-li true, vzorce se při vstupu vyhodnotí. Je-li false, vzorce se importují jako text. Je-li vynecháno (nezadáno), výchozí hodnota je true, aby se zachovalo chování straších verzí řetězce s možnostmi, které tento token vůbec neobsahovaly. Je-li zadáno a prázdné (nebo jakákoliv jiná hodnota než true), uplatní se výchozí hodnota false.

14

Vložit značku pořadí bajtů (BOM)

Export CSV

Řetězec, buď false, nebo true. Výchozí hodnota: false. Je-li true, export bude obsahovat značku pořadí bajtů (BOM). Je-li false, export BOM obsahovat nebude. Je-li vynecháno (nezadáno), výchozí hodnota je false, aby bylo zachováno chování starších verzí těchto možností, které tento token vůbec neměly. Je-li zadáno a prázdné (nebo jakákoliv jiná hodnota než true), uplatní se výchozí hodnota false. Automaticky detekováno při importu.

15

Detekovat čísla ve vědecké notaci

Import CSV

Řetězec, buď false, nebo true. Výchozí hodnota: true. Je-li true, bude se detekovat, zda se v buňce obsahující „E“ nebo „e“ nachází číslo ve vědecké notaci. Je-li false, vědecká notace se detekovat nebude. Token může mít hodnotu false pouze v případě, že je token 8 (Detekovat speciální čísla) false. Je-li vynecháno, výchozí hodnota je true, aby bylo zachováno chování starších verzí těchto možností, které tento token vůbec neměly.


Zvláštní případ souborů CSV s oddělovačem definovaným na prvním řádku

Při importu a exportu CSV je podporováno nastavení oddělovače polí sep= nebo "sep=". Při čtení dokumentu CSV se oddělovač z tohoto úvodního pole převezme, jestliže se jedná o jediný obsah na tomto řádku.

Při čtení souboru CSV se zápis s uvozovkami zachová jako obsah buňky (bez uvozovek). Například s oddělovačem | se na prvním řádku zobrazí sep=|. Zápis bez uvozovek se nezachová, protože v tomto případě jde o skutečný oddělovač polí, a na prvním řádku se zobrazí sep=.

Při zápisu souboru CSV se stávající obsah levé horní buňky jako například sep=| upraví podle aktuálního oddělovače a zapíše ve tvaru s uvozovkami "sep=|" (pokud nejsou uvozovky / oddělovače textu nastaveny jako prázdné a oddělovačem je |). Vždy se použije ASCII znak dvojité uvozovky ".

Pokud se řádek obsahující sep=| nemá importovat jako data, nezapomeňte v dialogovém okně nastavit číslo Od řádku na 2. Mějte na paměti, že tento řádek se při opětovném uložení nezachová.

Příklad:


        sep=|
        "PÍSMENO"|"ZVÍŘE"
        "a"|"agama"
        "b"|"bekasina"
        "c"|"cibetka"
    

Formátovací kódy pro token 5

Význam

Kód

Standardní

1

Text

2

MM/DD/RR

3

DD/MM/RR

4

RR/MM/DD

5

-

6

-

7

-

8

Ignorovat pole (neimportovat)

9

Angličtina (USA)

10


Kódy znakových sad pro token 3

Znaková sada

Index

Neznámá

0

Windows-1252/WinLatin 1 (západní)

1

Apple Macintosh (západní)

2

DOS/OS2-437/US (západní)

3

DOS/OS2-850/mezinárodní (západní)

4

DOS/OS2-860/portugalština (západní)

5

DOS/OS2-861/islandština (západní)

6

DOS/OS2-863/kanadská francouzština (západní)

7

DOS/OS2-865/Severní Evropa (západní)

8

Výchozí systémová

9

Symboly

10

ASCII/US (západní)

11

ISO-8859-1 (západní)

12

ISO-8859-2 (středoevropská)

13

ISO-8859-3 (Latin 3)

14

ISO-8859-4 (Pobaltí)

15

ISO-8859-5 (Cyrilice)

16

ISO-8859-6 (arabština)

17

ISO-8859-7 (řečtina)

18

ISO-8859-8 (hebrejština)

19

ISO-8859-9 (turečtina)

20

ISO-8859-14 (západní)

21

ISO-8859-15/EURO (západní)

22

DOS/OS2-737 (řečtina)

23

DOS/OS2-775 (Pobaltí)

24

DOS/OS2-852 (středoevropská)

25

DOS/OS2-855 (cyrilice)

26

DOS/OS2-857 (turečtina)

27

DOS/OS2-862 (hebrejština)

28

DOS/OS2-864 (arabština)

29

DOS/OS2-866/ruština (azbuka)

30

DOS/OS2-869/moderní (řečtina)

31

DOS/Windows-874 (thajština)

32

Windows-1250/WinLatin 2 (středoevropská)

33

Windows-1251 (cyrilice)

34

Windows-1253 (řečtina)

35

Windows-1254 (turečtina)

36

Windows-1255 (hebrejština)

37

Windows-1256 (arabština)

38

Windows-1257 (Pobaltí)

39

Windows-1258 (vietnamština)

40

Apple Macintosh (arabština)

41

Apple Macintosh (středoevropská)

42

Apple Macintosh/chorvatština (středoevropská)

43

Apple Macintosh (cyrilice)

44

Nepodporováno: Apple Macintosh (dévanágarí)

45

Nepodporováno: Apple Macintosh (perské)

46

Apple Macintosh (řečtina)

47

Nepodporováno: Apple Macintosh (gudžarátština)

48

Nepodporováno: Apple Macintosh (gurmukhí)

49

Apple Macintosh (hebrejština)

50

Apple Macintosh/islandština (západní)

51

Apple Macintosh/rumunština (středoevropská)

52

Apple Macintosh (thajština)

53

Apple Macintosh (turečtina)

54

Apple Macintosh/ukrajinština (cyrilice)

55

Apple Macintosh (zjednodušená čínština)

56

Apple Macintosh (tradiční čínština)

57

Apple Macintosh (japonština)

58

Apple Macintosh (korejština)

59

Windows-932 (japonština)

60

Windows-936 (zjednodušená čínština)

61

Windows-Wansung-949 (korejština)

62

Windows-950 (tradiční čínština)

63

Shift-JIS (japonština)

64

GB-2312 (zjednodušená čínština)

65

GBT-12345 (tradiční čínština)

66

GBK/GB-2312-80 (zjednodušená čínština)

67

BIG5 (tradiční čínština)

68

EUC-JP (japonština)

69

EUC-CN (zjednodušená čínština)

70

EUC-TW (tradiční čínština)

71

ISO-2022-JP (japonština)

72

ISO-2022-CN (zjednodušená čínština)

73

KOI8-R (azbuka)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (středoevropská)

77

ISO-8859-13 (středoevropská)

78

EUC-KR (korejština)

79

ISO-2022-KR (korejština)

80

JIS 0201 (japonština)

81

JIS 0208 (japonština)

82

JIS 0212 (japonština)

83

Windows-Johab-1361 (korejština)

84

GB-18030 (zjednodušená čínština)

85

BIG5-HKSCS (tradiční čínština)

86

TIS 620 (thajština)

87

KOI8-U (cyrilice)

88

ISCII dévanágarí (indická)

89

Unicode (UTF-8 upravené pro Javu)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Windows, asijská cyrilice, kódování vyvinuté ve společnosti ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535


Podpořte nás!