Opcje filtra CSV

Filtr CSV akceptuje łańcuch opcji zawierający od pięciu do piętnastu tokenów oddzielonych przecinkami. Tokeny od 6 do 15 są opcjonalne.

Przykład:

Import z UTF-8, język niemiecki, oddzielone przecinkami, ogranicznik tekstu ", pola w cudzysłowie jako tekst. Plik CSV zawiera kolumny sformatowane jako data, liczba, liczba i liczba:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Eksportuj do Windows-1252, ogranicznik pola: przecinek, ogranicznik tekstu: cytat, zapisz zawartość komórki jak przedstawiono:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Pozycja tokena

Definicja

Znaczenie i przykład tokena

1

Separator pól

Separatory pól jako wartości ASCII. Wiele wartości jest oddzielonych znakiem ukośnika ("/"), co oznacza, że jeśli wartości są oddzielone średnikami i tabulatorami poziomymi, tokenem będzie 59/9. Aby traktować kilka kolejnych separatorów jako jeden, należy dołączyć "/MRG" do tokena. Jeśli plik zawiera pola o stałej szerokości, użyj opcji "FIX". Przykład: 44 (,)

2

Ogranicznik tekstu

Ogranicznik tekstu jako wartość ASCII, np. 34 w cudzysłowach podwójnych i 39 w cudzysłowach pojedynczych. Przykład: 34 (").

3

Zestaw znaków

Kod zestawu znaków używany w pliku zgodnie z opisem w poniższej tabeli. Przykład: 0 (system).

4

Numer wiersza, aby rozpocząć odczyt.

Import CSV

N: numer wiersza, od którego należy rozpocząć odczyt pliku. Przykład: 3 (zaczyna się od trzeciego wiersza).

5

Kod formatowania komórek dla każdej kolumny

Import CSV

Sekwencja kodu kolumny/formatowania, gdzie kod formatowania jest podany w poniższej tabeli. Przykład: "1/5/2/1/3/1/4/1".

Jeśli używane są separatory wartości, postać tego tokena to kolumna/format[/kolumna/format/…], gdzie kolumna to numer kolumny, gdzie 1 to kolumna znajdująca się najbardziej po lewej stronie. Kod formatu jest szczegółowo opisany poniżej.

Jeśli pierwszym tokenem jest FIX, ma on postać start/format[/start/format/…], gdzie start to numer pierwszego znaku dla tego pola, gdzie 0 to znak znajdujący się najbardziej na lewo w wierszu. Format wyjaśniono poniżej.

6

Identyfikator języka

Ciąg wyrażony w notacji dziesiętnej. Ten token jest odpowiednikiem pola listy "Język" w interfejsie użytkownika do importu pliku CSV. Jeśli wartość wynosi 0 lub jest pominięta, używany jest identyfikator języka interfejsu użytkownika. Identyfikator języka jest oparty na identyfikatorach języka firmy Microsoft.

7

Pola w cudzysłowie jako tekst

Ciąg, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Pola w cudzysłowie jako tekst".

8

Wykryj numery specjalne

Importuj: ciąg znaków, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Wykryj numery specjalne".

Eksportuj: ciąg znaków, false albo true. Wartość domyślna: true. Ten token nie ma odpowiednika w interfejsie użytkownika. Jeśli true, komórki liczbowe są przechowywane jako liczby. Jeśli false, liczby są przechowywane jako tekst z ogranicznikami tekstu.

9

Zapisz zawartość komórki jak przedstawiono

Eksport CSV

Ciąg, false albo true. Wartość domyślna:true. Token ten jest odpowiednikiem pola wyboru "Zapisz zawartość komórki jak przedstawiono".

10

Eksportuj formuły komórek

Eksport CSV

Ciąg, false albo true. Wartość domyślna: false. Eksportuj formuły komórek.

11

Usuń odstępy

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Usuń odstępy. Przycinaj początkowe i końcowe odstępy podczas odczytu pliku.

12

Eksportuj arkusze

Eksport CSV

Eksportuj cały dokument do pojedynczych arkuszy plików .csv lub określonego arkusza.

  • 0 lub brak: oznacza zachowanie domyślne, pierwszy arkusz z wiersza poleceń lub bieżący arkusz w opcjach filtra makr, wyeksportowany do pliku sample.csv

  • -1: dla wszystkich arkuszy każdy arkusz jest eksportowany do osobnego pliku o nazwie podstawowej połączonej z nazwą arkusza, na przykład próbka-Arkusz1.csv, próbka-Arkusz2.csv i próbka-Arkusz3.csv

  • N: eksportuj n-ty arkusz w zakresie liczby arkuszy. Przykład: aby wyeksportować drugi arkusz, ustaw tutaj 2, aby uzyskać plik próbka-Arkusz2.csv

13

Importuj jako formuły

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Określa, czy wyrażenia formuł zaczynające się od znaku równości = mają być oceniane jako formuły, czy importowane jako dane tekstowe. Jeśli true ocenia formuły na wejściu. Jeśli false formuły są wprowadzane jako tekst. Jeśli zostanie pominięty (w ogóle nie występuje), domyślną wartością jest true, aby zachować zachowanie ciągu opcji ze starych wersji, które w ogóle nie miały tego tokena. Jeśli obecny i pusty (lub dowolna inna wartość niż true), domyślną wartością jest false.

14

Dołącz znacznik kolejności bajtów (BOM)

Ciąg, false albo true. Wartość domyślna: false. Jeśli true dołącz znacznik kolejności bajtów (BOM) do eksportu. Jeśli false eksport nie zawiera BOM. Jeśli zostanie pominięty (w ogóle nie występuje), domyślną wartością jest false, aby zachować zachowanie ciągu opcji ze starych wersji, które w ogóle nie miały tego tokena. Jeśli obecny i pusty (lub dowolna inna wartość niż true), domyślną wartością jest false. Wykrywane automatycznie podczas importu.

15

Wykrywanie liczb w notacji naukowej

Ciąg, false albo true. Wartość domyślna: true. Funkcja If true wykryje, czy zawartość komórki zawierająca "E" lub "e" jest liczbą w notacji naukowej. Jeśli false nie próbuj wykrywać liczb w notacji naukowej. Token może mieć wartość false tylko wtedy, gdy token 8 (Wykryj liczby specjalne) jest false. Jeśli pominięto, domyślną wartością jest true, aby zachować zachowanie ciągu opcji starych wersji, które w ogóle nie miały tego tokena.


Specjalny przypadek plików CSV z separatorem zdefiniowanym w pierwszym wierszu

Import i eksport CSV obsługują ustawienie separatora pól sep= i "sep=". Podczas odczytu dokumentu CSV separator jest pobierany z początkowego pojedynczego pola sep= lub "sep=", jeśli jest to jedyna treść wiersza.

Podczas odczytywania pliku CSV cytowana forma jest zachowywana jako (niecytowana) zawartość komórki. Widzisz sep=|, gdy | jest separatorem w pierwszym wierszu. W formie bez cudzysłowów separator jest odrzucany, ponieważ jest to rzeczywisty separator pól w kontekście. Widzisz sep= w pierwszym wierszu.

Podczas zapisywania pliku CSV, istniejąca zawartość pojedynczej komórki w lewym górnym rogu, taka jak sep=| jest dopasowywana do bieżącego separatora za pomocą cytowanej formy "sep=|" (jeśli cudzysłowy/ograniczniki tekstu nie są puste, a | jest separatorem) i zawsze używa znaku podwójnego cudzysłowu ASCII ".

Jeśli wiersz zawierający sep=| nie ma być importowany jako dane, pamiętaj o ustawieniu numeru Od wiersza w oknie dialogowym na 2. Zauważ, że ten wiersz nie będzie zachowane podczas ponownego zapisywania.

Przykład:


        sep=|
        "LITERA"|"ZWIERZĘ"
        "a"|"antylopa"
        "b"|"bocian"
        "c"|"chomik"
    

Kody formatowania dla tokena 5

Znaczenie

Kod

Standardowy

1

Теkst

2

MM/DD/RR

3

DD/MM/RR

4

RR/MM/DD

5

-

6

-

7

-

8

Ignoruj pole (nie importuj)

9

Angielski (USA)

10


Kody zestawów znaków dla tokena 3

Zestaw znaków

Indeks

Nieznany

0

Windows-1252/WinLatin 1 (zachodni)

1

Apple Macintosh (zachodni)

2

DOS/OS2-437/US (zachodni)

3

DOS/OS2-850/Międzynarodowy (zachodni)

4

DOS/OS2-860/Portugalski (zachodni)

5

DOS/OS2-861/Islandzki (zachodni)

6

DOS/OS2-863/Kanadyjsko-francuski (zachodni)

7

DOS/OS2-865/Nordycki (zachodni)

8

Domyślny systemu

9

Symbol

10

ASCII/US (zachodni)

11

ISO-8859-1 (zachodni)

12

ISO-8859-2 (środkowoeuropejski)

13

ISO-8859-3 (łaciński 3)

14

ISO-8859-4 (bałtycki)

15

ISO-8859-5 (cyrylica)

16

ISO-8859-6 (arabski)

17

ISO-8859-7 (grecki)

18

ISO-8859-8 (hebrajski)

19

ISO-8859-9 (turecki)

20

ISO-8859-14 (zachodni)

21

ISO-8859-15/EURO (zachodni)

22

DOS/OS2-737 (grecki)

23

DOS/OS2-775 (bałtycki)

24

DOS/OS2-852 (środkowoeuropejski)

25

DOS/OS2-855 (cyrylica)

26

DOS/OS2-857 (turecki)

27

DOS/OS2-862 (hebrajski)

28

DOS/OS2-864 (arabski)

29

DOS/OS2-866/Rosyjski (cyrylica)

30

DOS/OS2-869/Współczesny (grecki)

31

DOS/Windows-874 (tajski)

32

Windows-1250/WinLatin 2 (środkowoeuropejski)

33

Windows-1251 (cyrylica)

34

Windows-1253 (grecki)

35

Windows-1254 (turecki)

36

Windows-1255 (hebrajski)

37

Windows-1256 (arabski)

38

Windows-1257 (bałtycki)

39

Windows-1258 (wietnamski)

40

Apple Macintosh (arabski)

41

Apple Macintosh (środkowoeuropejski)

42

Apple Macintosh/Chorwacki (środkowoeuropejski)

43

Apple Macintosh (cyrylica)

44

Nieobsługiwany: Apple Macintosh (dewanagari)

45

Nieobsługiwany: Apple Macintosh (perski)

46

Apple Macintosh (grecki)

47

Nieobsługiwany: Apple Macintosh (gudżarati)

48

Nieobsługiwany: Apple Macintosh (gurmukhi)

49

Apple Macintosh (hebrajski)

50

Apple Macintosh/Islandzki (zachodni)

51

Apple Macintosh/Rumuński (środkowoeuropejski)

52

Apple Macintosh (tajski)

53

Apple Macintosh (turecki)

54

Apple Macintosh/Ukraiński (cyrylica)

55

Apple Macintosh (chiński uproszczony)

56

Apple Macintosh (chiński tradycyjny)

57

Apple Macintosh (japoński)

58

Apple Macintosh (koreański)

59

Windows-932 (japoński)

60

Windows-936 (chiński uproszczony)

61

Windows-Wansung-949 (koreański)

62

Windows-950 (chiński tradycyjny)

63

Shift-JIS (japoński)

64

GB-2312 (chiński uproszczony)

65

GBT-12345 (chiński tradycyjny)

66

GBK/GB-2312-80 (chiński uproszczony)

67

BIG5 (chiński tradycyjny)

68

EUC-JP (japoński)

69

EUC-CN (chiński uproszczony)

70

EUC-TW (chiński tradycyjny)

71

ISO-2022-JP (japoński)

72

ISO-2022-CN (chiński uproszczony)

73

KOI8-R (cyrylica)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (środkowoeuropejski)

77

ISO-8859-13 (środkowoeuropejski)

78

EUC-KR (koreański)

79

ISO-2022-KR (koreański)

80

JIS 0201 (japoński)

81

JIS 0208 (japoński)

82

JIS 0212 (japoński)

83

Windows-Johab-1361 (koreański)

84

GB-18030 (chiński uproszczony)

85

BIG5-HKSCS (chiński tradycyjny)

86

TIS 620 (tajski)

87

KOI8-U (cyrylica)

88

ISCII dewanagari (indyjski)

89

Unicode (zmodyfikowany UTF-8 Javy)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Azjatycka strona kodowa cyrylicy systemu Windows opracowana w ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535


Prosimy o wsparcie!