Daftar Ekspresi Reguler

note

For a full list of supported metacharacters and syntax, see ICU Regular Expressions documentation


Istilah

Representasi/Gunakan

Karakter

Karakter yang diberikan, kecuali karakter meta ekspresi reguler. Daftar karakter meta ada dalam tabel berikut.

.

Setiap karakter tunggal kecuali satu baris atau paragraf. Misalnya, istilah pencarian "sh.rt" sesuai dengan "shirt" dan "short".

^

Awal paragraf atau sel. Objek khusus seperti bidang kosong atau bingkai karakter-berlabuh, diawal paragraf diabaikan. Misalnya: "^Peter" sesuai dengan kata "Peter" hanya ketika itu adalah kata pertama dari sebuah paragraf.

$

Akhir paragraf atau sel. Objek khusus seperti bidang kosong atau bingkai karakter-berlabuh di akhir paragraf diabaikan. Misalnya "Peter$" hanya sesuai ketika kata "Peter" adalah kata terakhir dari sebuah paragraf, perhatikan "Peter" tidak dapat diikuti dengan titik.

$ berdiri sendiri cocok dengan akhir dari suatu paragraf. Dengan cara ini mungkin untuk mencari dan mengganti pemutus paragraf.

*

Nol atau lebih dari istilah ekspresi reguler segera sebelum itu. Misalnya, "Ab*c" sesuai dengan "Ac", "Abc", "Abbc", "Abbbc" dan so on.

+

Satu atau lebih dari istilah ekspresi reguler yang mendahuluinya. Misalnya, "AX.+4" ditemukan "AXx4", tapi bukan "AX4".

String terpanjang yang mungkin sesuai dengan persamaan ekspresi reguler ini dalam paragraf yang selalu cocok. Jika paragraf berisi string "AX 4 AX4", seluruh bagian disorot.

?

Nol atau salah satu istilah ekspresi reguler seketika sebelum itu. Misalnya, "Texts?" cocok dengan "Text" dan "Texts" dan "x(ab|c)?y" menemukan "xy", "xaby", atau "xcy".

\

Karakter khusus yang mengikutinya ditafsirkan sebagai karakter normal dan bukan sebagai karakter meta ekspresi reguler (kecuali untuk kombinasi "\n", "\t", "\b", "\>", dan "\<"). Misalnya, "tree\." cocok dengan "tree.", bukan "treed" atau "trees".

\n

When entered in the Find text box, finds a line break that was inserted with the Shift+Enter key combination in Writer, or the Ctrl+Enter key combination in a Calc cell.

When entered in the Replace text box in Writer, inserts a paragraph break that can be inserted with the Enter or Return key. It has no special meaning in Calc, and is treated literally there.

To change line breaks into paragraph breaks in Writer, enter \n in both the Find and Replace boxes, and then perform a search and replace.

\t

Sebuah karater tab. Dapat juga digunakan pada kotak Gantikan.

\b

Batas kata. Misalnya, "\bbook" cocok dengan "bookmark" dan "book" tapi tidak "checkbook", sedangkan "book\b" cocok dengan "checkbook" dan "book", tetapi tidak "bookmark".

Catatan, formulir ini menggantikan yang usang (meskipun mereka masih bekerja untuk sekarang) "\>" (cocok akhir kata) dan "\<" (cocok awal kata).

^$

Menemukan sebuah paragraf kosong.

^.

Menemukan karakter pertama paragraf.

& atau $0

Menambahkan string yang ditemukan oleh kriteria pencarian di kotak Cari ke istilah di kotak Ganti ketika Anda membuat pengganti.

Misalnya, jika Anda memasukkan "window" di kotak Cari dan "&frame" di kotak Ganti, maka kata "window" digantikan oleh "windowframe".

Anda juga dapat memasukkan "&" di kotak Ganti untuk memodifikasi Atribut atau Format dari string yang ditemukan oleh kriteria pencarian.

[...]

Setiap kemunculan tunggal dari salah satu karakter yang berada di antara tanda kurung. Misalnya: "[abc123]" cocok dengan karakter 'a', 'b', 'c', '1', '2', dan '3'. "[a-e]" cocok kemunculan tunggal karakter a sampai e, inklusif (kisaran harus ditentukan dengan karakter yang memiliki nomor kode Unicode terkecil terlebih dahulu). "[a-eh-x]" cocok dengan kemunculan tunggal dari karakter yang berada dalam rentang 'a' sampai dengan 'e' dan 'h' sampai dengan 'x'.

[^...]

Setiap kemunculan tunggal karakter, termasuk karakter Tab, Spasi, dan Putus Baris, yang tidak ada dalam daftar karakter yang ditentukan dalam rentang inklusif diizinkan. Misalnya "[^a-syz]" cocok semua karakter tidak dalam rentang inklusif 'a' sampai dengan 's' atau karakter 'y' dan 'z'.

\uXXXX

\UXXXXXXXX

Karakter yang diwakili oleh kode Unicode heksadesimal empat digit (XXXX).

Karakter yang diwakili oleh kode Unicode heksadesimal delapan digit (XXXXXXXX).

note

For certain symbol fonts the symbol (glyph) that you see on screen may look related to a different Unicode code than what is actually used for it in the font. The Unicode codes can be viewed by choosing Insert - Special Character, or by using Unicode conversion shortcut.


\N{UNICODE CHARACTER NAME}

Match the Unicode named character.

Some remarkable Unicode named characters are SPACE, NO-BREAK SPACE, SOFT HYPHEN, ACUTE ACCENT, CIRCUMFLEX ACCENT, GRAVE ACCENT.

note

The Unicode character names can be searched and viewed by choosing Insert - Special Character.


|

Operator infiks yang membatasi alternatif. Cocok dengan istilah sebelum "|" atau istilah setelah "|". Misalnya, "this|that" cocok dengan kemunculan dari kedua "this" dan "that".

{N}

The post-fix repetition operator that specifies an exact number of occurrences ("N") of the regular expression term immediately preceding it must be present for a match to occur. For example, "tre{2}" matches "tree".

{N,M}

The post-fix repetition operator that specifies a range (minimum of "N" to a maximum of "M") of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. For example, "tre{1,2}" matches "tre" and "tree".

{N,}

The post-fix repetition operator that specifies a range (minimum "N" to an unspecified maximum) of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. (The maximum number of occurrences is limited only by the size of the document). For example, "tre{2,}" matches "tree", "treee", and "treeeee".

(...)

The grouping construct that serves three purposes.

  1. Untuk mengapit satu set alternatif '|'. Misalnya, ekspresi reguler "b(oo|ac)k" cocok dengan "book" dan "back".

  2. To group terms in a complex expression to be operated on by the post-fix operators: "*", "+" and "?" along with the post-fix repetition operators. For example, the regular expression "a(bc)?d" matches both "ad" and "abcd"; "M(iss){2}ippi" matches "Mississippi".

  3. To reference the matched sub string inside the parentheses for later use. The "\N" construct is used in the Find box, the "$N" construct is used in the Replace box. "N" being a digit, the reference to the first match is represented by "\1" in the Find box and by "$1" in the Replace box; "\2" and "$2" reference to the second matched, and so on.

For example, the regular expression "(890)xy\1z\1" matches "890xy890z890".

With the regular expression "(fruit|truth)\b" in the Find box, and the replacement expression "$1ful" in the Replace box, occurrences of "fruit" and "truth" are replaced with "fruitful" and "truthful" respectively. Note: "\b" prevents "fruitfully" or "truthfully" from matching.

[:alpha:]

Represents an alphabetic character. Use [:alpha:] to find one of them.

\d

[:digit:]

Represents a decimal digit. Use [:digit:] to find one of them.

[:alnum:]

Merepresentasikan karakter alfabetis ([:alpha:] dan [:digit:]).

\s

[:space:]

Merepresentasikan karakter spasi (tetapi bukan karakter whitespace lain).

[:print:]

Melambangkan sebuah karakter yang dapat dicetak.

[:cntrl:]

Melambangkan sebuah karakter yang tidak tercetak.

[:lower:]

Merepresentasikan karakter huruf kecil jika Kapitalisasi yang sama dipilih di Pengaturan.

[:upper:]

Merepresentasikan karakter huruf besar jika Kapitalisasi yang sama dipilih di Pengaturan.


Istilah ekspresi reguler dapat digabungkan untuk membentuk ekspresi reguler yang kompleks dan canggih untuk penelusuran seperti ditampilkan dalam contoh berikut.

Contoh

Ekspresi

Arti

^$

Sebuah paragraf kosong.

^ menentukan bahwa kecocokan harus di awal paragraf,

$ menentukan bahwa tanda paragraf atau akhir sel harus mengikuti string yang cocok.

^.

Karakter pertama paragraf.

^ menentukan bahwa kecocokan harus di awal paragraf,

. menentukan sebarang karakter tunggal.

e([:digit:])?

Cocok dengan "e" sendiri atau "e" diikuti oleh satu digit.

e menentukan karakter "e",

[:digit:] menentukan angka desimal,

? menentukan nol atau satu kemunculan [:digit:].

^([:digit:])$

Cocok dengan sebuah paragraf atau sel yang berisi tepat satu digit.

^ menentukan bahwa kecocokan harus di awal paragraf,

[:digit:] menentukan angka desimal,

$ menentukan bahwa tanda paragraf atau akhir sel harus mengikuti string yang cocok.

^[:digit:]{3}$

Cocok dengan sebuah paragraf atau sel yang hanya berisi angka tiga digit

^ menentukan bahwa kecocokan harus di awal paragraf,

[:digit:] menentukan angka desimal,

{3} menentukan bahwa [:digit:] harus muncul tiga kali,

$ menentukan bahwa tanda paragraf atau akhir sel harus mengikuti string yang cocok.

\bconst(itu|ruc)tion\b

Cocok dengan kata "constitution" dan "construction" tapi tidak untuk kata "constitutional."

\b menentukan bahwa kecocokan harus dimulai pada batas kata,

const menentukan karakter "const",

( memulai grup,

itu menentukan karakter "itu",

| menentukan alternatif,

ruc menentukan karakter "ruc",

) mengakhiri grup,

tion menetapkan karakter "tion",

\b menentukan bahwa kecocokan harus diakhiri pada batas kata.


Mohon dukung kami!