Reguliariųjų reiškinių sąrašas

note

For a full list of supported metacharacters and syntax, see ICU Regular Expressions documentation


Pakaitos simboliai

Reikšmė ir naudojimas

Bet kuris rašmuo

The given character, unless it is a regular expression meta character. The list of meta characters follows in this table.

.

Bet koks vienas rašmuo neskaitant eilutės ar pastraipos lūžių. Pavyzdžiui, paieškos reiškinys „la.as“ atitiks žodžius „lapas“ ir „lakas“.

^

Pastraipos arba langelio pradžia. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pradžioje yra nepaisoma. Pavyzdys: reiškinys „^Jonas“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus pirmasis pastraipos žodis.

$

Pastraipos arba langelio pabaiga. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pabaigoje yra nepaisoma. Pavyzdys: reiškinys „Jonas$“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus paskutinis pastraipos žodis. Po žodžio „Jonas“ neturi būti taško.

Atskirai ženklas $ reiškia pastraipos pabaigą. Šitaip galima ieškoti pastraipos lūžių ir juos pakeisti.

*

Jokio, vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „Ab*c“ atitiks rašmenų sekas „Ac“, „Abc“, „Abbc“, „Abbbc“ ir t. t.

+

Vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „AX.+4“ atitiks rašmenų seką „AXx4“, bet ne „AX4“.

Šiuo būdu visada randama ilgiausia įmanoma reguliarųjį reiškinį atitinkanti rašmenų seka pastraipoje. Jei pastraipoje būtų seka „AX 4 AX4“, ji visa būtų pažymėta kaip radinys.

?

Jokio arba vienas reguliariojo reiškinio rašmuo, esantis prieš šį ženklą. Pavyzdžiui, reiškinys „Bala?“ atitiks žodžius „Bala“ ir „Balas“, o „x(ab|c)?y“ atitiks sekas „xy“, „xaby“ ar „xcy“.

\

Specialusis rašmuo, esantis po šio ženklo, laikomas įprastu rašmeniu, o ne reguliariojo reiškinio metarašmeniu (išskyrus kombinacijas „\n“, „\t“, „\b“, „\>“ ir „\<“). Pavyzdžiui, reiškinys „bala\.“ atitiks seką „bala.“, bet ne „balas“ ar „balai“.

\n

When entered in the Find text box, finds a line break that was inserted with the Shift+Enter key combination in Writer, or the Ctrl+Enter key combination in a Calc cell.

When entered in the Replace text box in Writer, inserts a paragraph break that can be inserted with the Enter or Return key. It has no special meaning in Calc, and is treated literally there.

To change line breaks into paragraph breaks in Writer, enter \n in both the Find and Replace boxes, and then perform a search and replace.

\t

Tabuliavimo ženklas. Galima naudoti ir laukelyje Kuo pakeisti.

\b

Žodžio riba. Pavyzdžiui, reiškinys „\btara“ atitiks žodžius „taranas“ ir „tara“, bet ne „gitara“; o „tara\b“ atitiks žodžius „gitara“ ir „tara“, bet ne „taranas“.

Šis pakaitos simbolis pakeičia pasenusius (nors vis dar veikiančius) simbolius „\>“ (žymi žodžio pabaigą) ir „\<“ (žymi žodžio pradžią).

\w

Match a word character.

\W

Match a non-word character.

^$

Ieškoma tuščios pastraipos.

^.

Ieškoma pirmojo pastraipos rašmens.

& arba $0

Tekstas, įvestas kaip ieškinys laukelyje Ko ieškoti, pridedamas prie teksto, nurodyto laukelyje Kuo pakeisti, dokumento tekste atliekant keitimus.

Pavyzdžiui, jei laukelyje Ko ieškoti įvesite žodį „saitas“, o laukelyje Kuo pakeisti – „hiper&“, dokumento tekste žodis „saitas“ bus pakeistas žodžiu „hipersaitas“.

Laukelyje Kuo pakeisti įvedus „&“ taip pat galima pakeisti radinių požymius ar formatą.

[...]

Bet kuris vienas rašmuo iš išvardintų tarp laužtinių skliaustų. Pavyzdžiui, reiškinys „[abc123]“ atitiks rašmenis „a“, „b“, „c“, „1“, „2“ ir „3“. „[a-e]“ atitiks raides nuo „a“ iki „e“ imtinai (rėžis aprašomas pradedant nuo rašmens, kurio unikodo kodas yra mažiausias). Reiškinys „[a-eh-p]“ atitiks raides, esančias rėžiuose nuo „a“ iki „e“ ir nuo „h“ iki „p“.

[^...]

Bet kuris vienas rašmuo, įskaitant tabuliavimo ženklą, tarpą ir eilutės lūžį, kurio nėra išvardintų rašmenų rėžiuose. Pavyzdžiui, reiškinys „[^a-mvz]“ atitiks visus rašmenis, kurių nėra rėžyje nuo „a“ iki „m“ imtinai ir kurie nėra raidės „v“ ar „z“.

\uXXXX

\UXXXXXXXX

Rašmuo, žymimas keturženkliu šešioliktainiu unikodo kodu (XXXX).

Rašmuo, žymimas aštuonženkliu šešioliktainiu unikodo kodu (XXXXXXXX).

note

For certain symbol fonts the symbol (glyph) that you see on screen may look related to a different Unicode code than what is actually used for it in the font. The Unicode codes can be viewed by choosing Insert - Special Character, or by using Unicode conversion shortcut.


\N{UNICODE CHARACTER NAME}

Match the Unicode named character.

Some remarkable Unicode named characters are SPACE, NO-BREAK SPACE, SOFT HYPHEN, ACUTE ACCENT, CIRCUMFLEX ACCENT, GRAVE ACCENT.

note

The Unicode character names can be searched and viewed by choosing Insert - Special Character.


|

Operacijos ženklas alternatyvoms nurodyti. Atitinka žodį, esantį prieš ženklą „|“, arba žodį po jo. Pavyzdžiui, reiškinys „šis|šio“ atitiks žodžius „šis“ ir „šio“.

{N}

Operacijos ženklas, rodantis rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių kartų. Pavyzdžiui, reiškinys „tre{2}“ atitiks žodį „tree“.

{N,M}

The post-fix repetition operator that specifies a range (minimum of "N" to a maximum of "M") of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. For example, "tre{1,2}" matches "tre" and "tree".

{N,}

Operacijos ženklas, rodantis mažiausią rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių arba daugiau kartų (didžiausią pasikartojimų skaičių riboja tik dokumento dydis). Pavyzdžiui, reiškinys „tre{2,}“ atitiks žodžius „tree“ , „treee“ ir „treeeee“.

(...)

Grupavimo ženklai, naudojami trimis atvejais.

  1. Alternatyvoms su ženklu „|“ grupuoti. Pavyzdžiui, reiškinys „n(or|ag)as“ atitiks žodžius „noras“ ir „nagas“.

  2. To group terms in a complex expression to be operated on by the post-fix operators: "*", "+" and "?" along with the post-fix repetition operators. For example, the regular expression "a(bc)?d" matches both "ad" and "abcd"; "M(iss){2}ippi" matches "Mississippi".

  3. To reference the matched sub string inside the parentheses for later use. The "\N" construct is used in the Find box, the "$N" construct is used in the Replace box. "N" being a digit, the reference to the first match is represented by "\1" in the Find box and by "$1" in the Replace box; "\2" and "$2" reference to the second matched, and so on.

For example, the regular expression "(890)xy\1z\1" matches "890xy890z890".

With the regular expression "(fruit|truth)\b" in the Find box, and the replacement expression "$1ful" in the Replace box, occurrences of "fruit" and "truth" are replaced with "fruitful" and "truthful" respectively. Note: "\b" prevents "fruitfully" or "truthfully" from matching.

[:alpha:]

Represents an alphabetic character. Use [:alpha:] to find one of them.

\d

[:digit:]

Represents a decimal digit. Use [:digit:] to find one of them.

[:alnum:]

Žymi raidę arba skaičių ([:alpha:] ir [:digit:]).

\s

[:space:]

Žymi tarpą, išgautą tarpo ženklu (bet ne kitokiais tarpą įterpiančiais ženklais).

[:print:]

Žymi spausdinamą rašmenį.

[:cntrl:]

Žymi nespausdinamą rašmenį.

[:lower:]

Žymi mažąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.

[:upper:]

Žymi didžiąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.


Iš kelių pakaitos simbolių galima sudaryti sudėtingus reguliariuosius reiškinius frazių paieškai. Žemiau pateikiama keletas tokių reiškinių pavyzdžių.

Pavyzdžiai

Reiškinys

Reikšmė

^$

Tuščia pastraipa.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^.

Pirmasis pastraipos rašmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas . reiškia bet kokį vieną rašmenį.

e([:digit:])?

Viena raidė „e“, arba raidė „e“ su vienu skaitmeniu po jos.

e reiškia raidę „e“,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

? reiškia jokio arba vieną skaitmenį [:digit:].

^([:digit:])$

Žymi pastraipą ar langelius, kuriuose yra lygiai vienas skaitmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^[:digit:]{3}$

Žymi pastraipą arba langelį, kuriame yra tik trys skaitmenys.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

{3} reiškia, kad skaitmenys [:digit:] turi būti trys,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

\bconst(itu|ruc)tion\b

Atitinka angliškus žodžius „constitution“ ir „construction“, bet ne „constitutional“.

\b reiškia, kad ieškoma seka šiuo atveju turi būti žodžio pradžioje,

const reiškia raidžių seką „const“,

skliaustu ( pradedama grupė,

itu reiškia raidžių seką „itu“,

ženklas | žymi alternatyvą,

ruc reiškia raidžių seką „ruc“,

skliaustu ) baigiama grupė,

tion reiškia raidžių seką „tion“,

\b specifies that the match must end at a word boundary.


Paremkite mus!