Reguliariųjų reiškinių sąrašas

Pakaitos simboliai

Reikšmė ir naudojimas

Bet kuris rašmuo

The given character, unless it is a regular expression meta character. The list of meta characters follows in this table.

.

Bet koks vienas rašmuo neskaitant eilutės ar pastraipos lūžių. Pavyzdžiui, paieškos reiškinys „la.as“ atitiks žodžius „lapas“ ir „lakas“.

^

Pastraipos arba langelio pradžia. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pradžioje yra nepaisoma. Pavyzdys: reiškinys „^Jonas“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus pirmasis pastraipos žodis.

$

Pastraipos arba langelio pabaiga. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pabaigoje yra nepaisoma. Pavyzdys: reiškinys „Jonas$“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus paskutinis pastraipos žodis. Po žodžio „Jonas“ neturi būti taško.

Atskirai ženklas $ reiškia pastraipos pabaigą. Šitaip galima ieškoti pastraipos lūžių ir juos pakeisti.

*

Jokio, vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „Ab*c“ atitiks rašmenų sekas „Ac“, „Abc“, „Abbc“, „Abbbc“ ir t. t.

+

Vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „AX.+4“ atitiks rašmenų seką „AXx4“, bet ne „AX4“.

Šiuo būdu visada randama ilgiausia įmanoma reguliarųjį reiškinį atitinkanti rašmenų seka pastraipoje. Jei pastraipoje būtų seka „AX 4 AX4“, ji visa būtų pažymėta kaip radinys.

?

Jokio arba vienas reguliariojo reiškinio rašmuo, esantis prieš šį ženklą. Pavyzdžiui, reiškinys „Bala?“ atitiks žodžius „Bala“ ir „Balas“, o „x(ab|c)?y“ atitiks sekas „xy“, „xaby“ ar „xcy“.

\

Specialusis rašmuo, esantis po šio ženklo, laikomas įprastu rašmeniu, o ne reguliariojo reiškinio metarašmeniu (išskyrus kombinacijas „\n“, „\t“, „\b“, „\>“ ir „\<“). Pavyzdžiui, reiškinys „bala\.“ atitiks seką „bala.“, bet ne „balas“ ar „balai“.

\n

When entered in the Find text box, finds a line break that was inserted with the Shift+Enter key combination in Writer, or the Ctrl+Enter key combination in a Calc cell.

When entered in the Replace text box in Writer, inserts a paragraph break that can be inserted with the Enter or Return key. It has no special meaning in Calc, and is treated literally there.

To change line breaks into paragraph breaks in Writer, enter \n in both the Find and Replace boxes, and then perform a search and replace.

\t

Tabuliavimo ženklas. Galima naudoti ir laukelyje Kuo pakeisti.

\b

Žodžio riba. Pavyzdžiui, reiškinys „\btara“ atitiks žodžius „taranas“ ir „tara“, bet ne „gitara“; o „tara\b“ atitiks žodžius „gitara“ ir „tara“, bet ne „taranas“.

Šis pakaitos simbolis pakeičia pasenusius (nors vis dar veikiančius) simbolius „\>“ (žymi žodžio pabaigą) ir „\<“ (žymi žodžio pradžią).

^$

Ieškoma tuščios pastraipos.

^.

Ieškoma pirmojo pastraipos rašmens.

& arba $0

Tekstas, įvestas kaip ieškinys laukelyje Ko ieškoti, pridedamas prie teksto, nurodyto laukelyje Kuo pakeisti, dokumento tekste atliekant keitimus.

Pavyzdžiui, jei laukelyje Ko ieškoti įvesite žodį „saitas“, o laukelyje Kuo pakeisti – „hiper&“, dokumento tekste žodis „saitas“ bus pakeistas žodžiu „hipersaitas“.

Laukelyje Kuo pakeisti įvedus „&“ taip pat galima pakeisti radinių požymius ar formatą.

[...]

Bet kuris vienas rašmuo iš išvardintų tarp laužtinių skliaustų. Pavyzdžiui, reiškinys „[abc123]“ atitiks rašmenis „a“, „b“, „c“, „1“, „2“ ir „3“. „[a-e]“ atitiks raides nuo „a“ iki „e“ imtinai (rėžis aprašomas pradedant nuo rašmens, kurio unikodo kodas yra mažiausias). Reiškinys „[a-eh-p]“ atitiks raides, esančias rėžiuose nuo „a“ iki „e“ ir nuo „h“ iki „p“.

[^...]

Bet kuris vienas rašmuo, įskaitant tabuliavimo ženklą, tarpą ir eilutės lūžį, kurio nėra išvardintų rašmenų rėžiuose. Pavyzdžiui, reiškinys „[^a-mvz]“ atitiks visus rašmenis, kurių nėra rėžyje nuo „a“ iki „m“ imtinai ir kurie nėra raidės „v“ ar „z“.

\uXXXX

\UXXXXXXXX

Rašmuo, žymimas keturženkliu šešioliktainiu unikodo kodu (XXXX).

Rašmuo, žymimas aštuonženkliu šešioliktainiu unikodo kodu (XXXXXXXX).

note

For certain symbol fonts the symbol (glyph) that you see on screen may look related to a different Unicode code than what is actually used for it in the font. The Unicode codes can be viewed by choosing Insert - Special Character, or by using Unicode conversion shortcut.


\N{UNICODE CHARACTER NAME}

Match the Unicode named character.

Some remarkable Unicode named characters are SPACE, NO-BREAK SPACE, SOFT HYPHEN, ACUTE ACCENT, CIRCUMFLEX ACCENT, GRAVE ACCENT.

note

The Unicode character names can be searched and viewed by choosing Insert - Special Character.


|

Operacijos ženklas alternatyvoms nurodyti. Atitinka žodį, esantį prieš ženklą „|“, arba žodį po jo. Pavyzdžiui, reiškinys „šis|šio“ atitiks žodžius „šis“ ir „šio“.

{N}

Operacijos ženklas, rodantis rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių kartų. Pavyzdžiui, reiškinys „tre{2}“ atitiks žodį „tree“.

{N,M}

The post-fix repetition operator that specifies a range (minimum of "N" to a maximum of "M") of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. For example, "tre{1,2}" matches "tre" and "tree".

{N,}

Operacijos ženklas, rodantis mažiausią rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių arba daugiau kartų (didžiausią pasikartojimų skaičių riboja tik dokumento dydis). Pavyzdžiui, reiškinys „tre{2,}“ atitiks žodžius „tree“ , „treee“ ir „treeeee“.

(...)

Grupavimo ženklai, naudojami trimis atvejais.

  1. Alternatyvoms su ženklu „|“ grupuoti. Pavyzdžiui, reiškinys „n(or|ag)as“ atitiks žodžius „noras“ ir „nagas“.

  2. Simboliams sudėtiniuose reguliariuosiuose reiškiniuose, kuriuose dar naudojami ir operacijų ženklai „*“, „+“, ar „?“, taip pat pasikartojimų skaičiaus operacijų ženklai, grupuoti. Pavyzdžiui, reguliarusis reiškinys „a(bc)?d“ atitiks rašmenų sekas „ad“ ir „abcd“. Reguliarusis reiškinys „M(is){2}ipė“ atitiks žodį „Misisipė“.

  3. To record the matched sub string inside the parentheses as a reference for later use in the Find box using the "\n" construct or in the Replace box using the "$n" construct. The reference to the first match is represented by "\1" in the Find box and by "$1" in the Replace box. The reference to the second matched sub string by "\2" and "$2" respectively, and so on.

Pavyzdžiui, reguliarusis reiškinys „(890)7\1\1“ atitiks seką „8907890890“.

Jei laukelyje Ko ieškoti įvesite reguliarųjį reiškinį „\b(fruit|truth)\b“, o laukelyje Kuo pakeisti – „$1ful“, angliški žodžiai „fruit“ ir „truth“ bus pakeisti žodžiais „fruitful“ ir „truthful“, tačiau žodžiai „fruitfully“ ir „truthfully“ liks kokie buvę.

[:alpha:]

Represents an alphabetic character. Use [:alpha:] to find one of them.

[:digit:]

Represents a decimal digit. Use [:digit:] to find one of them.

[:alnum:]

Žymi raidę arba skaičių ([:alpha:] ir [:digit:]).

[:space:]

Žymi tarpą, išgautą tarpo ženklu (bet ne kitokiais tarpą įterpiančiais ženklais).

[:print:]

Žymi spausdinamą rašmenį.

[:cntrl:]

Žymi nespausdinamą rašmenį.

[:lower:]

Žymi mažąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.

[:upper:]

Žymi didžiąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.


note

For a full list of supported metacharacters and syntax, see ICU Regular Expressions documentation


Iš kelių pakaitos simbolių galima sudaryti sudėtingus reguliariuosius reiškinius frazių paieškai. Žemiau pateikiama keletas tokių reiškinių pavyzdžių.

Pavyzdžiai

Reiškinys

Reikšmė

^$

Tuščia pastraipa.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^.

Pirmasis pastraipos rašmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas . reiškia bet kokį vieną rašmenį.

e([:digit:])?

Viena raidė „e“, arba raidė „e“ su vienu skaitmeniu po jos.

e reiškia raidę „e“,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

? reiškia jokio arba vieną skaitmenį [:digit:].

^([:digit:])$

Žymi pastraipą ar langelius, kuriuose yra lygiai vienas skaitmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^[:digit:]{3}$

Žymi pastraipą arba langelį, kuriame yra tik trys skaitmenys.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

{3} reiškia, kad skaitmenys [:digit:] turi būti trys,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

\bconst(itu|ruc)tion\b

Atitinka angliškus žodžius „constitution“ ir „construction“, bet ne „constitutional“.

\b reiškia, kad ieškoma seka šiuo atveju turi būti žodžio pradžioje,

const reiškia raidžių seką „const“,

skliaustu ( pradedama grupė,

itu reiškia raidžių seką „itu“,

ženklas | žymi alternatyvą,

ruc reiškia raidžių seką „ruc“,

skliaustu ) baigiama grupė,

tion reiškia raidžių seką „tion“,

\b specifies that the match must end at a word boundary.


Paremkite mus!