Reguliariųjų reiškinių sąrašas

Pakaitos simboliai

Reikšmė ir naudojimas

Bet kuris rašmuo

The given character, unless it is a regular expression meta character. The list of meta characters follows in this table.

.

Bet koks vienas rašmuo neskaitant eilutės ar pastraipos lūžių. Pavyzdžiui, paieškos reiškinys „la.as“ atitiks žodžius „lapas“ ir „lakas“.

^

Pastraipos arba langelio pradžia. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pradžioje yra nepaisoma. Pavyzdys: reiškinys „^Jonas“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus pirmasis pastraipos žodis.

$

Pastraipos arba langelio pabaiga. Specialiųjų objektų, pavyzdžiui, tuščių laukų ar prie rašmens pririštų kadrų, pastraipos pabaigoje yra nepaisoma. Pavyzdys: reiškinys „Jonas$“ atitiks žodį „Jonas“ tik tuomet, kai šis žodis bus paskutinis pastraipos žodis. Po žodžio „Jonas“ neturi būti taško.

Atskirai ženklas $ reiškia pastraipos pabaigą. Šitaip galima ieškoti pastraipos lūžių ir juos pakeisti.

*

Jokio, vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „Ab*c“ atitiks rašmenų sekas „Ac“, „Abc“, „Abbc“, „Abbbc“ ir t. t.

+

Vienas ar daugiau reguliariojo reiškinio rašmenų, esančių prieš šį ženklą. Pavyzdžiui, reiškinys „AX.+4“ atitiks rašmenų seką „AXx4“, bet ne „AX4“.

Šiuo būdu visada randama ilgiausia įmanoma reguliarųjį reiškinį atitinkanti rašmenų seka pastraipoje. Jei pastraipoje būtų seka „AX 4 AX4“, ji visa būtų pažymėta kaip radinys.

?

Jokio arba vienas reguliariojo reiškinio rašmuo, esantis prieš šį ženklą. Pavyzdžiui, reiškinys „Bala?“ atitiks žodžius „Bala“ ir „Balas“, o „x(ab|c)?y“ atitiks sekas „xy“, „xaby“ ar „xcy“.

\

Specialusis rašmuo, esantis po šio ženklo, laikomas įprastu rašmeniu, o ne reguliariojo reiškinio metarašmeniu (išskyrus kombinacijas „\n“, „\t“, „\b“, „\>“ ir „\<“). Pavyzdžiui, reiškinys „bala\.“ atitiks seką „bala.“, bet ne „balas“ ar „balai“.

\n

Eilutės lūžis, laukelyje Ko ieškoti įterptas klavišų kombinacija Lyg2+Įvesti.

A paragraph break that can be entered with the Enter or Return key when in the Replace text box in Writer. Has no special meaning in Calc, and is treated literally there.

Jei norite eilutės lūžius pakeisti pastraipos lūžiais, abiejuose laukeliuose, Ko ieškoti ir Kuo pakeisti, įveskite „\n“ ir atlikite paieškos ir keitimo operaciją.

\t

Tabuliavimo ženklas. Galima naudoti ir laukelyje Kuo pakeisti.

\b

Žodžio riba. Pavyzdžiui, reiškinys „\btara“ atitiks žodžius „taranas“ ir „tara“, bet ne „gitara“; o „tara\b“ atitiks žodžius „gitara“ ir „tara“, bet ne „taranas“.

Šis pakaitos simbolis pakeičia pasenusius (nors vis dar veikiančius) simbolius „\>“ (žymi žodžio pabaigą) ir „\<“ (žymi žodžio pradžią).

^$

Ieškoma tuščios pastraipos.

^.

Ieškoma pirmojo pastraipos rašmens.

& arba $0

Tekstas, įvestas kaip ieškinys laukelyje Ko ieškoti, pridedamas prie teksto, nurodyto laukelyje Kuo pakeisti, dokumento tekste atliekant keitimus.

Pavyzdžiui, jei laukelyje Ko ieškoti įvesite žodį „saitas“, o laukelyje Kuo pakeisti – „hiper&“, dokumento tekste žodis „saitas“ bus pakeistas žodžiu „hipersaitas“.

Laukelyje Kuo pakeisti įvedus „&“ taip pat galima pakeisti radinių požymius ar formatą.

[...]

Bet kuris vienas rašmuo iš išvardintų tarp laužtinių skliaustų. Pavyzdžiui, reiškinys „[abc123]“ atitiks rašmenis „a“, „b“, „c“, „1“, „2“ ir „3“. „[a-e]“ atitiks raides nuo „a“ iki „e“ imtinai (rėžis aprašomas pradedant nuo rašmens, kurio unikodo kodas yra mažiausias). Reiškinys „[a-eh-p]“ atitiks raides, esančias rėžiuose nuo „a“ iki „e“ ir nuo „h“ iki „p“.

[^...]

Bet kuris vienas rašmuo, įskaitant tabuliavimo ženklą, tarpą ir eilutės lūžį, kurio nėra išvardintų rašmenų rėžiuose. Pavyzdžiui, reiškinys „[^a-mvz]“ atitiks visus rašmenis, kurių nėra rėžyje nuo „a“ iki „m“ imtinai ir kurie nėra raidės „v“ ar „z“.

\uXXXX

\UXXXXXXXX

Rašmuo, žymimas keturženkliu šešioliktainiu unikodo kodu (XXXX).

Rašmuo, žymimas aštuonženkliu šešioliktainiu unikodo kodu (XXXXXXXX).

Kai kuriuose simbolių šriftuose esančių specialiųjų rašmenų unikodo kodas gali priklausyti nuo naudojamo šrifto. Unikodo kodus galima sužinoti lange Įterpimas → Specialieji rašmenys.

|

Operacijos ženklas alternatyvoms nurodyti. Atitinka žodį, esantį prieš ženklą „|“, arba žodį po jo. Pavyzdžiui, reiškinys „šis|šio“ atitiks žodžius „šis“ ir „šio“.

{N}

Operacijos ženklas, rodantis rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių kartų. Pavyzdžiui, reiškinys „tre{2}“ atitiks žodį „tree“.

{N,M}

The post-fix repetition operator that specifies a range (minimum of "N" to a maximum of "M") of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. For example, "tre{1,2}" matches "tre" and "tree".

{N,}

Operacijos ženklas, rodantis mažiausią rašmens pasikartojimų paeiliui skaičių (N). Rašmuo, esantis prieš ženklą, turi kartotis nurodytą skaičių arba daugiau kartų (didžiausią pasikartojimų skaičių riboja tik dokumento dydis). Pavyzdžiui, reiškinys „tre{2,}“ atitiks žodžius „tree“ , „treee“ ir „treeeee“.

(...)

Grupavimo ženklai, naudojami trimis atvejais.

  1. Alternatyvoms su ženklu „|“ grupuoti. Pavyzdžiui, reiškinys „n(or|ag)as“ atitiks žodžius „noras“ ir „nagas“.

  2. Simboliams sudėtiniuose reguliariuosiuose reiškiniuose, kuriuose dar naudojami ir operacijų ženklai „*“, „+“, ar „?“, taip pat pasikartojimų skaičiaus operacijų ženklai, grupuoti. Pavyzdžiui, reguliarusis reiškinys „a(bc)?d“ atitiks rašmenų sekas „ad“ ir „abcd“. Reguliarusis reiškinys „M(is){2}ipė“ atitiks žodį „Misisipė“.

  3. To record the matched sub string inside the parentheses as a reference for later use in the Find box using the "\n" construct or in the Replace box using the "$n" construct. The reference to the first match is represented by "\1" in the Find box and by "$1" in the Replace box. The reference to the second matched sub string by "\2" and "$2" respectively, and so on.

Pavyzdžiui, reguliarusis reiškinys „(890)7\1\1“ atitiks seką „8907890890“.

Jei laukelyje Ko ieškoti įvesite reguliarųjį reiškinį „\b(fruit|truth)\b“, o laukelyje Kuo pakeisti – „$1ful“, angliški žodžiai „fruit“ ir „truth“ bus pakeisti žodžiais „fruitful“ ir „truthful“, tačiau žodžiai „fruitfully“ ir „truthfully“ liks kokie buvę.

[:alpha:]

Žymi abėcėlės raidę. Naudokite [:alpha:]+ vienai iš jų rasti.

[:digit:]

Žymi dešimtainį skaitmenį. Naudokite [:digit:]+ vienam iš jų rasti.

[:alnum:]

Žymi raidę arba skaičių ([:alpha:] ir [:digit:]).

[:space:]

Žymi tarpą, išgautą tarpo ženklu (bet ne kitokiais tarpą įterpiančiais ženklais).

[:print:]

Žymi spausdinamą rašmenį.

[:cntrl:]

Žymi nespausdinamą rašmenį.

[:lower:]

Žymi mažąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.

[:upper:]

Žymi didžiąją raidę, kai įgalinta parinktis Skirti didžiąsias ir mažąsias raides.


Visą galimų metarašmenų sąrašą ir naudotiną sintaksę galima peržiūrėti ICU reguliariųjų reiškinių dokumentacijoje.

Lentelės pabaigoje išvardinti pakaitos simboliai nuo [:alpha:] iki [:upper:] reguliariajame reiškinyje turi būti rašomi skliaustuose. Žr. pavyzdžius žemiau.

Iš kelių pakaitos simbolių galima sudaryti sudėtingus reguliariuosius reiškinius frazių paieškai. Žemiau pateikiama keletas tokių reiškinių pavyzdžių.

Pavyzdžiai

Reiškinys

Reikšmė

^$

Tuščia pastraipa.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^.

Pirmasis pastraipos rašmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

ženklas . reiškia bet kokį vieną rašmenį.

e([:digit:])?

Viena raidė „e“, arba raidė „e“ su vienu skaitmeniu po jos.

e reiškia raidę „e“,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

? reiškia jokio arba vieną skaitmenį [:digit:].

^([:digit:])$

Žymi pastraipą ar langelius, kuriuose yra lygiai vienas skaitmuo.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

^[:digit:]{3}$

Žymi pastraipą arba langelį, kuriame yra tik trys skaitmenys.

Ženklas ^ reiškia, kad ieškoma seka turi būti pastraipos pradžioje,

[:digit:] reiškia bet kokį dešimtainį skaitmenį,

{3} reiškia, kad skaitmenys [:digit:] turi būti trys,

ženklas $ reiškia, kad iškart po ieškomos sekos turi būti pastraipos ženklas arba langelio pabaiga.

\bconst(itu|ruc)tion\b

Atitinka angliškus žodžius „constitution“ ir „construction“, bet ne „constitutional“.

\b reiškia, kad ieškoma seka šiuo atveju turi būti žodžio pradžioje,

const reiškia raidžių seką „const“,

skliaustu ( pradedama grupė,

itu reiškia raidžių seką „itu“,

ženklas | žymi alternatyvą,

ruc reiškia raidžių seką „ruc“,

skliaustu ) baigiama grupė,

tion reiškia raidžių seką „tion“,

\b specifies that the match must end at a word boundary.


Paremkite mus!