Listahan ng mga Regular na Ekspresyon

note

Para sa buong listahan ng mga sinusuportahang metacharacter at syntax, tingnan Dokumentasyon ng ICU Regular Expressions


Termino

Representasyon/Paggamit

Kahit anong karakter

Ang ibinigay na character, maliban kung ito ay isang regular na expression na meta character. Ang listahan ng mga meta character ay sumusunod sa talahanayang ito.

.

Anumang solong character maliban sa isang line break o isang paragraph break. Halimbawa, ang termino para sa paghahanap na "sh.rt" ay tumutugma sa parehong "shirt" at "maikli".

^

Ang simula ng isang talata o cell. Ang mga espesyal na bagay tulad ng mga walang laman na field o mga frame na naka-angkla ng character, sa simula ng isang talata ay binabalewala. Halimbawa: Ang "^Peter" ay tumutugma sa salitang "Peter" kapag ito ang unang salita ng isang talata.

$

Ang dulo ng isang talata o cell. Ang mga espesyal na bagay tulad ng mga walang laman na field o mga frame na naka-angkla ng character sa dulo ng isang talata ay binabalewala. Halimbawa: Ang "Peter$" ay tumutugma lamang kapag ang salitang "Peter" ay ang huling salita ng isang talata, tandaan ang "Peter" ay hindi maaaring sundan ng isang tuldok.

$ sa sarili nitong tumutugma sa dulo ng isang talata. Sa ganitong paraan posible na maghanap at palitan ang mga break ng talata.

*

Zero o higit pa sa termino ng regular na expression kaagad na nauuna dito. Halimbawa, ang "Ab*c" ay tumutugma sa "Ac", "Abc", "Abbc", "Abbbc", at iba pa.

+

Isa o higit pa sa termino ng regular na expression na kaagad na nauuna dito. Halimbawa, hinahanap ng "AX.+4" ang "AXx4", ngunit hindi ang "AX4."

Ang pinakamahabang posibleng string na tumutugma sa regular na expression na ito sa isang talata ay palaging tumutugma. Kung ang talata ay naglalaman ng string na "AX 4 AX4", ang buong sipi ay naka-highlight.

?

Zero o isa sa mga termino ng regular na expression kaagad na nauuna dito. Halimbawa, "Mga Teksto?" tumutugma sa "Text" at "Texts" at "x(ab|c)?y" finds "xy", "xaby", o "xcy".

\

Ang espesyal na karakter na kasunod nito ay binibigyang kahulugan bilang isang normal na karakter at hindi bilang isang regular na expression na meta character (maliban sa mga kumbinasyong "\n", "\t", "\b", "\>" at "\<") . Halimbawa, "puno\." tumutugma sa "puno.", hindi "puno" o "puno".

\n

Nang pumasok sa Hanapin text box, nakahanap ng line break na inilagay kasama ng Shift+Enter key combination sa Writer, o ang Ctrl+Enter kumbinasyon ng key sa isang Calc cell.

Nang pumasok sa Palitan text box sa Writer, naglalagay ng pahinga sa talata na maaaring ipasok sa Pumasok o Bumalik susi. Wala itong espesyal na kahulugan sa Calc, at literal na tinatrato doon.

Upang baguhin ang mga line break sa paragraph break sa Writer, ilagay ang \n sa parehong Hanapin at Palitan mga kahon, at pagkatapos ay magsagawa ng paghahanap at pagpapalit.

\t

Isang character sa tab. Maaari ding gamitin sa Palitan kahon.

\b

Isang salitang hangganan. Halimbawa, ang "\bbook" ay tumutugma sa "bookmark" at "book" ngunit hindi sa "checkbook" samantalang ang "book\b" ay tumutugma sa "checkbook" at "book" ngunit hindi sa "bookmark."

Tandaan, pinapalitan ng form na ito ang hindi na ginagamit (bagaman gumagana pa rin ang mga ito sa ngayon) na mga form na "\>" (tugma sa dulo ng salita) at "\<" (tugma sa simula ng salita).

\w

Itugma ang isang character na salita.

\W

Itugma ang isang hindi salita na karakter.

^$

Nakahanap ng walang laman na talata.

^.

Hinahanap ang unang karakter ng isang talata.

at o $0

Idinaragdag ang string na natagpuan ng pamantayan sa paghahanap sa Hanapin kahon sa termino sa Palitan kahon kapag gumawa ka ng kapalit.

Halimbawa, kung ipinasok mo ang &quot;window&quot; sa Hanapin kahon at &quot;&amp;frame&quot; sa Palitan box, ang salitang &quot;window&quot; ay pinalitan ng &quot;windowframe&quot;.

Maaari ka ring maglagay ng &quot;&amp;&quot; sa Palitan kahon upang baguhin ang Mga Katangian o ang Format ng string na natagpuan ng pamantayan sa paghahanap.

[...]

Anumang solong paglitaw ng alinman sa mga character na nasa pagitan ng mga bracket. Halimbawa: "[abc123]" ay tumutugma sa mga character na 'a', 'b', 'c', '1', '2' at '3'. Ang "[a-e]" ay tumutugma sa mga solong paglitaw ng mga character a hanggang e, kasama (dapat tukuyin ang hanay kasama ang character na may pinakamaliit na Unicode code number muna). Ang "[a-eh-x]" ay tumutugma sa anumang solong paglitaw ng mga character na nasa hanay na 'a' hanggang 'e' at 'h' hanggang 'x'.

[^...]

Pinahihintulutan ang anumang solong paglitaw ng isang character, kabilang ang Tab, Space at Line Break na mga character, na wala sa listahan ng mga character na tinukoy na inclusive range. Halimbawa, ang "[^a-syz]" ay tumutugma sa lahat ng character na wala sa inclusive range na 'a' hanggang 's' o ang mga character na 'y' at 'z'.

\uXXXX

\UXXXXXXXX

Ang character na kinakatawan ng apat na digit na hexadecimal Unicode code (XXXX).

Ang character na kinakatawan ng walong digit na hexadecimal Unicode code (XXXXXXXXX).

note

Para sa ilang partikular na mga font ng simbolo, ang simbolo (glyph) na nakikita mo sa screen ay maaaring mukhang nauugnay sa ibang Unicode code kaysa sa aktwal na ginagamit para dito sa font. Ang mga Unicode code ay maaaring matingnan sa pamamagitan ng pagpili Insert - Espesyal na Tauhan , o sa pamamagitan ng paggamit Shortcut sa conversion ng Unicode .


\N{UNICODE CHARACTER NAME}

Itugma ang Unicode na pinangalanang character.

Ang ilang mga kahanga-hangang Unicode na pinangalanang mga character ay SPACE , NO-BREAK SPACE , SOFT HYPHEN , ACUTE ACCENT , CIRCUMFLEX ACCENT , GRAVE ACCENT .

note

Ang mga pangalan ng karakter ng Unicode ay maaaring hanapin at tingnan sa pamamagitan ng pagpili Insert - Espesyal na Tauhan .


|

Ang infix operator na nagtatanggal ng mga alternatibo. Tumutugma sa terminong nauuna sa "|" o ang terminong sumusunod sa "|". Halimbawa, ang "ito|iyon" ay tumutugma sa mga paglitaw ng parehong "ito" at "iyan".

{N}

Ang post-fix repetition operator na tumutukoy ng eksaktong bilang ng mga paglitaw ("N") ng regular na termino ng expression kaagad bago ito ay dapat na naroroon para maganap ang isang tugma. Halimbawa, ang "tre{2}" ay tumutugma sa "puno".

{N,M}

Ang post-fix repetition operator na tumutukoy sa isang range (minimum ng "N" hanggang sa maximum na "M") ng mga paglitaw ng regular na termino ng expression na kaagad na nauuna dito na maaaring naroroon para sa isang tugma na mangyari. Halimbawa, ang "tre{1,2}" ay tumutugma sa "tre" at "tree".

{N,}

Ang post-fix repetition operator na tumutukoy sa isang range (minimum na "N" hanggang sa hindi tinukoy na maximum) ng mga paglitaw ng regular na termino ng expression na kaagad na nauuna dito na maaaring naroroon para sa isang tugma na mangyari. (Ang maximum na bilang ng mga paglitaw ay limitado lamang sa laki ng dokumento). Halimbawa, ang "tre{2,}" ay tumutugma sa "tree", "treee", at "treeeee".

(...)

Ang pagbuo ng pagpapangkat na nagsisilbi sa tatlong layunin.

  1. Upang ilakip ang isang hanay ng mga alternatibong '|'. Halimbawa, ang regular na expression na "b(oo|ac)k" ay tumutugma sa parehong "libro" at "back".

  2. Upang ipangkat ang mga termino sa isang kumplikadong expression na pinapatakbo ng mga post-fix operator: "*", "+" at "?" kasama ang mga post-fix repetition operator. Halimbawa, ang regular na expression na "a(bc)?d" ay tumutugma sa parehong "ad" at "abcd"; Ang "M(iss){2}ippi" ay tumutugma sa "Mississippi".

  3. Upang i-reference ang katugmang sub string sa loob ng mga panaklong para magamit sa ibang pagkakataon. Ang "\N" construct ay ginagamit sa Hanapin box, ang "$N" construct ay ginagamit sa Palitan kahon. Ang "N" bilang isang digit, ang reference sa unang tugma ay kinakatawan ng "\1" sa Hanapin kahon at sa pamamagitan ng "$1" sa Palitan kahon; Ang "\2" at "$2" ay tumutukoy sa pangalawa na tumugma, at iba pa.

Halimbawa, ang regular na expression na "(890)xy\1z\1" ay tumutugma sa "890xy890z890".

Gamit ang regular na expression na "(fruit|truth)\b" sa Find box, at ang kapalit na expression na "$1ful" sa Replace box, ang mga paglitaw ng "fruit" at "truth" ay pinapalitan ng "fruitful" at "truthful" ayon sa pagkakabanggit. Tandaan: Pinipigilan ng "\b" ang "fruitfully" o "truthfully" na tumugma.

[:alpha:]

Kumakatawan sa isang alpabetikong karakter. Gamitin [:alpha:] upang mahanap ang isa sa kanila.

\d

[:digit:]

Kumakatawan sa isang decimal na digit. Gamitin [:digit:] upang mahanap ang isa sa kanila.

[:alnum:]

Kumakatawan sa isang alphanumeric na character ([:alpha:] at [:digit:]).

\s

[:space:]

Kumakatawan sa isang space character (ngunit hindi sa iba pang mga whitespace na character).

[:print:]

Kumakatawan sa isang napi-print na character.

[:cntrl:]

Kumakatawan sa isang hindi naka-print na character.

[:lower:]

Kumakatawan sa maliit na titik kung Kaso ng tugma ay napili sa Mga pagpipilian .

[:upper:]

Kumakatawan sa malaking titik kung Kaso ng tugma ay napili sa Mga pagpipilian .


Maaaring pagsamahin ang mga termino ng regular na expression upang bumuo ng mga kumplikado at sopistikadong regular na expression para sa mga paghahanap tulad ng ipinapakita sa mga sumusunod na halimbawa.

Mga halimbawa

Pagpapahayag

Ibig sabihin

^$

Isang walang laman na talata.

^ tumutukoy na ang tugma ay dapat nasa simula ng isang talata,

Tinutukoy ng $ na ang isang marka ng talata o ang dulo ng isang cell ay dapat sumunod sa katugmang string.

^.

Ang unang karakter ng isang talata.

^ tumutukoy na ang tugma ay dapat nasa simula ng isang talata,

. tumutukoy sa anumang solong karakter.

e([:digit:])?

Tumutugma sa "e" sa sarili o sa isang "e" na sinusundan ng isang digit.

Tinutukoy ng e ang karakter na "e",

[:digit:] ay tumutukoy sa anumang decimal na digit,

? tumutukoy sa zero o isang paglitaw ng [:digit:].

^([:digit:])$

Tumutugma sa isang talata o mga cell na naglalaman ng eksaktong isang digit.

^ tumutukoy na ang tugma ay dapat nasa simula ng isang talata,

[:digit:] ay tumutukoy sa anumang decimal na digit,

Tinutukoy ng $ na ang isang marka ng talata o ang dulo ng isang cell ay dapat sumunod sa katugmang string.

^[:digit:]{3}$

Tumutugma sa isang talata o cell na naglalaman lamang ng tatlong digit na numero

^ tumutukoy na ang tugma ay dapat nasa simula ng isang talata,

[:digit:] ay tumutukoy sa anumang decimal na digit,

Tinukoy ng {3} na ang [:digit:] ay dapat mangyari nang tatlong beses,

Tinutukoy ng $ na ang isang marka ng talata o ang dulo ng isang cell ay dapat sumunod sa katugmang string.

\bconst(itu|ruc)tion\b

Tumutugma sa mga salitang "konstitusyon" at "konstruksyon" ngunit hindi sa salitang "konstitusyonal."

\b ay tumutukoy na ang tugma ay dapat magsimula sa isang hangganan ng salita,

Tinutukoy ng const ang mga character na "const",

(nagsisimula ang grupo,

Tinutukoy ni itu ang mga character na "itu",

| tumutukoy sa kahalili,

Tinutukoy ni ruc ang mga karakter na "ruc",

) nagtatapos sa grupo,

Tinutukoy ng tion ang mga character na "tion",

\b ay tumutukoy na ang tugma ay dapat magtapos sa isang hangganan ng salita.


Mangyaring suportahan kami!