Liste over regulære udtryk

Udtryk

Repræsentation/Brug

Hvilket som helst tegn

Det givne tegn, med mindre det er et metategn i et regulært udtryk. Listen over metategn følger i denne tabel.

.

Ethvert enkelt tegn undtagen et linjeskift eller et afsnitskift. Fx matcher søgeordet "l.nge" både "længe" og "lange".

^

Begyndelsen af et afsnit eller en celle. Særlige objekter, såsom tomme felter eller rammer forankret til tegn, i begyndelsen af et afsnit ignoreres. Eksempel: "^Peter" matcher kun ordet "Peter", hvis det er det første ord i et afsnit.

$

Slutningen af et afsnit eller en celle. Særlige objekter, såsom tomme felter eller rammer forankret til tegn, i slutningen af et afsnit ignoreres. Eksempel: "Peter$" matcher kun ordet "Peter", hvis det er det første ord i et afsnit; bemærk at "Peter" ikke kan følges af et punktum.

$ alene svarer til slutningen på et afsnit. På denne måde er det muligt af søge og erstatte afsnitsskilletegn.

*

Ingen eller flere af de regulære udtryk umiddelbart foran tegnet. For eksempel matcher "Ab*c" både "Ac", "Abc", "Abbc", "Abbbc" og så videre.

+

Et eller flere tegn i det regulære udtryk umiddelbart foran tegnet. Fx vil "AX.+4" finde "AXx4", men ikke "AX4".

Den længst mulige streng, som matcher dette regulære udtryk i et afsnit, matcher altid. Hvis afsnittet indholder strengen "AX 4 AX4", bliver hele passagen fremhævet.

?

Ingen eller et af de regulære udtryks termer umiddelbart foran tegnet. For eksempel matcher "Spor?" både "Spor" og "Sport" og "x(ab|c)?y" finder "xy", "xaby" eller "xcy".

\

Det specialtegn, der følger tegnet, fortolkes som et almindeligt tegn og ikke som metategn for et regulært udtryk (undtagen kombinationerne "\n", "\t", "\b", "\>" og "\<"). For eksempel matcher "træ\." ordet "træ.", men ikke "træer" eller "trætte".

\n

Et linjeskift, som blev indsat med tastekombinationen Skift+Enter, når du står i tekstfeltet Find.

Et afsnitskift kan indtastes med tasterne Enter eller Retur, når du er i tekstfeltet Erstat i Writer. Har ingen særlig betydning i Calc og behandles bogstaveligt her.

For at ændre linjeskift til afsnitsskift, indtaster du \n i begge tekstfelterne Find og Erstat og udfører så en Søg og erstat.

\t

Et tabulator-tegn. Kan også bruges i feltet Erstat.

\b

En ordgrænse. For eksempel matcher "\bboog" "bogmærke" og "bog" men ikke "kassebog", mens "book\b" matcher "kassebog" og "bog" men ikke "bogmærke".

Bemærk, at denne form erstatter de forældede (selvom de for tiden virker endnu) former "\>" (matcher slutningen af et ord) og "\<" (matcher begyndelsen af et ord).

^$

Finder et tom afsnit.

^.

Finder det første tegn i et afsnit.

& eller $0

Tilføjer strengen, som blev fundet med søgekriterierne i feltet Find, til udtrykket i feltet Erstat-, når du foretager en erstatning.

Hvis du for eksempel indtaster "dør" i Find-feltet og "&håndtag" i Erstat-feltet, bliver ordet "dør" erstattet af "dørhåndtag".

Du kan også indtaste et "&" i Erstat-feltet for at ændre Attributterne eller Formatet i strengen, der blev fundet af søgekriterierne.

[...]

Hver enkelt forekomst af enhver af karaktererne, som findes mellem de kantede parenteser. for eksempel matcher "[abbc123]" tegnene 'a', 'b', 'c', '1', '2', og '3'. "[a-e]"matcher enkelt-forekomster af tegnene a til og med e (området skal specificeres med tegnet med det laveste Unicode-nummer først). "[a-eh-x]" matcher enhver enkelt-forekomst af tegnene i områderne 'a' til 'e' og 'h' til 'x'.

[^...]

Enhver enkeltforekomst af et tegn, medregnet Tabulator-, Mellemrums- og Linjeskift-tegn, som ikke er på listen over reserverede tegn inklusive områder, er tilladte. For eksempel matcher "[^a-syz]" alle tegn, der findes i omfattede område 'a' til 's' eller tegnene 'y' og 'z'.

\uXXXX

\UXXXXXXXX

Tegnet repræsenteret med fireciffers hexadicimal Unicode-kode (XXXX).

Tegnet repræsenteret af otteciffers hexadicimal Unicode-kode (XXXXXXXX).

I visse symbolskrifttyper kan det symbol (glyf), som du ser på skærmen, se ud til at være til at være knyttet til en an anden Unicode-kode, end den, den faktisk bruges til skrittypen. Unicode-koder kan ses ved at vælge Indsæt ▸ Specialtegn eller ved at bruge genvejen Unicode-konvertering.

|

Den infix-operator, der afgrænser alternativer. Matcher udtrykket før "|" eller udtrykket efter "|". For eksempel matcher "denne|dette" forekomster af både "denne" og "dette."

{N}

Postfiks-gentagelsesoperatoren, der angiver det præcise antal forekomster ("N") af det regulære udtryk, der står umiddelbart foran, som må være tilstede, for at matchet kan finde sted. For eksempel: "stres{2}" matcher "stress".

{N,M}

Den postfix-gentagelses-operator, der specificerer et område (fra et minimum af "N" til et maksimum af "M") af forekomster af den term i det regulære udtryk, der kommer umiddelbart før den, som skal være til stede, for at der sker et match. For eksempel vil "klap[1,2]" matche "klap" og "klapp".

{N,}

Den postfix-gentagelses-operator, som specificerer et område (minimum "N" til et uspecificeret maksimum) af forekomster af termen i det regulære udtryk, der kommer umiddelbart før den, som skal være til stede, for at der kan ske et match (Det maksimale antal af forekomster er kun begrænset af dokumentets størrelse. For eksempel vil "klap[2,]" matche "klapp", "klappp" og "klapppp".

(...)

Den grupperingskonstruktion, der tjener tre formål.

  1. For at indkaple et sæt af '|' alternativer. For eksempel vil det regulære udtryk "b(lå|in)d" matche både "blå" og "bind".

  2. Til at gruppere termer i et komplekst udtryk, der skal bearbejdes af postfiks-operatorerne: "*", "+" og "?" sammen med postfiks-gentagelses-opratorerne. For eksempel vil det regulære udtryk "a(bc)?d" matche både "ad" og "abcd" i en søgning; det regulære udtryk "M(iss){2}ippi" matcher "Mississippi".

  3. For at registrere den matchede delstreng inde i parentesen som en reference til senere brug i feltet Find med" \n"-strukturen eller i feltet Erstat med "$n"-strukturen. Referencen til det første match præsentes af "\1" i feltet Find og af feltet "$1" i feltet Erstat. Referencen til den anden matchede understreng med henholdsvis "\2" og "$2" og så videre.

For eksempel vil det regulære udtryk "(890)7\1\1" matchs "8907890890".

Med det regulære udtryk "\b(frugt|brænd]\b" i feltet Find og det regulære udtryk "$bar" i Erstat-feltet kan forekomster af ordene "frugt" og "brænd" erstattes med henholdsvis ordene "frugtbar" og "brændbar" uden at påvirke ordene "frugtbart" og "brændbart"

[:alpha:]

Repræsenterer et bogstav (alpha er en forkortelse af det engelske ord alphabet, på dansk alfabet). Brug [.alpha:]+ for at finde et af dem.

[:digit:]

Repræsenterer et decimalciffer (digit på engelsk). Brug [:digit:]+ for at finde et af dem.

[:alnum:]

Repræsenterer et alfanumerisk tegn ([:alpha:] og [:digit:], se disse).

[:space:]

Repræsenterer et mellemrum (men ikke andre blanktegn).

[:print:]

Repræsenterer et tegn som kan udskrives (print på engelsk).

[:cntrl:]

Repræsenterer et kontroltegn ("cntrl" er en forkortelse for de engelske ord control, på dansk kontrol).

[:lower:]

Repræsenterer et lille bogstav, hvis STORE og små bogstaver er valgt i Indstillinger.

[:upper:]

Repræsenterer et stort bogstav, hvis STORE og små bogstaver er markeret i Indstillinger.


Find hele listen med understøttede metategn og syntaks på ICU Regular Expressions – dokumentation

Bemærk, at for tiden skal alle navngivne klassetermer for tegn, fra [:alpha:] til [:upper:], indkapsles i parenteser, når de bruges i et regulært udtryk; se eksemplerne nedenfor.

Terner i regulære udtryk kan kombineres til at udgøre komplekse og sofistikerede regulære udtryk til søgninger som vist i de følgende eksempler.

Eksempler

Udtryk

Betydning

^$

Et tomt afsnit.

^ angiver at matchet skal være i begyndelsen af et afsnit,

$ specificerer, at afsnitsmærket eller slutningen af en celle skal følge den matchede streng.

^.

Det første tegn i et afsnit.

^ angiver at matchet skal være i begyndelsen af et afsnit,

. specificerer ethvert enkelt-tegn.

e([:digit:])?

Matcher "e" alene eller et "e" fulgt af ét ciffer.

e specificerer tegnet "e",

[:digit:] specificerer ethvert decimalt ciffer,

? specificerer nul eller en forekomst af [:digit:].

^([:digit:])$

Matcher et afsnit eller celler, der indeholder præcis et ciffer.

^ angiver at matchet skal være i begyndelsen af et afsnit,

[:digit:] specificerer ethvert decimalt ciffer,

$ specificerer, at afsnitsmærket eller slutningen af en celle skal følge den matchede streng.

^[:digit:]{3}$

Matcher et afsnit eller en celle, der kun indeholder trecifrede tal

^ angiver at matchet skal være i begyndelsen af et afsnit,

[:digit:] specificerer ethvert decimalt ciffer,

{3} specificerer at [:digit:] skal forekomme tre gange,

$ specificerer, at afsnitsmærket eller slutningen af en celle skal følge den matchede streng.

\bconst(itu|ruc)tion\b

Matcher ordene "konstitution" og "konstruktion", men ikke ordet "konstitutionel".

\b specificerer, at matchet skal begynde ved en ordgrænse,

konst angiver tegnene "konst",

( begynder gruppen,

itu specificerer tegnene "itu",

| specificerer alternativet,

ruc specificerer tegnene "ruc",

) afslutter greuppen

tion specificerer tegnene "tion",

\b angiver, at matchet skal slutte ved en ordgrænse.


Støt os venligst!