Forudsætning: Regular Expression with Examples | Python
Et Regular expression (undertiden kaldet et Rational expression) er en sekvens af tegn, der definerer et søgemønster, primært til brug ved mønstermatchning med strenge, eller strengmatchning, dvs. “find and replace”-lignende operationer. Regulære udtryk er en generaliseret måde at matche mønstre med sekvenser af tegn.
Modul Regular Expressions (RE) angiver et sæt af strenge (mønster), der matcher det. For at forstå RE-analogien er MetaCharacters
nyttige, vigtige og vil blive brugt i funktioner i modul re
.
Der er i alt 14 metakendetegn og vil blive diskuteret, efterhånden som de følger ind i funktioner:
\ Used to drop the special meaning of character following it (discussed below) Represent a character class^ Matches the beginning$ Matches the end. Matches any character except newline? Matches zero or one occurrence.| Means OR (Matches with any of the characters separated by it.* Any number of occurrences (including 0 occurrences)+ One ore more occurrences{} Indicate number of occurrences of a preceding RE to match.() Enclose a group of REs
re.search()
re.search()
Metoden returnerer enten None (hvis mønsteret ikke passer) eller en re.MatchObject
, der indeholder oplysninger om den matchende del af strengen. Denne metode stopper efter det første match, så den egner sig bedst til at teste et regulært udtryk mere end til at udtrække data.
Eksempel:
Output:
Match at index 14, 21Full match: June 24Month: JuneDay: 24
re.findall()
Returnerer alle ikke-overlappende matches af mønsteret i strengen, som en liste af strings. Strengen scannes fra venstre mod højre, og overensstemmelser returneres i den rækkefølge, de findes.
Eksempel:
import
re
string
=
regex
=
'\d+'
match
=
re.findall(regex, string)
print
(match)
Output: