Előfeltétel: A reguláris kifejezés (néha racionális kifejezésnek is nevezik) olyan karaktersorozat, amely egy keresési mintát határoz meg, főként a karakterláncokkal való mintaillesztés vagy a karakterlánc-illesztés, azaz a “keresés és csere” jellegű műveletek során. A reguláris kifejezések egy általánosított módja annak, hogy a mintákat karaktersorozatokkal egyeztessük.
A reguláris kifejezések (RE) megadnak egy olyan karakterlánchalmazt (mintát), amely megfelel neki. A RE analógia megértéséhez MetaCharacters
hasznosak, fontosak és a re
modul függvényeiben lesznek használva.
Ez összesen 14 metakarakter van, és a függvények következményeként tárgyaljuk őket:
\ Used to drop the special meaning of character following it (discussed below) Represent a character class^ Matches the beginning$ Matches the end. Matches any character except newline? Matches zero or one occurrence.| Means OR (Matches with any of the characters separated by it.* Any number of occurrences (including 0 occurrences)+ One ore more occurrences{} Indicate number of occurrences of a preceding RE to match.() Enclose a group of REs
re.search()
re.search()
módszer vagy None-t ad vissza (ha a minta nem felel meg), vagy egy re.MatchObject
ot, amely információt tartalmaz a karakterlánc megfelelő részéről. Ez a módszer az első találat után leáll, így ez a módszer inkább egy reguláris kifejezés tesztelésére alkalmas, mint adatok kinyerésére.
Példa:
Kimenet:
Match at index 14, 21Full match: June 24Month: JuneDay: 24
re.findall()
A stringben lévő minta összes nem átfedő találatának visszaadása stringek listájaként. A karakterláncot balról jobbra haladva vizsgálja, és a találatokat a talált sorrendben adja vissza.
Példa:
import
re
string
=
regex
=
'\d+'
match
=
re.findall(regex, string)
print
(match)
Kimenet: