תחביר בסיסי

התבנית הפשוטה ביותר שתשמש כביטוי רגולרי היא אות, או רצף של אותיות.

כל מופע של האות/האותיות ייחשב כהתאמה.

למשל, עבור התבנית "a", סומנו ההתאמות שימצאו בטקסט הבא:

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

נשים לב שאותיות קטנות אינן שוות לאותיות גדולות. עבור התבנית "a" לא מצאנו את האות הגדולה A שבתחילת המילה And.



עבור התבנית "Mary" ימצאו בטקסט ההתאמות הבאות:

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

הסימן ^ מסמל "מתחיל ב" – לדוגמא, התבנית "^The" תמצא התאמה בכל מחרוזת המתחילה במילה The.

הסימן $ מסמל "מסתתים ב" – לדוגמא, התבנית "final$" תמצא התאמה בכל מחרוזת שתסתיים במילה final.

ניתן לשלב בין סימנים אלו. התבנית "^abc$" תמצא כל מחרוזת המתחילה ומסתיימת ב-abc. זוהי יכולה להיות רק המחרוזת "abc" עצמה.

תווי בריחה: נחפש את התבנית ".*" במחרוזת הבאה:

Special characters must be escaped.*

ההתאמה שנקבל תהיה כל המחרוזת. הסיבה: . ו-* הם תווים מיוחדים, בדומה ל-^ ול-$. כאשר אנו רוצים לחפש תווים אלו בטקסט, עלינו להשתמש בתו בריחה מיוחד שהוא \ כדי לומר שאנו מתכוונים לתווים אלו כתווים, ולא כאל סימנים מיוחדים שיש לפרשם.

נחפש כעת באותה מחרוזת את התבנית "\.\*" ונראה מה תהיה ההתאמה:

Special characters must be escaped.*

רק שני התווים בסוף המחרוזת מהווים הפעם את ההתאמה.

התו . (נקודה) משמש כ-wildcard בתבניות. קוראים המכירים את מערכת ההפעלה DOS יכולים לזהות אותו עם התו ? ב-DOS. משמעותו – "כל תו".

למשל, עבור התבנית ".a" נסמן את ההתאמות בטקסט הבא:

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

כאשר אנו מסתכלים על ביטוי רגולרי, כל אות בו מכונה אטום. נראה בהמשך אופרטורים הפועלים על אטום. כדי להגדיר אטום בן יותר מאות אחת, נשתמש בסוגריים מעוגלות.

לדוגמא עבור "(Mary)( )(had)" נקבל את ההתאמה הבאה:

 

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

ניתן להגדיר מחלקות תווים. במקום לדרוש שאות מסוימת אחת תופיע, נוכל לדרוש שאות אחת מבין קבוצה שנגדיר היא זו שתופיע. למשל, התבנית "[abc]" תתאים לכל מחרוזת הכוללת אחת מהאותיות הקטנות a, b או c. ניתן להגדיר טווח של אותיות, על ידי כתיבת האות הראשונה, לאחריה מקף, ואז את האות האחרונה בטווח. התבנית "[A-Z]" תתאים לכל אות גדולה באלף בית האנגלי. דוגמא: עבור התבנית "[a-z]a" נקבל את ההתאמה:

 

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

הסימן ^ מציין לרוב התחלה של מחרוזת, אולם כאשר הוא מופיע בתוך מחלקת תווים הוא מקבל משמעות אחרת – שלילה. הכוונה של ^ בראש מחלקת תווים היא הפיכת משמעות המחלקה – כלומר – "כל תו שאינו מופיע במחלקת התווים". לדוגמא, עבור התבנית "[^a-z]a" נקבל את ההתאמה הבאה:

Mary had a little lamb.

And everywhere that Mary

went, the lamb was sure

to go.

מאת: עודד

אופרטורים

עמוד 12!!!
מאת: עודד

אופרטורים

אין טבלת אופרטורים בעמוד!!!
מאת: MoShiKy

טעויות כתיב

אם יש לך זמן כדאי שתתקן את השגיאות הבאות במסמך:
עמ' 20- "אם זאת" => "עם זאת"
עמ' 21- "אל הרשימ" => "אל הרשימה"

EOC
שיתוף:
| עוד