4.2 מחרוזת ב-Python - string
מחרוזות הן פשוט רשימת אותיות, ב-Python ישנם שני סוגי מחרוזות: מחרוזות רגילות, ומחרוזות Unicode. מחרוזות Unicode יכולות להכיל גם תווים
מעבר לקבוצת ASCII. כלומר תווים בעברית, ערבית, סינית כמובן אנגלית, וכו'. לעומתן
מחרוזות רגילות מסוגלות להכיל אנגלית בלבד.
שפת פייטון מאפשרת להמיר בין קידודים שונים בצורה פשוטה
כולל בדיקת שגיאות, ופתרון אוטומטי שלהן.
- ·
הסימון של מחרוזת הוא על ידי גרש בודד העוטף
אותה ('string' מייצג את המחרוזת string) או על ידי הסימן גרשיים (")
- ·
הסימון של מחרוזת Unicode הוא פשוט מאוד על ידי הסימן u בתחילת המחרוזת: u'unicode'.
- ·
ניתן לבצע escaping על ידי סימן הסלאש (/ - כמו בשפות רבות אחרות) – כך למשל ניתן
לשים גרש בתוך מחרוזת שמסומנת על ידי גרש. בעזרת אותו סימן ניתן להגדיר תווים
מיוחדים, לדוגמא: \n מסמן ירידת שורה, ומכיוון שלסלאש משמעות מיוחדת יש צורך לבצע escaping על מנת לייצג
אותו, לדוגמא: \\ משמעותו \ בודד.
- ·
ניתן להגדיר לשפה להתעלם מסימנית מיוחדים ובכך
לבטל את הצורך בשני סלאשים על מנת לייצג סלאש כך: r'\n\\\asdas\as' – ישנו r לפני המחרוזת ולכן הערך שלה הוא \n\\\asdas\as.
- ·
ניתן להגדיר לשפה מחרוזת שלא מסתיימת בירידת
השורה אלא פשוט ממשיכה על ידי סימון משולש של ההתחלה והסוף שלה (" "
" או ' ' ' – ללא הרווחים כמובן) – בצורה כזו נוח לכתוב מחרוזות תיעוד עבור
פונקציות ומחלקות בשפה, או לשמור במשתנים ערכים קבועים מרובי שורה מבלי לבצע עבורם
escaping
לירידות השורה.