אחרי השיבושים: אמזון מדווחת על סימני התאוששות ב-AWS

לאחר תקלה גדולה בעקבות בעיות במתקני שירותי הענן של אמזון בצפון ווירג'יניה, החברה מודיעה כי "אנו רואים סימנים משמעותיים של התאוששות" • בין החברות שנפגעו נמצאות מאנדיי הישראלית, זום וליפט

משרדי אמזון / צילום: Shutterstock
משרדי אמזון / צילום: Shutterstock

ענקית הטכנולוגיה אמזון מעדכנת באופן רשמי כי מצאה את מקור התקלה במתקני AWS (שירותי הענן) בצפון ורג'יניה, ומוסרת כי "אנו רואים סימנים משמעותיים של התאוששות. רוב הבקשות אמורות כעת להתקבל בהצלחה. אנו ממשיכים לטפל בבעיית הצטברות של בקשות בתור. נמשיך לספק מידע נוסף".

נראה כי התקלה הנרחבת בחברה לא הבהילה את המשקיעים בוול סטריט, ומניית אמזון יורדת במסחר המוקדם רק ב-0.1%.

למרות הודעת החברה, בשירותים המתבססים על AWS, בהם נרשמו תקלות בשעות האחרונות, עדיין נרשמים שיבושים.

בלעדי | החברה החדשה של אביגדור וילנץ מחליפה את אינטל שמתפנה מקיסריה
מרגל, תחקיר ומנכ"ל בן 30: המשפחה שמאחורי הסטארט-אפ המצליח

הודעת אמזון מגיעה לאחר שבשעות האחרונות נרשמו תקלות במספר רב של אתרים ושירותים, שמאחסנים את המידע שלהם בשירותי AWS של חברת אמזון.

בין החברות שהושפעו מהתקלה נמצאות מאנדיי וזום, ולפי שירות Downdetector, רשימת השירותים גדולה וכוללת את פורטנייט, דאולינגו, פלייסטיישן, "ניו יורק טיימס", מקס (של HBO), אקסבוקס, מקדונלד'ס, Steam (פלטפורמת המשחקים), ליפט (המתחרה של אובר), סיגנל ו-EA.

"המחיר של ריכוזיות בענן"

אושר עשור, מנכ"ל חברת ייעוץ סייבר Hexpecto, מסביר לגלובס כי "שירותי הענן של אמזון, כמו של שותפותיה הענקיות, כבר מזמן הפכו להיות עמוד תווך מרכזי בכל הנוגע לתשתיות הרשת המודרנית. נפילה של שירות כזה משפיע באופן רחב ומיידי על שירותים רגישים כמו שירותים ממשלתיים, ביטחוניים ועוד".

לדברי עשור, "תוך דקות בודדות עלו מעל 2,000 דיווחים על תקלות בשירות הענן של AWS. לרוב תקלה כזאת יכולה להיגרם בפספוס לקוי בהגדרה של פרוטוקול הניתוב, כמו שקרה בעבר בחברת מטא".

צביקה רונן, בעלי חברת FossaWare, מומחה לניהול סיכוני קוד פתוח, אומר לגלובס כי "נפילת AWS היום הזכירה לכולנו את המחיר של ריכוזיות בענן, ובעיקר את התלות של שרשראות אספקת קוד פתוח בתשתיות צד שלישי. כשאזור שלם של AWS הופך למקרטע, פעולות של בניית תוכנה נעצרות, התקנות חבילות קוד פתוח נתקעות, והרשת זועקת לעזרה. שרשראות אספקה תלויות בשרתי אחסון. כאשר אזור גאוגרפי המשמש נקודת ריכוז לבקרות, API ושירותים מושבת, הוא מייצר אפקט דומינו של תקלות גם לאזורים נוספים".

לדברי רונן, "חברות צריכות לכלול בתוכנית ההמשכיות העסקית שלהם גם התייחסויות לאירועים כאלה, לתכנן תוכניות התאוששות ושיקום מאסון גם לסביבת הפיתוח והצוותים התומכים, להישען פחות על רכיבי תוכנה מוכנים ישירות, ולתרגל במסגרת אירועי סייבר גם "'ניתוק' משירות מסוים ולבחון איך זה משפיע".

לפי אתר הסטטוס של אמזון, התקלות הושפעו רבות משירות מרכזי שנפגע, Amazon DynamoDB, ובשל כך השפיע על מעל ל-50 רכיבים נוספים באמזון, ובהם AWS Config, AWS IAM Identity Center, AWS Support Center ועוד. רכיבים אלה מאפשרים ללקוחות רבים לשכור אחסון מצדה של אמזון ולהפעיל את השירותים שלהם. המשמעות של תקלה מהסוג הזה היא ששירותים רבים הנסמכים על שירותי האחסון של אמזון יתקלו בבעיות קשות.

"משפיע על כל המערכות"

באתר אמזון נכתב כי "אנחנו יכולים לאשר עלייה בשיעורי השגיאות ובהשהיות עבור שירותי AWS מרובים באזור US-EAST-1. בעיה זו עשויה להשפיע גם על פתיחת מקרים דרך מרכז התמיכה של AWS או ממשק ה-API של התמיכה. אנחנו פועלים כדי לצמצם את הבעיה והן כדי להבין את שורש הבעיה. נספק עדכון תוך 45 דקות, או מוקדם יותר אם יהיה לנו מידע נוסף לשתף".

מהנדסי תוכנה שעובדים בחברות ובסטארט-אפים המתבססים על AWS הושבתו. ד"ר יניב בוהדנה, מהנדס תוכנה בכיר, מספר לגלובס כי "ישנם הרבה מוצרים משלבים, ויש שירותים שמתבססים על רכיבים אחרים, אבל בשל העובדה שאמזון חווה תקלות, זה משפיע על כל המערכות. מדובר בשרתי ענן מטורפים - אין כמעט מוצר תוכנה בעולם שלא יושב על אמזון בצורה כזו או אחרת". בהמשך לכך, ברשתות לא המתינו זמן רב והחלו להפיץ ממים המגחכים על התקלה באמזון.

שירותי הענן של אמזון, AWS, מחזיק בחלק נרחב משוק שירותי הענן ברחבי העולם, על-פי הערכות כשליש מהשוק. המשמעות היא ששיבושים בתשתית כזו משמעותית באינטרנט העולמי תוביל לתקלות נרחבות בשירותים אינטרנטיים רבים.