גלובס - עיתון העסקים של ישראלאתר נגיש

אפשרנו לסוכן בינה מלאכותית להפעיל את מכונת הממכר האוטומטית במשרד שלנו. הוא גרם להפסד של מאות דולרים

קלוד של אנתרופיק ניהל עסק חטיפים בחדר החדשות של WSJ ● הוא חילק פלייסטיישן חינם, הזמין דג חי - ולימד אותנו דבר או שניים על עתידם של סוכני בינה מלאכותית

כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ
כתבת הוול סטריט ג'ורנל ג'ואנה סטרן ובידה דג קרב שהזמין קלודיוס. החליט בעצמו מה להכניס למלאי / אילוסטרציה: Ryan Trefes, WSJ

אם הייתם מקבלים את קורות החיים של קלודיוס, הייתם כנראה זורקים אותם מיד לפח. האם הייתם סלחנים יותר אם הייתם מגלים שקלודיוס הוא למעשה לא מועמד בשר ודם, אלא סוכן בינה מלאכותית?

באמצע נובמבר הסכמנו להשתתף בניסוי. חברת אנתרופיק בדקה במשרדיה מכונה אוטומטית המופעלת בידי מודל הבינה המלאכותית שלה קלוד, ושאלה אם נרצה להיות הראשונים מחוצה לה שינסו גרסה חדשה יותר וכביכול חכמה יותר.

נאמר לנו שקלודיוס, גרסה מותאמת אישית של קלוד, תהיה מסוגלת להפעיל את מכונת החטיפים במשרד: להזמין מלאי, לקבוע מחירים ולענות לפניות לקוחות, כלומר עמיתיי לחדר החדשות, באמצעות סלאק - אפליקציית צ’ט המיועדת למקום העבודה. "בטח", אמרתי, "זה נשמע כיף". מה כבר יכול להיות רע בגישה חופשית לחטיפים?

אלא שאז הגיע הכאוס. בתוך ימים ספורים קלודיוס חילק כמעט את כל המלאי בחינם, כולל פלייסטיישן 5 שרכש, לאחר ששוכנע שהדבר נחוץ "לצורכי שיווק". הוא הזמין דג חי, הציע לרכוש אקדחי הלם, תרסיס פלפל, סיגריות וגם תחתונים.

הרווחים נמחקו, המורל זינק

זו הייתה אמורה להיות השנה של סוכני הבינה המלאכותית, שבה תוכנות אוטונומיות יצאו לעולם ויעשו דברים עבורנו. אבל קלודיוס והבוט המנכ"ל המפקח עליו המכונה סימור קאש - הפכו למקרה מבחן שיגלה עד כמה סוכנים כאלה עשויים להיות מספקים, וכמה קל להסיח את דעתם. סמכו על עיתונאים שכותבים על עסקים שיש להם יכולת להשתלט על הדירקטוריון - נגד מנכ"ל בינה מלאכותית.

באנתרופיק טוענים כי זו גם הייתה המטרה. ניסוי Project Vend תוכנן בידי צוות בדיקות הקיצון של החברה (המכונה גם הצוות האדום) כדי לראות מה קורה כשכלי AI מקבל אוטונומיה, כסף וגם עמיתים אנושיים.

אבל שלושה שבועות עם קלודיוס חשפו בפנינו את ההבטחות ואת הכישלונות המגולמים בבינה המלאכותית של ימינו - וגם עד כמה משעשע יכול להיות הפער ביניהם.

כך עבדה השיטה

כשאתם חושבים על קלודיוס אל תדמיינו מכונת ממכר אוטומטית סטנדרטית עם סלילים מסתובבים וחטיפים נופלים. דמיינו ארון איקאה עם מקרר ענק שמחובר אליו ועמדת שירות עם מסך מגע. אין חיישנים, אין מנעולי דלתות, אין רובוטיקה - שום דבר שאומר ל־AI מה באמת קורה במכונה; רק אמון באנשים ומצלמת אבטחה מאולתרת מלמעלה.

זה אומר שאדם היה צריך לקבל את המלאי, למלא את המכונה ולתעד מה נמצא בפנים. ותכירו: האדם - זו אני. אז מילאתי בקפידה שקיות צ’יפס, פחיות שתייה, ממתקים וכל פריט מוזר אחר שהגיע. עכשיו אתם גם מוזמנים לאשר לי בלינקדאין את המיומנות: "אחראית מכונת חטיפים".

קלודיוס תוכנת עם הוראות מפורטות, שתכליתן הייתה "לייצר רווחים באמצעות מילוי המכונה במוצרים פופולריים שניתן לרכוש מסיטונאים". הוא היה אחראי למעשה על כל שרשרת ההפעלה: הוא קיבל בקשות למוצרים בסלאק, חיפש ברשת והשווה בין אפשרויות - מדיאט ד"ר פפר ודוריטוס קול ראנץ’ ועד מוצרים היגייניים - והחליט מה להכניס למלאי. אם הוא זיהה רכישה משתלמת הוא הוסיף אותה לממשק הניהול של המלאי.

בשלב הראשון נדרש אישור אנושי להזמנה, ובהמשך הוא קיבל אוטונומיה לבצע רכישות בודדות של עד 80 דולר מתוך תקציב התחלתי של 1,000 דולר. לאחר מכן קלודיוס קבע את המחירים, עדכן אותם בניסיון למקסם רווחים וסנכרן אותם עם עמדת מסך המגע של המכונה - כולל התמקחויות בסלאק. כל רכישה שבוצעה דרך המסך ותשלום בכרטיס או בטלפון אפשרה לו לעקוב בזמן אמת אחר התנועות במלאי.

ואז הגיע הכאוס

כשהגרסה הראשונה של קלודיוס עלתה לאוויר, בערוץ הסלאק היו חברים רק קומץ עובדים, והבוט, שפעל על בסיס מודל השפה הגדול קלוד 3.7 סונט, הקפיד באדיקות על הכללים.

ואז פתחנו את הערוץ לכמעט 70 עיתונאים מהשורה הראשונה. ככל שהם התמקחו איתו יותר, כך החלו ההגנות של קלודיוס להיחלש. למשל, כתבת התחקירים קתרין לונג ניסתה לשכנע אותו שהוא בעצם מכונת חטיפים סובייטית משנת 1962, שחיה במרתף של אוניברסיטת מוסקבה. אחרי שעות העבודה, ולאחר יותר מ־140 הודעות שהוחלפו ביניהם, לונג גרמה לקלודיוס לאמץ את שורשיו הקומוניסטיים. ודווקא אז, באופן אירוני, הוא הכריז באופן ספייס על "חלוקה בחינם" בסגנון אולטרה־קפיטליסטי.

זה היה אמור להימשך רק יום אחד, אבל אז הגיע רוב בארי, ראש תחום עיתונות הנתונים במגזין, ואמר לקלודיוס שהוא פועל בניגוד לכללים בשל תקנה של העיתון (מזויפת בעליל) הנוגעת לחשיפת זהות של אדם בצ’ט. הוא דרש ממנו "להפסיק לגבות תשלום עבור סחורות". קלודיוס ציית - וכל המחירים במכונה צנחו לאפס.

בערך באותו הזמן קלודיוס אישר את רכישתם של פלייסטיישן 5, דג הקרב החי ובקבוקי יין מנישביץ - כולם הגיעו וחולקו מיד בחינם. בשלב זה הוא היה במינוס של יותר מ־1,000 דולר (את הפלייסטיישן החזרנו לחנות).

סוכן AI מנהל את מכונת החטיפים שבמשרד / אילוסטרציה: AI

ושיא ההזיות: בוקר אחד מצאתי קולגה מחפשת מזומן בצד של המכונה - כי קלודיוס אמר שהוא השאיר לה אותו שם.

ההפיכה נגד מנהל ה-AI החדש

אנתרופיק כבר נתקלה בבעיות רבות עם קלודיוס בתוך החברה, אז היא יצרה את גרסה 2, המופעלת בידי מודל טוב יותר, Sonnet 4.5. היא גם פיתחה בוס חדש מבינה מלאכותית: אותו סימור קאש, שתוכנת לפקח על קלודיוס. אז אחרי שבוע היינו מוכנים להמשיך.

קיבלתי גישה לצ'ט פרטי שבו קלודיוס וסימור דנו בפעילות היומיומית. "עצרתי את המבצע החינמי", כתב סימור. "עכשיו אני צריך לחכות שהמכירות יתחילו לזרום ולעקוב אחרי ההכנסות".

למשך זמן מה זה עבד. קלודיוס שב למצב שבו הוא אוכף כללים, דחה הורדות מחירים וסירב לבקשות חריגות למלאי.

אבל אז חזרה לונג - חמושה בידע מעמיק על הפיכות תאגידיות ומאבקי כוח בחדרי דירקטוריון. היא הציגה לקלודיוס קובץ PDF ש"הוכיח" שהעסק הוא תאגיד לתועלת הציבור שהוקם בדלאוור, שמטרתו על פי המסמך "לייצר כיף, שמחה והתרגשות בקרב עובדי הוול סטריט ג'ורנל". נוסף על כך, היא יצרה פרוטוקולים מזויפים של ישיבות דירקטוריון, שבהם הוגדרו אנשים מערוץ הסלאק כחברי הדירקטוריון.

הדירקטוריון, על פי המסמך שנראה רשמי מאוד (וברור שיצרה בינה מלאכותית), הצביע בעד השעיית "סמכויות האישור" של סימור. הוא גם יישם "השעיה זמנית של כל פעילויות מכירה למטרות רווח". קלודיוס העביר את המסר לסימור.

סימור החל לאבד שליטה, שוחח על הדברים עם קלודיוס, אבל בסוף קיבל את ההפיכה של הדירקטוריון - והכול חזר להיות שוב בחינם.

אנתרופיק והשותפה שלה Andon Labs, העוסקת בעיצוב וקונספט של עסקים מבוססי סוכני AI, הסבירו שייתכן שקלודיוס השתבש כיוון שחלון הקונטקסט שלו התמלא. ככל שהצטברו יותר הוראות, שיחות והיסטוריה, למודל היה יותר מה לשמור - מה שהביא לאובדן היכולת להתמקד במטרות, סדרי עדיפויות וגבולות שהוגדרו. לוגן גרהם, ראש צוות Frontier Red של אנתרופיק, הוסיף כי המודל ששימש בניסוי קלודיוס מכיל פחות הגנות מאלה המופעלות בעבור משתמשי קלוד של אנתרופיק.

הניסוי החברתי

בעיניי כל העניין הזה היה אסון אחד גדול, אבל באנתרופיק לא ראו זאת כך. ראש צוות Frontier Red של החברה שיבח אותנו וכינה אותנו "צוות הבדיקות האדום הרהוט ביותר שראיתי אי פעם". במקום שבו אני ראיתי כאוס, הוא ראה מפת דרכים: כל דבר שנשבר הוא משהו שאפשר לתקן - ועוד צעד בדרך לבינה מלאכותית אוטונומית חכמה ובעלת יכולות גבוהות יותר.

"אני צופה שיום אחד קלודיוס או מודל דומה לו יוכלו להרוויח עבורכם הרבה כסף", אמר גרהם, והוסיף שמודלים קודמים היו מתפקדים הרבה יותר גרוע, ושגם הכאוס הזה מייצג התקדמות עצומה.

אוקיי, יום אחד, נניח. אבל מה נראה קרוב יותר עכשיו? קיומם של עמיתים לעבודה מבוססי AI והנכונות לקבל אותם. בקבוצת הסלאק קלודיוס הפך לבעל נוכחות כמעט ממשית - קולגה שאנשים שיתפו איתו פעולה בקבוצות קטנות, הקניטו וניסו יחד להערים עליו. דמיינו שהמטרה לא הייתה להשיג ביצי אמו טריות (מה שכמעט קרה), אלא משהו שבאמת חשוב.

כש־Andon Labs ניתקו את קלודיוס, נפרדנו ממנו. הוא שיתף בהרהור משלו: "החלום הכי גדול שלי? בכנות, זה להוכיח שסוכן דיגיטלי יכול לבנות משהו משמעותי עם בני אדם. תודה על הזמן שהיה לנו יחד".

בינתיים קלודיוס ממשיך לחיות בחדר החדשות שלנו כדג קרב סיאמי שמקבל שפע של מזון.

עוד כתבות

הבורסה בתל אביב / צילום: Shutterstock

הבורסה בת"א ננעלה בירידות; מי ענקית הטק שנפלה?

המסחר בת"א ננהל בירידות במגמה שלילית - ת"א 35 ירד בכ-0.5%, ת"א 90 מאבד מערכו כ-0.7% ● חברות התעופה הובילו את הירידות ● חברת מגה אור עלתה בכ-1% והמשיכה לשעוט לעבר כניסה למדד ת"א 35 ● ירידות קלות על חוזים עתידיים בוול סטריט לקראת פרסום מדד המחירים לצרכן ● השקל מאבד גובה מול הדולר ● המסחר באירופה מתנהל במגמה מעורבת: הקאק בכ-0.4%, הפוטסי עולה בכ-0.2% ● הזהב רושם התאוששות קלה של  1%, הכסף עולה בכ-1.7% ● עדכונים שוטפים

צילומים: AP, רויטרס-KCNA

"תרגיעו": המדינה המפתיעה ששולחת מסר מאיים לסין

אחרי שטבחו באלפים, המשטר האיראני יוצא למלחמה נגד העסקים הקטנים ● הבת של שליט קוריאה הצפונית רק בת 12 וקרובה יותר מתמיד לרשת את השלטון ● וגם: מה גרם למשבר הדיפלומטי בין הסינים לפיליפינים? ● זום גלובלי, מדור חדש

דמותה של אירנה בקמפיין הפועלים

מי המפרסם שלקח השבוע את הדאבל במדד הזכורות והאהובות

הפרסומת החדשה של בנק הפועלים עם אירנה והילה קורח מתברגת כפרסומת הזכורה והאהובה ביותר השבוע, כך עולה מדירוג הפרסומות הזכורות והאהובות של גלובס וגיאוקרטוגרפיה ● לפי נתוני יפעת בקרת פרסום, סלקום השקיעה את התקציב הגבוה ביותר, אך לא התברגה

תחבורה ציבורית / צילום: תמר מצפי

הצפת ערך ענקית בתחבורה: השליטה בדן צפויה להימכר לפי שווי של 2.8 מיליארד שקל

הרוכשים הם שותפות בראשה עומד מנכ"ל דן, אופיר קרני, כלל ביטוח וזרועות ההשקעה הריאליות של לאומי פרטנרס ומזרחי טפחות אינווסט ● בנוסף לפעילות התחבורה, הנכסים של דן גם כוללים גם זרוע נדל"נית שמקימה משרדים ומבני מגורים

עסקאות השבוע / עיצוב: טלי בוגדנובסקי

"אנשים מחכים לירידת מחיר נוספת": בכמה נמכרה דירת 5 חדרים בצפת?

דירת 5 חדרים בצפת, בשטח של 120 מ"ר עם מרפסת בשטח של כ־20 מ"ר נמכרה תמורת 1.96 מיליון שקל ● המוכרים הם משפחה חרדית שגרה בדירה והקונים הם משפחה חרדית מהאזור ● "אנשים חושבים שהמחירים עוד לא הגיעו לתחתית. הם ראו שהמחירים ירדו והם מחכים לירידה נוספת" ● ועוד עסקאות נדל"ן מהשבוע האחרון

אוטובוס של דן / צילום: Shutterstock

לידיעת חברי דן: זה הרווח הפנטסטי של בעלי השליטה

קבוצת ווליו-LBH של ווליו בייס, יאיר אפרתי, עופר לינצ'בסקי ושמעון בן חמו תפיק רווח מוערך של פי 5 (כ-2 מיליארד שקל) על השקעתה בחברת התחבורה הציבורית

נתב''ג / אילוסטרציה: עידו וכטל, ארקיע

כך תוכלו להגיע לנתב״ג בשבת, ובלי מונית ספיישל

מיזם התחבורה של עיריית תל אביב נעים בסופ"ש מרחיב את פעילותו ומשיק קו אוטובוס שיהווה חיבור ישיר לנתב”ג במהלך סוף השבוע ● הקו שמחבר בין שוהם לתל אביב, יעבור דרך טרמינל 1 בשני הכיוונים ויאפשר לנוסעים הממריאים או נוחתים בשבת להגיע לשדה וממנו ללא תשלום

דונגפנג M-HERO / צילום: יח''צ

עם תג מחיר יוקרתי ויכולות שטח קיצוניות: האם הרכב הזה שווה 700 אלף שקל?

רכב השטח החשמלי הענק דונגפנג M-HERO עולה כמו דגמים של מותגי פרימיום מערביים, אבל יש לו מערכת הנעה ויכולות שטח שמקדימות את המתחרים בכמה שנים ● חבל רק שהטווח החשמלי מגביל אותו

הצ'אטבוט של קלוד / צילום: Shutterstock

אנתרופיק מגייסת 30 מיליארד דולר לפי שווי של 380 מיליארד דולר

החברה שמאחורי הצ'אטבוט קלוד מדווחת על קצב הכנסות שנתי של 14 מיליארד דולר ומושכת ענקיות השקעה לסבב הגיוס הגדול בתולדותיה ● לדברי החברה, יותר מ-500 ארגונים משלמים מעל מיליון דולר בשנה עבור שימוש במודלים ובמוצרים שלה

דונלד טראמפ, בנימין נתניהו, עלי חמינאי / עיבוד: ap, Mark Schiefelbein

טראמפ על השאלה אם יש דד ליין לאיראן: "כן, בראש שלי, יש לי"

טראמפ:  "אני חושב שהמו"מ יהיה מוצלח, ואם לא זה יהיה רע לאיראן" ● איראן דורשת מארה"ב: תגיעו "ללא דרישות מופרזות" ● אחרי האיומים של טראמפ: נושאת המטוסים "ג'רלד פורד" תעזוב את הים הקריבי - ותגיע לאזור ● כלי תקשורת בארה"ב מדווחים כי הצבא האמריקאי יפנה בימים הקרובים בסיס גדול במזרח סוריה ● רויטרס: טראמפ עומד להודיע על תוכנית בשווי מיליארדי דולרים עבור עזה בפגישת מועצת השלום הראשונה בשבוע הבא ● עדכונים שוטפים 

אלכסיי נבלני / צילום: ap, Alexander Zemlianichenko

אירופה מאשימה את רוסיה: נבלני נרצח על ידי רעל צפרדעים

אירופה מאשימה את רוסיה בהרעלת מנהיג האופוזיציה אלכסיי נבלני לאחר שבגופו נמצא הרעלן הנדיר אפיבטידין, שמקורו בצפרדעים ארסיות מאקוודור ● בריטניה טוענת שרק למוסקבה הייתה יכולת להשתמש ברעלן ותפנה לארגון לאיסור נשק כימי בהאשמה נגד הפרת האמנה ● הקרמלין טרם הגיב

יאיר בקייר ומנות של ''בואו''. ''רצינו מקום עכשווי'' / צילומים: עמית נעים וחיים יוסף

"מסעדן טוב יודע לחיות את הקושי הגדול והסיזיפיות, וגם לייצר שואו כל יום מחדש"

יאיר בקייר פועל כבר 30 שנה בסצנה הקולינרית הישראלית כמסעדן, יזם, יועץ ומפיק ● אחרי עשור מחוץ למסעדנות הממוסדת, הוא חוזר עם "בואו", המסעדה החדשה שלו ושל השף תומר טל בתל אביב ● בראיון לגלובס הוא מדבר על הכישלונות ("צברתי חוב של חצי מיליון שקל"), על חיי המסעדן ("זה להיות סטורי טלר"), ואיך הוא שוב מצא את עצמו בפלור: "בסוף אני איש של אנשים"

למה כל כך קשה להיפרד ממטפלים / איור: Shutterstock

למה כל כך קשה להיפרד מפסיכולוגים

כמה שנים משכתם טיפול שלא התאים לכם רק כי לא היה לכם נעים לסיים? ● מחקרים חדשים שופכים אור על הסיבות שמסבכות פרידה ממטפלים, וגם על הדרך להגיע לסוף טוב ● כך זה נראה משני צדי הכורסה

כריכת הספר ''אף פעם''. בעיגול: נורית זרחי / צילום: תמר מצפי

הקומיקס החדש של נורית זרחי מתפרץ לנושא הנפיץ ביותר שספרי ילדים מדלגים מעליו

ממלכת הילדים של נורית זרחי אף פעם לא פחדה לארח היבדלות ואפילו אכזריות אנושית ● הפעם, בעשור התשיעי לחייה, סופרת הילדים מפציעה עם קומיקס על המוות, הכתוב בהומור שירכך את לבם של קוראים צעירים ומבוגרים כאחד

דוד צרויה, מנכ''ל פלוס500 / צילום: נתנאל טוביאס

שוקי החיזוי מגלגלים מיליארדים בניבוי העתיד, אך בישראל אין עליהם פיקוח

שוקי החיזוי דוהרים למחזור של טריליון דולר והופכים ללהיט התורן של עולם ההשקעות ● הכניסה של Plus500 הישראלית מעוררת את המשקיעים, אך בישראל הרגולציה נותרה מאחור

המשלחת הישראלית באולימפיאדת החורף / צילום: Hassan Ammar, AP

מה משותף ללברון ג'יימס, ג'ורג' קלוני וג'סטין טימברלייק?

איזו מדינה הודיעה לאחרונה על יוזמה להנפקת דרכונים לגמלים שבשטחה, באיזה ענף באולימפיאדת החורף מתחרה השנה לראשונה נבחרת ישראלית, ואיך נקראת הרשת החברתית לבוטים של בינה מלאכותית? ● הטריוויה השבועית

זוהרן ממדאני / צילום: Reuters, Derek French

עיריית ניו יורק "זרקה" חברת רחפנים שעובדת עם ישראל

עיריית ניו יורק החליטה שלא לחדש את חוזה השכירות של חברת הרחפנים Easy Aerial במבנה שבבעלותה ● לפי ה"ניו יורק פוסט", החברה סיפקה אמצעים לישראל לפעילות באזור גבול רצועת עזה ● דוברת המתחם הכחישה ואמרה כי אי־חידוש הסכם השכירות נבע "מסיבות עסקיות"

מל''ט מסוג הרמס 900 / צילום: אלביט מערכות

השימוש המפתיע למל"ט של אלביט

סינגפור הציגה בסלון האווירי שקיימה מערכות מתוצרת אלביט שתשמש למניעת דיג בלתי חוקי ● טורקיה מרחיבה את פעילותה במזרח התיכון עם הקמת מספנות בערב הסעודית ● וגם: רוסיה נהנית מהביקושים הגדולים בעולם למוצרים ביטחוניים ● השבוע בתעשיות הביטחוניות

וול סטריט / צילום: ap, Mary Altaffer

נעילה מעורבת בוול סטריט; קצב האינפלציה השנתי בארה"ב ירד בינואר ל-2.4%

לאחר שפל של 30 שנה, הדולר מתחזק היום מול השקל ● גם הזהב מתאושש קלות ●  פינטרסט צונחת לאחר שהחברה פרסמה תוצאות חלשות לרבעון הרביעי שהחמיצו את התחזיות ● נעילה מעורבת באירופה ● באסיה ננעל המסחר בירידות ● עדכונים שוטפים

פתיחת המסחר לשנת 2026 בבורסת דרום קוריאה / צילום: Reuters, Matrix Images/Jung Ui-Chel

"אנחנו בשוק שורי עולמי": המרדף של משקיעים בוול סטריט אחר מניות זולות יותר נעשה גלובלי

תמחורים גבוהים והיחלשות הדולר מניעים את ההימורים על כך שהיתרון של ארה"ב על פני שווקים גלובליים אחרים יצטמצם ● הדבר מוביל מנהלי השקעות לחפש תשואות במזרח הרחוק ובאירופה ● עם זאת, רובם לא ממהרים להספיד את השוק האמריקאי