גלובס - עיתון העסקים של ישראלאתר נגיש

מודל GPT-5 יצא לשוק. עד כמה הצ'אט השתפר?

OpenAI השיקה את מודל הבינה המלאכותית החדש שלה, והבטיחה ביצועים מהירים יותר, לצד זכירת המשתמש ופיצ'רים כמו מצב אוטומטי, למידה ויכולת כתיבת קוד ● בפועל, השינויים מינוריים למדי

תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט
תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט

התחרות על הבינה המלאכותית מתעצמת, ובסוף השבוע שעבר הכריזה חברת ה-AI שמובילה את התחום, OpenAI, על המודל החדש ביותר שלה - GPT-5. החברה הבטיחה שמדובר במודל חכם, מהיר ושימושי יותר, בוודאי אם מדברים על כתיבה, קידוד ונושאי בריאות. בנוסף, היא השיקה את המודל לכולם, כולל למשתמשים החינמיים.

בדיקה טכנולוגית | היצרנית טוענת שזה מכשיר הדגל הראשון שלה. אז בדקנו
בדיקה טכנולוגית | האם המתקפל החדש של סמסונג שווה 7,500 שקל?

בדקנו את הכלי החדש בשפה העברית, וחזרנו עם תשובות - האם הוא מציע שיפור משמעותי שמצדיק את העדכון?

החידוש העיקרי: הביצועים, לצד הביקורת

שנתיים חלפו מאז שחרור הדור הקודם, אבל קשה לדבר על ה-GPT-5 ככזה שמביא בשורה אדירה. בדומה להשקות של סמארטפונים מדי שנה, שבהן החברות מבטיחות שהמכשיר כעת הרבה יותר טוב - גם כאן, OpenAI סיפקה מודל שמבחינת הבנצ'מרק ביחס לשוק מציע ביצועים משופרים ומהירים יותר, אבל עבור רבים, באופן לא מאוד מורגש.

בזמן שהמנכ"ל סם אלטמן סיפר כי "ניסיתי לחזור ל-GPT-4, וזה היה די אומלל", ולעומת זאת לדבר עם המודל החדש זה כמו לדבר עם דוקטור, בשוק פחות מסכימים איתו. יתרה מכך, ברשת היו מי שהתחננו לקבל בחזרה את הדור הקודם - מה שהוביל לכך שאלטמן החליט לאפשר למי שרוצה לחזור ל-4o לפחות לתקופה הקרובה.

מי שהשתמש ב־GPT-4o, זוכר את הסגנון החמים והחברי שלו - בין היתר, הצ'אט נהג להחמיא יתר על המידה, וטען כי השאלה ששאלתם היא השאלה המבריקה ביותר שהייתה יכולה להישאל. כעת סגנון השיחה השתנה, ההוא תכליתי ומדויק יותר, ובמידה מסוימת אפילו מרוחק. גם רמת השימוש באימוג'י התמתנה משמעותית, כאילו המודל התבגר. ולא כולם אוהבים את זה.

כאשר שאלנו אותו על כך, הוא הסביר שזה אחד השיפורים שנעשו, ואפשר "לחזור אחורה", רק צריך לבקש. מכיוון שהצ'אט זוכר את השיחות, ההעדפה הזו יכולה להשתמר.

אחד החידושים הוא שהמודל יכול כעת לכתוב קוד, משמע היכולת הזו היא כבר לא רק בידי מתכנתים. כך, לדוגמה, בנינו תוך מספר דקות עמוד נחיתה לאחד מכתבי גלובס - המערכת ביקשה לדעת מהיכן רוצים למשוך את הנתונים, ובנתה את העמוד.

בהשקה הדגימו כיצד המודל בנה אפליקציה ללימוד שפה בקלות, אך כשאנחנו ביקשנו ממנו אפליקציה למעקב אחר קלוריות, הוא הציג תוצאה ראשונה לא מספקת, ונדרשו תיקונים. גם לאחר התיקונים התוצאה עדיין לא הייתה מושלמת, אך זה הגיוני. עם זאת, לא תמיד שמר על ההתקדמות - משמע, אחרי שביקשנו ממנו לתקן משהו אחד, דבר אחר באפליקציה נעלם.

היתרון הבולט: ההתאמה האישית

אחד היתרונות המרכזיים של OpenAI הוא שהמודל זוכר את המשתמש, יכולת שגם גוגל הכריזה עליה השבוע. המשמעות היא שלא בכל שיחה "מתחילים מההתחלה", ושהמודל זוכר את ההעדפות ואת השאלות הקדומות, וכך מספק מענה הרבה יותר טוב.

היכולת הזו מצטרפת לשיפורים הנוספים בצ'אט: קודם כל, אפשר לעצב את הצבעים שלו, וגם לכוונן את ה"אישיות" שלו - משמע, לבקש ממנו להיות מתחשב ותומך, סרקסטי, ציניקן, רובוטי, חנון ועוד. יש גם שיפורים בקול של הצ'אט.

שיפור נוסף שעתיד לחזק את ההתאמה האישית למשתמשים הוא חיבור יומן הגוגל וחשבון ה־Gmail שלכם, כך שהצ'אט יוכל לענות על שאלות בלוח הזמנים שלכם, ולהציע לכם דברים. כמובן של־Gemini של גוגל כבר יש את החיבור המדובר, ואפילו בקלוד של אנתרופיק יש חיבור למוצרי גוגל.

אחד הפיצ'רים החדשים ש-OpenAI הכניסה הוא מצב Auto. בדרך כלל יש שתי אפשרויות: מצב מהיר, שבו מתקבל מענה מהיר מהמודל, ומצב חושב, שמתרחש במשימות שלוקחות זמן רב יותר, דורשות מחקר או קידוד. עד כה הייתם צריכים לבחור בין האפשרויות השונות, כדי שהמודל יבין מה אתם רוצים. במצב Auto המודל מבין לבד מתוך השאלה באיזה מודל עליו להשתמש - תגובה מהירה או חשיבה עמוקה.

מצב למידה: תסביר שלב-שלב

פיצ'ר חדש נוסף הוא מצב למידה. הרעיון הוא שאפשר לבקש מהמודל לענות על שאלה תוך שהוא עובר שלב־שלב בפתרון הבעיה, ומציג את הרציונל מאחורי התשובה שלו.

כך, לדוגמה, נתנו למודל שאלה ברמת 5 יחידות במתמטיקה, וביקשנו שיפתור את התרגיל במצב למידה. המודל קבע שבכל מענה ייפתר סעיף בודד, כדי לאפשר הבנה עמוקה יותר. בפועל, המודל ענה על הסעיף הראשון הפשוט באיטיות רבה יותר מאשר בתשובה מהירה, אבל סיפק מענה נכון. עם זאת, כשהגיע לסעיף השני, אף הוא פשוט ולא דורש המון חשיבה, לקח לו הרבה יותר זמן.

בסך הכול, הוא ענה על כמעט כל הסעיפים בפעימה אחת, ואף דילג על חלק משלבי הפתרון. המשמעות היא שהוא לא המשיך במצב למידה כפי שהתבקש. לצד זאת, וכנראה בגלל התאימות לשפה העברית, המודל הציג חלק מהתשובות בצורה הפוכה.

בחנו את GPT-5 גם בתרגיל מילולי שקשור בהבנת הטקסט מתוך מבחן אוניברסיטאי. המודל ערבב בין הפרטים, מה שהוביל לכך שהוא פתר את השאלה בצורה לא מדויקת. הדוגמאות האלו נקודתיות, אבל הן עדיין מראות את הפער שיש בהבנת המודל. הוא עדיין לא שולט היטב בשפה העברית, ובמקרה אחר הוא אף היפנה לעמודים לא נכונים. בקצרה, הרעיון מעולה, אבל הביצועים עדיין לא.

המחיר והמגבלות: מה תוכלו לקבל?

ב-OpenAI מאפשרים לצרכנים לעשות שימוש חינמי מוגבל, כך שבשלב מסוים הם יעברו למודל מיני חלש יותר. מי שמשלם למסלול
ה-Plus 02 דולר בחודש יקבל מגבלת שימוש גבוהה יותר, ומי שמשלם 200 דולר בחודש עבור מודל הפרו יקבל גישה בלתי מוגבלת, ואף גישה למודל חזק יותר.

בחברה מדברים על כך שהמודל השתפר מאוד בכל הנוגע להטיות או לתשובות לא נכונות. עם זאת, בשימוש הקצר שעשינו עד כה, לא הרגשנו דרמטית את השינויים האלו. המודל עדיין עשה טעויות ועדיין הציג "הזיות", לפחות בשפה העברית.

באופן כללי, בלא מעט מקרים שהמודל נדרש לתקן טעות שלו, הוא הפעיל באופן עצמאי את החשיבה העמוקה כדי למצוא פתרון הגיוני וטוב יותר. כמובן שזה לקח יותר זמן, אבל לפחות זה תיקן את הטעות.

עוד כתבות

ניקולא פוש, היורש (ימין) ואריק פריימונד / אילוסטרציה: איורים: גיל ג'יבלי

תיק הרמס נפתח: היעלמות מניות ב-15 מיליארד דולר, מוות פתאומי וכמה הסברים

ההתאבדות לכאורה של אריק פריימונד, היועץ הפיננסי ליורש רשת מוצרי היוקרה הרמס, מסמנת תפנית דרמטית באחת התעלומות הפיננסיות הגדולות ביותר של המאה ● לפי עורכי דינו, היה פריימונד "אדם בעל רגישות נדירה שנשבר מאלימות החשד, הבגידה ומעולם חסר רחמים"

אוכל וקינוחים בעספורה / צילום: באדיבות עספורה

מאסתם בחופש הגדול? ארבע עגלות קפה ששוות יציאה לטבע גם באוגוסט

כריכים מיוחדים, פיצות עם תוספות לא שגרתיות, עוגות של פעם ובר יין צונן ● עגלות הקפה הבולטות בנוף, שתוכלו להעביר בהן זמן משפחתי

הריסה ובנייה בתל אביב / צילום: שי אשכנזי

"ממש לפני הריסת הבניין התברר שהפרויקט להתחדשות אינו כלכלי"

פרויקטים של התחדשות עירונית שתוכננו לפני 3–4 שנים הופכים להיות לא כלכליים במציאות של זינוק בעלויות הבנייה ● יותר ויותר יזמים מבקשים מהדיירים לשנות את התמורות ברגע האחרון

קונים בפריפריה בתקווה שהמדינה תשפוך הטבות. אתר בנייה באשקלון / צילום: Shutterstock, Yuri Dondish

שוק הדיור שינה מומנטום - אז למה 5,844 ישראלים קנו דירה ביוני?

תחושת עושר קולקטיבית, שוק מניות פורח וגימיקים שיווקיים מצליחים - כל אלה דוחפים אלפי ישראלים לקנות דירה דווקא כשכולם מספידים את השוק ● בין ימי חג, טילים וריבית גבוהה שהורדתה רק מתרחקת, הנתונים מראים: הפסיכולוגיה נשארת חזקה מהסטטיסטיקה

רחוב פועלי הרכבת 13 בגבעתיים / צילום: כדיה לוי

הסיבה שדירה ישנה בגבעתיים נמכרה בכמעט 5 מיליון שקל

לדירה מרפסת גג ענקית ושטחים נוספים בקומת הכניסה ● מחירי הדירות בשכונה מגיעים לכ־40 אלף שקל למ"ר בממוצע ● יש פערים משמעותיים בין דירות חדשות, שיאוכלסו בשנים הקרובות, לדירות שנבנו בשנות התשעים ובתחילת שנות ה־2000

שמעון הולי. פוטנציאל לגעת בכוכבים / צילום: מתוך הסרט ''מחפשים את חיפה''

מה קרה לשמעון הולי: אגדת הגיטרה זוכה לכבוד מחודש

אשף גיטרה חיפאי אבוד, עם אצבעות מכושפות וסיפור מלא תהפוכות, עומד בלב הדוקו המוזיקלי שמקודם בימים אלה בהדסטארט ● הבמאי איתן שריד יצא בחיפוש אחר המיתוס הלוקלי שלא התממש

פיל נייט, מייסד נייקי / צילום: NIKE Inc

שני מיליארד דולר לחקר הסרטן: התרומה הגדולה אי פעם לאוניברסיטה

המייסד השותף של נייקי הודיע כי יתרום סכום ענק של 2 מיליארד דולר לחקר הסרטן באוניברסיטת אורגון ● מדובר בתרומה הגדולה ביותר שהוענקה לאוניברסיטה או מוסד בריאות בארה״ב

טראמפ ופוטין בפסגת אלסקה / צילום: ap, Jae C. Hong

פסגת אלסקה הסתיימה באופן מפתיע. מה צפוי עכשיו?

טראמפ אומר שהוסכמו ״הרבה, הרבה נקודות חוץ מאיזו אחת או שתיים גדולות״. הוא אומר שעסקה לסיום המלחמה תלויה בזלנסקי, והוא מייעץ לו ״לחתום על עסקה״ ● לפי שעה הוא מסיר לפחות את האיום לגרום ״תוצאות חמורות״ לכלכלת רוסיה

חזית ההסברה / צילום: Shutterstock

המוחות הכי מבריקים והכלים הכי מתקדמים נמצאים כאן, אז איך ישראל בכל זאת מפספסת בחזית ההסברה

התעמולה האנטי־ישראלית הפכה לאפקטיבית במיוחד במלחמה. החל מקמפיין ההרעבה שזכה לחשיפה רבה ועד הטענות לטבח מכוון נגד תושבי עזה ● על היעדר ההסברה מחפים חברות ויזמי הייטק מתחת לרדאר, בין היתר באמצעות מערכות להפצת מסרים בעולם, ניטור רשתות בוטים וניסיון להשפיע על הנרטיב השלילי שנוצר לישראל ● אז למה המדינה לא ממנפת את העליונות הטכנולוגית להסברה?

מערכת הלייזר של חברת EOS האוסטרלית / צילום: צילום מסך מיוטיוב

המדינה שמצליחה לעקוף את ישראל ביצוא מערכות לייזר

בעוד שמערכת ההגנה האווירית באמצעות לייזר, מגן אור, צפויה להפוך למבצעית ברבעון האחרון של השנה, חברת EOS האוסטרלית סגרה חוזה בגובה כ-80 מיליון דולר למדינה באירופה ● אוקראינה פיתחה מערכת לייזר קלת־משקל ליירוט רחפנים ● סטארט־אפ ישראלי בתחום סימולציות האימונים מתרחב לתחום הגיימינג ● ודנמרק יוצאת למסע רכש בתחום ההגנה האווירית, מבלי לכלול את ישראל ● השבוע בתעשיות הביטחוניות

סאניווייל, קליפורניה. גוגל התחייבה לבנות 15 אלף יחידות דיור / צילום: Shutterstock

ענקיות הטכנולוגיה התחייבו להשקיע בדיור - התוצאות לא עומדות בציפיות

גוגל, מטא ואפל הקצו מימון במיליארדי דולרים לבנייה של אלפי יחידות דיור, אך חלק מהיוזמות מתעכבות ● מטא התחייבה ב־2019 לתרומת קרקע בשווי 225 מיליון דולר במנלו פארק, אולם הפרויקט עדיין לא נבנה

הפגנה למען שחרור החטופים / צילום: ap, Ohad Zwigenberg

השביתה למען החטופים: האם העובדים יקבלו שכר, ומה אם המעסיק מסרב לשבות

אילו גופים צפויים לשבות היום, האם עובדים שיפגינו זכאים ליום חופש, והאם ישולם שכר גם אם המשרד כולו נסגר? ● גלובס עושה סדר

הצוללת. הילה ויסברג ודין שמואל אלמס בשיחה עם ד''ר יהושוע קליסקי וד''ר גל הררי / צילום: אתר INSS, ניצן סקיבה - דוברות משרד הביטחון

"זה לא יעבוד": הקצין שניהל בעבר את פרויקט הלייזר מגלה את מאחורי הקלעים

שיחה עם ד"ר יהושע קליסקי, חוקר בכיר ב-INSS, וד"ר גל ההרי, מנהל הטכנולוגיות של מפא"ת במשרד הביטחון, על מערכות ההגנה האווירית במלחמה ואיך הן ייראו בעוד כמה שנים ● שדה הקרב העתידי, כתבה שלישית בסדרה

פנחס פוזיילוב / צילום: פוטו ניסים

הוא הגיע ממשפחה עשירה שפשטה רגל ובנה אימפריה. בגיל 97 הוא מדבר על הכל

"כשעזבתי את בית הספר התחלתי לעבוד כשוליה של יהלומן. הייתי צריך ללטש יהלום במינימום נזק, ומהרגע הראשון התברר שאני מסוגל לעשות את זה כמו מישהו עם 20 שנות ניסיון" ● שיחה קצרה עם פנחס פוזיילוב, ממייסדי תעשיית היהלומים בישראל

''מופע הקולנוע של רוקי''. תרבות שנולדת מחופש מוחלט / צילום: Reuters, mptvimages.com

50 שנה של קאלט ב"מופע הקולנוע של רוקי"

סרט הקאלט "מופע הקולנוע של רוקי" חוגג יובל בעותק חדש ומשופץ וממשיך למשוך מעריצים שרופים ● יצירות כמו רוקי צומחות מהשטח והופכות לתופעה חברתית לא בזכות מסחור אלא בזכות חופש, זהות ושייכות שיצר הקהל עצמו

3 פסקי דין בשבוע / צילום: אנימציה: טלי בוגדנובסקי

המשביר חידשה חברות במועדון אוטומטית. בכמה תפצה את הלקוחות?

בית המשפט העליון קובע לראשונה: חברת ביטוח חייבת לשאת גם בהוצאות המשפטיות של הניזוק, ולא רק של המבוטח ● רשת המשביר לצרכן תפצה לקוחות ב־6.75 מיליון שקל, לאחר שחידשה להם חברות במועדון הלקוחות ללא הסכמה ● דור אלון תחויב ביותר מ־5 מיליון שקל על הפעלת תחנת דלק שלא כדין במשך שש שנים ● שלושה פסקי דין בשבוע

שוק השכירות מביא את הכותרת העיקרית / צילום: Shutterstock, Kanjana Kawfang

145 אלף שקל פחות לדירה: איפה נרשמו הירידות הכי משמעותיות?

מדד שירותי דיור בבעלות הדיירים רשם בחודש יולי עלייה של 1.4%, שהיא הגבוהה ביותר מאז אוגוסט 2016, והשלישית בגובהה מאז 2010 ● חודשי הקיץ עד ראש השנה הם חודשים לוהטים גם כך בשוק השכירות, כך שיש להניח שגם החודש הבא יראה עליות משמעותיות ● לעומת זאת, מחירי הדירות דווקא יורדים

מנכ''ל אינטל, ליפ בו טאן / צילום: Reuters, Laure Andrillon

מניית אינטל זינקה לאחר דיווח שממשל טראמפ שוקל רכישת חלק בחברה

העסקה עשויה לסייע לאינטל במאמצי החברה להרחיב את הייצור המקומי ● הבית הלבן לא הגיב מיידית לבקשות לתגובה ● מניית אינטל זינקה במעל  7% והוסיפה לעלות במסחר המאוחר

יו''ר ההסתדרות ארנון בר דוד שיחה עם משפחות החטופים, 11.8.25 / צילום: דוברות ההסתדרות

בין הכלכלי לפוליטי: על סוגי השביתות וההשבתות, ומה אמר ביהמ"ש לגביהם

בשבוע הבא חלקים במשק יושבתו במחאה נגד מדיניות הממשלה בסוגיית החטופים, ולא על תנאי העסקה ● לדבר יש משמעות בסיווג השביתה, ובהתאם ליחס המשפטי אליה ● ובמקביל גם מעסיקים החלו להשתמש בכלי ההשבתה

ראשת ממשלת איטליה ג'ורג'ה מלוני / צילום: Reuters, Domenico Cippitelli

אחרי גרמניה: האם גם הידידה הזו של ישראל תתהפך עלינו?

איטליה הפגינה עד כה מדיניות פרו־ישראלית יחסית, כולל השקעות בארץ ● אך בשבוע האחרון החל הטון להשתנות, ושר הביטחון אף קרא "להטיל סנקציות" ● לאן הולכת מדינת המפתח האירופית שתושביה הם הביקורתיים ביותר כלפי ישראל