גלובס - עיתון העסקים של ישראלאתר נגיש

מודל GPT-5 יצא לשוק. עד כמה הצ'אט השתפר?

OpenAI השיקה את מודל הבינה המלאכותית החדש שלה, והבטיחה ביצועים מהירים יותר, לצד זכירת המשתמש ופיצ'רים כמו מצב אוטומטי, למידה ויכולת כתיבת קוד ● בפועל, השינויים מינוריים למדי

תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט
תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט

התחרות על הבינה המלאכותית מתעצמת, ובסוף השבוע שעבר הכריזה חברת ה-AI שמובילה את התחום, OpenAI, על המודל החדש ביותר שלה - GPT-5. החברה הבטיחה שמדובר במודל חכם, מהיר ושימושי יותר, בוודאי אם מדברים על כתיבה, קידוד ונושאי בריאות. בנוסף, היא השיקה את המודל לכולם, כולל למשתמשים החינמיים.

בדיקה טכנולוגית | היצרנית טוענת שזה מכשיר הדגל הראשון שלה. אז בדקנו
בדיקה טכנולוגית | האם המתקפל החדש של סמסונג שווה 7,500 שקל?

בדקנו את הכלי החדש בשפה העברית, וחזרנו עם תשובות - האם הוא מציע שיפור משמעותי שמצדיק את העדכון?

החידוש העיקרי: הביצועים, לצד הביקורת

שנתיים חלפו מאז שחרור הדור הקודם, אבל קשה לדבר על ה-GPT-5 ככזה שמביא בשורה אדירה. בדומה להשקות של סמארטפונים מדי שנה, שבהן החברות מבטיחות שהמכשיר כעת הרבה יותר טוב - גם כאן, OpenAI סיפקה מודל שמבחינת הבנצ'מרק ביחס לשוק מציע ביצועים משופרים ומהירים יותר, אבל עבור רבים, באופן לא מאוד מורגש.

בזמן שהמנכ"ל סם אלטמן סיפר כי "ניסיתי לחזור ל-GPT-4, וזה היה די אומלל", ולעומת זאת לדבר עם המודל החדש זה כמו לדבר עם דוקטור, בשוק פחות מסכימים איתו. יתרה מכך, ברשת היו מי שהתחננו לקבל בחזרה את הדור הקודם - מה שהוביל לכך שאלטמן החליט לאפשר למי שרוצה לחזור ל-4o לפחות לתקופה הקרובה.

מי שהשתמש ב־GPT-4o, זוכר את הסגנון החמים והחברי שלו - בין היתר, הצ'אט נהג להחמיא יתר על המידה, וטען כי השאלה ששאלתם היא השאלה המבריקה ביותר שהייתה יכולה להישאל. כעת סגנון השיחה השתנה, ההוא תכליתי ומדויק יותר, ובמידה מסוימת אפילו מרוחק. גם רמת השימוש באימוג'י התמתנה משמעותית, כאילו המודל התבגר. ולא כולם אוהבים את זה.

כאשר שאלנו אותו על כך, הוא הסביר שזה אחד השיפורים שנעשו, ואפשר "לחזור אחורה", רק צריך לבקש. מכיוון שהצ'אט זוכר את השיחות, ההעדפה הזו יכולה להשתמר.

אחד החידושים הוא שהמודל יכול כעת לכתוב קוד, משמע היכולת הזו היא כבר לא רק בידי מתכנתים. כך, לדוגמה, בנינו תוך מספר דקות עמוד נחיתה לאחד מכתבי גלובס - המערכת ביקשה לדעת מהיכן רוצים למשוך את הנתונים, ובנתה את העמוד.

בהשקה הדגימו כיצד המודל בנה אפליקציה ללימוד שפה בקלות, אך כשאנחנו ביקשנו ממנו אפליקציה למעקב אחר קלוריות, הוא הציג תוצאה ראשונה לא מספקת, ונדרשו תיקונים. גם לאחר התיקונים התוצאה עדיין לא הייתה מושלמת, אך זה הגיוני. עם זאת, לא תמיד שמר על ההתקדמות - משמע, אחרי שביקשנו ממנו לתקן משהו אחד, דבר אחר באפליקציה נעלם.

היתרון הבולט: ההתאמה האישית

אחד היתרונות המרכזיים של OpenAI הוא שהמודל זוכר את המשתמש, יכולת שגם גוגל הכריזה עליה השבוע. המשמעות היא שלא בכל שיחה "מתחילים מההתחלה", ושהמודל זוכר את ההעדפות ואת השאלות הקדומות, וכך מספק מענה הרבה יותר טוב.

היכולת הזו מצטרפת לשיפורים הנוספים בצ'אט: קודם כל, אפשר לעצב את הצבעים שלו, וגם לכוונן את ה"אישיות" שלו - משמע, לבקש ממנו להיות מתחשב ותומך, סרקסטי, ציניקן, רובוטי, חנון ועוד. יש גם שיפורים בקול של הצ'אט.

שיפור נוסף שעתיד לחזק את ההתאמה האישית למשתמשים הוא חיבור יומן הגוגל וחשבון ה־Gmail שלכם, כך שהצ'אט יוכל לענות על שאלות בלוח הזמנים שלכם, ולהציע לכם דברים. כמובן של־Gemini של גוגל כבר יש את החיבור המדובר, ואפילו בקלוד של אנתרופיק יש חיבור למוצרי גוגל.

אחד הפיצ'רים החדשים ש-OpenAI הכניסה הוא מצב Auto. בדרך כלל יש שתי אפשרויות: מצב מהיר, שבו מתקבל מענה מהיר מהמודל, ומצב חושב, שמתרחש במשימות שלוקחות זמן רב יותר, דורשות מחקר או קידוד. עד כה הייתם צריכים לבחור בין האפשרויות השונות, כדי שהמודל יבין מה אתם רוצים. במצב Auto המודל מבין לבד מתוך השאלה באיזה מודל עליו להשתמש - תגובה מהירה או חשיבה עמוקה.

מצב למידה: תסביר שלב-שלב

פיצ'ר חדש נוסף הוא מצב למידה. הרעיון הוא שאפשר לבקש מהמודל לענות על שאלה תוך שהוא עובר שלב־שלב בפתרון הבעיה, ומציג את הרציונל מאחורי התשובה שלו.

כך, לדוגמה, נתנו למודל שאלה ברמת 5 יחידות במתמטיקה, וביקשנו שיפתור את התרגיל במצב למידה. המודל קבע שבכל מענה ייפתר סעיף בודד, כדי לאפשר הבנה עמוקה יותר. בפועל, המודל ענה על הסעיף הראשון הפשוט באיטיות רבה יותר מאשר בתשובה מהירה, אבל סיפק מענה נכון. עם זאת, כשהגיע לסעיף השני, אף הוא פשוט ולא דורש המון חשיבה, לקח לו הרבה יותר זמן.

בסך הכול, הוא ענה על כמעט כל הסעיפים בפעימה אחת, ואף דילג על חלק משלבי הפתרון. המשמעות היא שהוא לא המשיך במצב למידה כפי שהתבקש. לצד זאת, וכנראה בגלל התאימות לשפה העברית, המודל הציג חלק מהתשובות בצורה הפוכה.

בחנו את GPT-5 גם בתרגיל מילולי שקשור בהבנת הטקסט מתוך מבחן אוניברסיטאי. המודל ערבב בין הפרטים, מה שהוביל לכך שהוא פתר את השאלה בצורה לא מדויקת. הדוגמאות האלו נקודתיות, אבל הן עדיין מראות את הפער שיש בהבנת המודל. הוא עדיין לא שולט היטב בשפה העברית, ובמקרה אחר הוא אף היפנה לעמודים לא נכונים. בקצרה, הרעיון מעולה, אבל הביצועים עדיין לא.

המחיר והמגבלות: מה תוכלו לקבל?

ב-OpenAI מאפשרים לצרכנים לעשות שימוש חינמי מוגבל, כך שבשלב מסוים הם יעברו למודל מיני חלש יותר. מי שמשלם למסלול
ה-Plus 02 דולר בחודש יקבל מגבלת שימוש גבוהה יותר, ומי שמשלם 200 דולר בחודש עבור מודל הפרו יקבל גישה בלתי מוגבלת, ואף גישה למודל חזק יותר.

בחברה מדברים על כך שהמודל השתפר מאוד בכל הנוגע להטיות או לתשובות לא נכונות. עם זאת, בשימוש הקצר שעשינו עד כה, לא הרגשנו דרמטית את השינויים האלו. המודל עדיין עשה טעויות ועדיין הציג "הזיות", לפחות בשפה העברית.

באופן כללי, בלא מעט מקרים שהמודל נדרש לתקן טעות שלו, הוא הפעיל באופן עצמאי את החשיבה העמוקה כדי למצוא פתרון הגיוני וטוב יותר. כמובן שזה לקח יותר זמן, אבל לפחות זה תיקן את הטעות.

עוד כתבות

''אחרי המסיבה''. הצעקה שמטלטלת הכול / צילום: באדיבות סלקום טי.וי

הדרמה שנחשבת לאחת הטובות של השנה ומגיעה מניו זילנד

"אחרי המסיבה" היא מיני־סדרה ניו זילנדית שהגיעה למסך הישראלי ומציעה דרמה מטלטלת על אמת שנאמרת בקול רם מדי עבור קהילה שמעדיפה שקט ● מורה לביולוגיה מאשימה את בעלה בהטרדת נער, חייה מתפרקים והעיירה כולה נאלצת לבחור צד

מייקל ברי

מייקל ברי מזהיר: זוהי "מלכודת המיליארדים" של אנבידיה

למרות תחזית חזקה להמשך, מניית אנבידיה נופלת במסחר בוול סטריט ● מייקל ברי: הסיכון שלה גדל, אנבידיה עלולה להיתקע עם התחייבויות ענק ל-TSMC ועם מלאי שאין לו קונה - מצב שעלול לרסק את שולי הרווח שלה

פעילות מערכות ההגנה האווירית במהלך מבצע עם כלביא / צילום: משרד הביטחון

הטילים האיראניים שמאיימים על ישראל, ומערכות ההגנה נגדם

איראן מאיימת בתגובה חריפה אחרי התקיפות הישראליות והאמריקאיות ● מהן מערכות ההגנה האווירית הישראליות, אילו טילים נמצאים בארסנל האיראני, ומה קורה אם האיומים מגיעים מכיוון הים? ● גלובס עושה סדר

נמל התעופה בן גוריון ריק מנוסעים לאחר מבצע עם כלביא, ארכיון / צילום: ap, Ariel Schalit

לא יחזרו עד ה-7 במרץ לפחות: חברות התעופה הזרות שהתחילו לבטל טיסות

המרחב האווירי בישראל נסגר בעקבות פתיחת מתקפת המנע וההתפתחויות הביטחוניות, ונכון לעכשיו הסגירה מוגדרת עד יום שני ● עם זאת, חברות התעופה כבר מתחילות להאריך את הביטולים מעבר למועד זה ● קבוצת לופטהנזה וחברת Wizz Air הודיעו כי טיסותיהן לישראל יושבתו עד 7.03 כולל

בלי נופים, טיולים ואטרקציות: ברוכים הבאים לחופשות השינה / צילום: Shutterstock

עם 16 שעות שינה ובלי אטרקציות: הכירו את טרנד החופשות החדש

סוכריות גומי עם שמן קנאביס, כריות שזוכרות את מבנה הראש וגם מיטות שמנתחות את איכות השינה ● קבוצה הולכת וגדלה של נופשים חיפשה פתרון לעייפות - ופיתחה טרנד שהיא מכנה sleepcation ● תעשיית האירוח מציעה ועוד ועוד שדרוגים, אבל מומחים מזהירים: "זה אינו פתרון משמעותי לחוסר"

משמרות המהפכה באיראן / צילום: ap, Vahid Salemi

בני סבטי: "האיראנים הרבה יותר חצופים, נועזים ומאיימים ביחס לשנה שעברה"

הטרמינולוגה האיראנית כנגד ארה"ב החריפה בשבועות האחרונים, וזאת למרות מלחמת 12 הימים בה הופצצו ונפגעו אתרים אסטרטגיים ברחבי המדינה ע"י ממשל טראמפ וישראל ● "ההבדל הגדול בין מבצע עם כלביא לימים אלו, הם הפגנות ההמונים כנגד המשטר בה נטבחו עשרות אלפי מפגינים", מציין בני סבטי, מומחה לענייני איראן

תור לקוםות בסניף של טיב טעם, הבוקר / צילום: באדיבות עובדי טיב טעם

הבהלה לנייר טואלט: התנפלות על רשתות השיווק. אלה המוצרים המבוקשים

בעקבות התקיפה באיראן והאזעקות הבוקר, נרשמה עלייה של מאות אחוזים בתנועת הלקוחות ברשתות הפתוחות בשבת עם זינוק בביקושים למים, שימורים ונייר טואלט ● ברשתות מדגישים כי אין מחסור וכי המלאים מלאים, בעוד שירותי המשלוחים המהירים הושבתו בהתאם להנחיות פיקוד העורף

עשן מתנשא מעל מרכז העיר טהרן לאחר פיצוץ, הבוקר / צילום: Reuters, Anadolu

שעות לפני התקיפה: פלטפורמת ההימורים התחילה לגעוש

בזמן שמערכות המכ"ם התחממו, פלטפורמת "פולימרקט" כבר הראתה זינוק של 100% בהסתברות לעימות ● אחרי שהשוק "סגר את הפינה" על התקיפה האמריקאית הקרובה, השאלה הגורלית על עתיד המשטר ב-2027 נסחרת כעת ביותר מ־50%

הר תנופה. יש גם סחלבים / צילום: יובל אינהורן

כלניות בשלושה צבעים וסחלב במופע נדיר: מסלולי הפריחה שלא הכרתם

בימים שבהם נדמה שעל כל כלנית צצים עשרה מדריכים שיסבירו לכם איך להגיע אליה באפס מאמץ, הכנו לכם שלוש המלצות לטיולי פריחה דווקא למיטיבי הלכת

ג'ק דורסי, מייסד טוויטר וסקוור / צילום: Shutterstock, Frederic Legrand - COMEO

היזם שמפטר 4,000 עובדים ביום אחד. מה הוא יודע שאנחנו לא

גל פיטורים נוסף; ג'ק דורסי, ממייסדי טוויטר ומנכ"ל חברת התשלומים האמריקאית בלוק, הודיע בדואר אלקטרוני לבעלי המניות שלו כי החברה תקצץ קרוב למחצית מעובדיה ● בלוק, שנסחרת בבורסת ניו יורק לפי שווי שוק של 33 מיליארד דולר, ייצרה רווח נקי של כחצי מיליארד דולר ברבעון השלישי של השנה שעברה ● המנייה זינקה במסחר המאוחר בכ- 24%

סמטת דיאגון מתוך ''הארי פוטר'' באולפני הוורנר ברדרס / צילום: ap, Ross D. Franklin

מהפך דרמטי בארה"ב: בוורנר ברדרס מעדיפים את ההצעה המשופרת של פרמאונט, נטפליקס נסוגה

לאחר שחתמה עם נטפליקס בחודש דצמבר על עסקה שהוערכה בכ-83 מיליארד דולר, חברת וורנר ברדרס מסרה אמש כי הצעתה המשופרת של חברת פרמאונט בסך 111 מיליארד דולר "עדיפה" ● מנכ"לי נטפליקס בתגובה הלילה: "העסקה כבר אינה אטרקטיבית מבחינה כלכלית"

סקוט ראסל מנכ''ל נייס / צילום: באדיבות נייס

השכר נחשף: כמה הרוויח מנכ"ל נייס בשנת 2025?

חברת התוכנה נייס פרסמה הלילה את מסמך ה-20F שלה לשנת 2025 וחשפה את עלות שכרו של המנכ"ל שעמדה על 12.7 מיליון דולר, בעיקר באמצעות תגמול הוני ● וכמיטב המסורת של נייס, גם שאר בכירי החברה נהנו משכר גבוה

עלי חמינאי / צילום: ap, Office of the Iranian Supreme Leader

הפלת המשטר באיראן? כדאי קודם לדעת איך הוא בכלל בנוי

המנהיג העליון והנשיא על הכוונת הישראלית-אמריקאית, אבל איראן בנתה משטר עם מבנה הרבה יותר מסובך • המשרוקית של גלובס מסבירה: כך מורכב שלטון האייתוללות

עלי חמניאי, מנהיג איראן / צילום: ap

כמעט ארבעים שנה של דיכוי וטרור: מי הוא עלי חמינאי?

לפי הערכות, המנהיג העליון של איראן, עלי חמינאי, חוסל הבוקר במכת הפתיחה של מבצע "שאגת האריה" - מהלך דרמטי שעלול לטלטל את מוקדי הכוח בטהרן ולשנות את מאזן ההרתעה האזורי לאחר יותר משלושה עשורים בהם חלש על השלטון

איזו בשורה יקבלו בקרוב 700 אלף עובדי המגזר הציבורי?

מה הם היעדים המבוקשים לרילוקיישן מצד ישראלים עשירים, ומדוע הנגיד הותיר את הריבית על כנה? ● חושבים שאתם בקיאים בכל מה שקרה השבוע בכלכלה בארץ ובעולם? בואו לבחון את הידע שלכם ● החידון הכלכלי של גלובס

נתב''ג / אילוסטרציה: עידו וכטל, ארקיע

נתקעתם בחו"ל? מתי ואיך תוכלו לחזור לישראל

המרחב האווירי סגור ונתב״ג מושבת לפחות עד יום שני, ובינתיים כ־150 אלף ישראלים שוהים בחו"ל ואינם יכולים לשוב ארצה ● במשרד התחבורה נערכים למבצע דרך האבים מרכזיים באירופה, ארה״ב ואסיה, ובמקביל נשקלת האפשרות לצו חירום שיצמצם זמנית את חובות חברות התעופה כלפי הנוסעים ● איך יראה מבצע החילוץ ומתי יתאפשר לטוס חזרה לישראל? ● גלובס עושה סדר

חוקרים במעבדה של פרופ' אריאל קושמרו, אוניברסיטת בן גוריון / צילום: דני מכליס

באיזה אזור בארץ סובלים הכי הרבה מסטרס? התשובה אצל חיידקי הביוב

במעבדה של פרופ' אריאל קושמרו, מהפקולטה להנדסת ביוטכנולוגיה באוניברסיטת בן גוריון, חוקרים איך אפשר לנצל חיידקים כדי למנוע מפגעים בריאותיים וסביבתיים ● מניבוי אזורי מצוקה בעיר ועד מניעת חורים בשיניים ואפשרות לפתח אנטיביוטיקה מהים

אנשים מנסים לתפוס מחסה בעקבות פיצוץ, טהרן הבוקר. ניו יורק טיימס מדגיש כי התקיפה התבצעה בשעת העומס / צילום: Reuters

דיווחים על מבצע שתוכנן חודשים ופינוי חמינאי: כך מתפתח הסיקור העולמי

כלי תקשורת מובילים בארה"ב מדווחים על תקיפות אמריקאיות ישירות, ועל ריכוז כוחות חסר תקדים באזור, הגדול מאז 2003 ● באירופה שונה המסגור הראשוני כדי לכלול את וושינגטון כשותפה מלאה למהלך, וכן דווח כי המנהיג העליון חמינאי הובל למקום בטוח מחוץ לבירה ● הניו יורק טיימס מציין כי התקיפות התרחשו בשעה שמיליונים בדרכם למקומות עבודה ולבתי ספר, וב-CNN מתמקדים גם בהשלכות הכלכליות

צחי נחמיאס / צילום: ורד פיצ'רסקי

צחי נחמיאס מכה בברזל החם: הנפקת ענק לאחר דוח חזק

מגה אור מגייסת 615 מיליון שקל בהנפקה פרטית למנורה ומגדל ● ההנפקה מתבצעת בפרמיה של 5% על מחיר הנעילה בבורסה

פעמון הבורסה בתל אביב / צילום: Shutterstock

מיהי חברת הסייבר העולמית שהחלה להיסחר השבוע בתל אביב?

במגילת אסתר מי היה המדתא, מה שמו העברי של הירק קייל, ואיזה אירוע צולם ושודר בטלוויזיה הרומנית בערב חג המולד 1989? ● הטריוויה השבועית