גלובס - עיתון העסקים של ישראלאתר נגיש

מודל GPT-5 יצא לשוק. עד כמה הצ'אט השתפר?

OpenAI השיקה את מודל הבינה המלאכותית החדש שלה, והבטיחה ביצועים מהירים יותר, לצד זכירת המשתמש ופיצ'רים כמו מצב אוטומטי, למידה ויכולת כתיבת קוד ● בפועל, השינויים מינוריים למדי

תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט
תמונה שיצר GPT–5 כשהתבקש לתאר ויזואלית את גרסתו החדשה / צילום: צילום מסך מתוך הצ'אט

התחרות על הבינה המלאכותית מתעצמת, ובסוף השבוע שעבר הכריזה חברת ה-AI שמובילה את התחום, OpenAI, על המודל החדש ביותר שלה - GPT-5. החברה הבטיחה שמדובר במודל חכם, מהיר ושימושי יותר, בוודאי אם מדברים על כתיבה, קידוד ונושאי בריאות. בנוסף, היא השיקה את המודל לכולם, כולל למשתמשים החינמיים.

בדיקה טכנולוגית | היצרנית טוענת שזה מכשיר הדגל הראשון שלה. אז בדקנו
בדיקה טכנולוגית | האם המתקפל החדש של סמסונג שווה 7,500 שקל?

בדקנו את הכלי החדש בשפה העברית, וחזרנו עם תשובות - האם הוא מציע שיפור משמעותי שמצדיק את העדכון?

החידוש העיקרי: הביצועים, לצד הביקורת

שנתיים חלפו מאז שחרור הדור הקודם, אבל קשה לדבר על ה-GPT-5 ככזה שמביא בשורה אדירה. בדומה להשקות של סמארטפונים מדי שנה, שבהן החברות מבטיחות שהמכשיר כעת הרבה יותר טוב - גם כאן, OpenAI סיפקה מודל שמבחינת הבנצ'מרק ביחס לשוק מציע ביצועים משופרים ומהירים יותר, אבל עבור רבים, באופן לא מאוד מורגש.

בזמן שהמנכ"ל סם אלטמן סיפר כי "ניסיתי לחזור ל-GPT-4, וזה היה די אומלל", ולעומת זאת לדבר עם המודל החדש זה כמו לדבר עם דוקטור, בשוק פחות מסכימים איתו. יתרה מכך, ברשת היו מי שהתחננו לקבל בחזרה את הדור הקודם - מה שהוביל לכך שאלטמן החליט לאפשר למי שרוצה לחזור ל-4o לפחות לתקופה הקרובה.

מי שהשתמש ב־GPT-4o, זוכר את הסגנון החמים והחברי שלו - בין היתר, הצ'אט נהג להחמיא יתר על המידה, וטען כי השאלה ששאלתם היא השאלה המבריקה ביותר שהייתה יכולה להישאל. כעת סגנון השיחה השתנה, ההוא תכליתי ומדויק יותר, ובמידה מסוימת אפילו מרוחק. גם רמת השימוש באימוג'י התמתנה משמעותית, כאילו המודל התבגר. ולא כולם אוהבים את זה.

כאשר שאלנו אותו על כך, הוא הסביר שזה אחד השיפורים שנעשו, ואפשר "לחזור אחורה", רק צריך לבקש. מכיוון שהצ'אט זוכר את השיחות, ההעדפה הזו יכולה להשתמר.

אחד החידושים הוא שהמודל יכול כעת לכתוב קוד, משמע היכולת הזו היא כבר לא רק בידי מתכנתים. כך, לדוגמה, בנינו תוך מספר דקות עמוד נחיתה לאחד מכתבי גלובס - המערכת ביקשה לדעת מהיכן רוצים למשוך את הנתונים, ובנתה את העמוד.

בהשקה הדגימו כיצד המודל בנה אפליקציה ללימוד שפה בקלות, אך כשאנחנו ביקשנו ממנו אפליקציה למעקב אחר קלוריות, הוא הציג תוצאה ראשונה לא מספקת, ונדרשו תיקונים. גם לאחר התיקונים התוצאה עדיין לא הייתה מושלמת, אך זה הגיוני. עם זאת, לא תמיד שמר על ההתקדמות - משמע, אחרי שביקשנו ממנו לתקן משהו אחד, דבר אחר באפליקציה נעלם.

היתרון הבולט: ההתאמה האישית

אחד היתרונות המרכזיים של OpenAI הוא שהמודל זוכר את המשתמש, יכולת שגם גוגל הכריזה עליה השבוע. המשמעות היא שלא בכל שיחה "מתחילים מההתחלה", ושהמודל זוכר את ההעדפות ואת השאלות הקדומות, וכך מספק מענה הרבה יותר טוב.

היכולת הזו מצטרפת לשיפורים הנוספים בצ'אט: קודם כל, אפשר לעצב את הצבעים שלו, וגם לכוונן את ה"אישיות" שלו - משמע, לבקש ממנו להיות מתחשב ותומך, סרקסטי, ציניקן, רובוטי, חנון ועוד. יש גם שיפורים בקול של הצ'אט.

שיפור נוסף שעתיד לחזק את ההתאמה האישית למשתמשים הוא חיבור יומן הגוגל וחשבון ה־Gmail שלכם, כך שהצ'אט יוכל לענות על שאלות בלוח הזמנים שלכם, ולהציע לכם דברים. כמובן של־Gemini של גוגל כבר יש את החיבור המדובר, ואפילו בקלוד של אנתרופיק יש חיבור למוצרי גוגל.

אחד הפיצ'רים החדשים ש-OpenAI הכניסה הוא מצב Auto. בדרך כלל יש שתי אפשרויות: מצב מהיר, שבו מתקבל מענה מהיר מהמודל, ומצב חושב, שמתרחש במשימות שלוקחות זמן רב יותר, דורשות מחקר או קידוד. עד כה הייתם צריכים לבחור בין האפשרויות השונות, כדי שהמודל יבין מה אתם רוצים. במצב Auto המודל מבין לבד מתוך השאלה באיזה מודל עליו להשתמש - תגובה מהירה או חשיבה עמוקה.

מצב למידה: תסביר שלב-שלב

פיצ'ר חדש נוסף הוא מצב למידה. הרעיון הוא שאפשר לבקש מהמודל לענות על שאלה תוך שהוא עובר שלב־שלב בפתרון הבעיה, ומציג את הרציונל מאחורי התשובה שלו.

כך, לדוגמה, נתנו למודל שאלה ברמת 5 יחידות במתמטיקה, וביקשנו שיפתור את התרגיל במצב למידה. המודל קבע שבכל מענה ייפתר סעיף בודד, כדי לאפשר הבנה עמוקה יותר. בפועל, המודל ענה על הסעיף הראשון הפשוט באיטיות רבה יותר מאשר בתשובה מהירה, אבל סיפק מענה נכון. עם זאת, כשהגיע לסעיף השני, אף הוא פשוט ולא דורש המון חשיבה, לקח לו הרבה יותר זמן.

בסך הכול, הוא ענה על כמעט כל הסעיפים בפעימה אחת, ואף דילג על חלק משלבי הפתרון. המשמעות היא שהוא לא המשיך במצב למידה כפי שהתבקש. לצד זאת, וכנראה בגלל התאימות לשפה העברית, המודל הציג חלק מהתשובות בצורה הפוכה.

בחנו את GPT-5 גם בתרגיל מילולי שקשור בהבנת הטקסט מתוך מבחן אוניברסיטאי. המודל ערבב בין הפרטים, מה שהוביל לכך שהוא פתר את השאלה בצורה לא מדויקת. הדוגמאות האלו נקודתיות, אבל הן עדיין מראות את הפער שיש בהבנת המודל. הוא עדיין לא שולט היטב בשפה העברית, ובמקרה אחר הוא אף היפנה לעמודים לא נכונים. בקצרה, הרעיון מעולה, אבל הביצועים עדיין לא.

המחיר והמגבלות: מה תוכלו לקבל?

ב-OpenAI מאפשרים לצרכנים לעשות שימוש חינמי מוגבל, כך שבשלב מסוים הם יעברו למודל מיני חלש יותר. מי שמשלם למסלול
ה-Plus 02 דולר בחודש יקבל מגבלת שימוש גבוהה יותר, ומי שמשלם 200 דולר בחודש עבור מודל הפרו יקבל גישה בלתי מוגבלת, ואף גישה למודל חזק יותר.

בחברה מדברים על כך שהמודל השתפר מאוד בכל הנוגע להטיות או לתשובות לא נכונות. עם זאת, בשימוש הקצר שעשינו עד כה, לא הרגשנו דרמטית את השינויים האלו. המודל עדיין עשה טעויות ועדיין הציג "הזיות", לפחות בשפה העברית.

באופן כללי, בלא מעט מקרים שהמודל נדרש לתקן טעות שלו, הוא הפעיל באופן עצמאי את החשיבה העמוקה כדי למצוא פתרון הגיוני וטוב יותר. כמובן שזה לקח יותר זמן, אבל לפחות זה תיקן את הטעות.

עוד כתבות

נשיא ארה''ב דונלד טראמפ והמנהיג העליון של איראן עלי חמינאי / צילום: ap, Alex Brandon, khamenei.ir

דיווח: צבא ארה"ב נערך למערכה ארוכה שתימשך שבועות באיראן

האמריקאים עשויים לתקוף גם אתרים של המשטר, ומעריכים שהאיראנים יגיבו ● לקראת סבב המו"מ: וויטקוף העביר מסרים ליועצו הבכיר של ח'אמנאי באמצעות עומאן ● דיווח: צבא ארה"ב נערך למבצע ממושך של כמה שבועות נגד איראן, אם יידרש לכך ● שר החוץ האמריקאי רוביו: "הנשיא טראמפ מעדיף להגיע לעסקה עם איראן, אך זה קשה מאוד" ● עדכונים שוטפים

יאיר בקייר ומנות של ''בואו''. ''רצינו מקום עכשווי'' / צילומים: עמית נעים וחיים יוסף

"מסעדן טוב יודע לחיות את הקושי הגדול והסיזיפיות, וגם לייצר שואו כל יום מחדש"

יאיר בקייר פועל כבר 30 שנה בסצנה הקולינרית הישראלית כמסעדן, יזם, יועץ ומפיק ● אחרי עשור מחוץ למסעדנות הממוסדת, הוא חוזר עם "בואו", המסעדה החדשה שלו ושל השף תומר טל בתל אביב ● בראיון לגלובס הוא מדבר על הכישלונות ("צברתי חוב של חצי מיליון שקל"), על חיי המסעדן ("זה להיות סטורי טלר"), ואיך הוא שוב מצא את עצמו בפלור: "בסוף אני איש של אנשים"

צילומים: AP, רויטרס-KCNA

"תרגיעו": המדינה המפתיעה ששולחת מסר מאיים לסין

אחרי שטבחו באלפים, המשטר האיראני יוצא למלחמה נגד העסקים הקטנים ● הבת של שליט קוריאה הצפונית רק בת 12 וקרובה יותר מתמיד לרשת את השלטון ● וגם: מה גרם למשבר הדיפלומטי בין הסינים לפיליפינים? ● זום גלובלי, מדור חדש

כריכת הספר ''אף פעם''. בעיגול: נורית זרחי / צילום: תמר מצפי

הקומיקס החדש של נורית זרחי מתפרץ לנושא הנפיץ ביותר שספרי ילדים מדלגים מעליו

ממלכת הילדים של נורית זרחי אף פעם לא פחדה לארח היבדלות ואפילו אכזריות אנושית ● הפעם, בעשור התשיעי לחייה, סופרת הילדים מפציעה עם קומיקס על המוות, הכתוב בהומור שירכך את לבם של קוראים צעירים ומבוגרים כאחד

סיכום שווקים שבועי / צילום: Shutterstock

ההימור שעלה ביוקר לקרן העושר הנורבגית - ועוד 4 כתבות על המצב בשווקים

שער הדולר מתקרב לקידומת חדשה: "קשה להצדיק התערבות מצד בנק ישראל" ● הבורסה בת"א שוב שוברת שיאים, אלו הכוחות שמזניקים אותה ● הפספוס של קרן ההשקעות הגדולה בעולם שהלכה נגד ישראל ● ומתי שוק האג"ח עדיף על השקעה במניות ואיפה טמונה בו מלכודת

דונלד טראמפ, בנימין נתניהו, עלי חמינאי / עיבוד: ap, Mark Schiefelbein

טראמפ על השאלה אם יש דד ליין לאיראן: "כן, בראש שלי, יש לי"

טראמפ:  "אני חושב שהמו"מ יהיה מוצלח, ואם לא זה יהיה רע לאיראן" ● איראן דורשת מארה"ב: תגיעו "ללא דרישות מופרזות" ● אחרי האיומים של טראמפ: נושאת המטוסים "ג'רלד פורד" תעזוב את הים הקריבי - ותגיע לאזור ● כלי תקשורת בארה"ב מדווחים כי הצבא האמריקאי יפנה בימים הקרובים בסיס גדול במזרח סוריה ● רויטרס: טראמפ עומד להודיע על תוכנית בשווי מיליארדי דולרים עבור עזה בפגישת מועצת השלום הראשונה בשבוע הבא ● עדכונים שוטפים 

שי דורון

"מסרבת לטיפוסים מגעילים": הכדורסלנית שפתחה בקריירה חדשה ומפתיעה

היא הייתה הישראלית הראשונה בדראפט הליגה הטובה בעולם, אבל את עולם ההון סיכון הכירה מהבית, מאביה שהיה ממקימי גרינפילד פרטנרס ● כיום, כשהיא מנהלת את מועדון האנג'לים Clutch Capital ופעילות של קרן קנדית ציונית, שי דורון מספרת לגלובס למה היא מסרבת לכסף של "טיפוסים מגעילים", ואיך זה מרגיש שהשיחה משתנה מ"אבא של שי" ל"הבת של יהודה" בחדרי הישיבות

חומוס ב–MID BAR / צילום: אורנה בן חיים

כנפיים דביקות והמבורגר מתערובת סודית: זו המסעדה לעצור בה אחרי טיול בדרום

אמנות משרידי טילים, מבחן טעימה עיוורת בגן ירק, המבורגר מתערובת סודית ומשתלה של צמחי בונסאי ● ביקור במושב יתד שבנגב המערבי

המשלחת הישראלית באולימפיאדת החורף / צילום: Hassan Ammar, AP

מה משותף ללברון ג'יימס, ג'ורג' קלוני וג'סטין טימברלייק?

איזו מדינה הודיעה לאחרונה על יוזמה להנפקת דרכונים לגמלים שבשטחה, באיזה ענף באולימפיאדת החורף מתחרה השנה לראשונה נבחרת ישראלית, ואיך נקראת הרשת החברתית לבוטים של בינה מלאכותית? ● הטריוויה השבועית

שדרות. נהנית ממעמד גבוה יחסית לשכנותיה / צילום: Shutterstock

איך חצי קילומטר של שרירותיות תקציבית חרץ את גורלן של שלוש ערי פיתוח

דוח מבקר המדינה חושף כיצד המימון הממשלתי העודף הפך למנוף הכלכלי שהזניק את שדרות לשיא של 81% זכאות לבגרות, בעוד נתיבות ואופקים נותרו מאחור ● כעת, כשהמדינה נערכת לשיקום הדרום, מזהירים המומחים: ללא מודל חדש, תוכניות "חבל התקומה" עלולות להעמיק את העוול

צילומים: Shutterstock / עיבוד: טלי בוגדנובסקי

השוק מתחמם: המתחרות של אובר בוחנות כניסה לישראל

בזמן שהצעת החוק להסדרת שירותי הנסיעות השיתופיות כבר עברה קריאה ראשונה, חברות בינלאומיות ובהן בולט וליפט מקיימות גישושים ראשוניים עם משרד התחבורה ומתכננות ביקור בארץ ● לגלובס נודע שפנגו כבר בוחנת אפשרות לשיתופי פעולה ● במקביל היבואנים ממשיכים להוריד מחירים על רקע השקל המתחזק והדשדוש בביקושים ● השבוע בענף הרכב 

אוטובוס של דן / צילום: Shutterstock

לידיעת חברי דן: זה הרווח הפנטסטי של בעלי השליטה

קבוצת ווליו-LBH של ווליו בייס, יאיר אפרתי, עופר לינצ'בסקי ושמעון בן חמו תפיק רווח מוערך של פי 5 (כ-2 מיליארד שקל) על השקעתה בחברת התחבורה הציבורית

לעבוד בהייטק / צילום: Shutterstock, dotshock

משבר הג'וניורים כבר כאן? מעל 16 אלף מובטלים בהייטק, והשכר עולה

בדוח חדש של שירות התעסוקה עולה כי מגמת העלייה בכמות דורשי העבודה בהייטק מתייצבת ● למרות שמספר המשרות הפנויות בתחומי ההייטק הולך ועולה, הן דורשות ניסיון שאין לרבים מדורשי העבודה בתחום ● פערי השכר בהייטק לעומת האוכלוסייה הכללית התרחב בכ-20% לעומת תחילת 2022

שי אביבי ב''ברנינג מן''. סוגים של ישראליות / צילום: עופר ינוב

על הורות בקולנוע הישראלי אחרי 7 באוקטובר

מ"ברנינג מן" של איל חלפון, ועד "חמצן" של נטעלי בראון שורה של סרטים שיצאו אחרי 7 באוקטובר בוחנים את מחיר ההורות בחברה שבה הילדות מובילה כמעט בהכרח למדים

אילן רום / צילום: יוסי זמיר

"ישראל היא כבר לא מדינת אי": ראיון אופטימי עם מנכ"ל משרד האוצר

עם עבר של 25 שנים במוסד ותואר בארכיאולוגיה, אילן רום אינו מנכ"ל האוצר הטיפוסי ● למרות הביקורת על כך שהכנסת חוררה את חוק ההסדרים, הוא מתגאה: "מעולם לא עברו כל כך הרבה רפורמות בשנת בחירות" ● עם זאת, הוא מתריע שהציבור ישלם מיליארדים כ"מס פיצול" ● כך הוא נלחם בהון השחור, מגן על עצמאות אגף התקציבים ומקדם חזון להפוך למעצמת אנרגיה ומים ביום שאחרי

הפגנת תמיכה בעם האיראני במינכן, אתמול / צילום: ap, Ebrahim Noroozi

בנו של השאה קרא: "להתערב צבאית"; הפגנות ענק באירופה ובצפון אמריקה

הפגנות ענק לתמיכה בעם האיראני גם בצפון אמריקה: עשרות אלפים בלוס אנג'לס, סן דייגו וטורונטו ● מוקדם יותר נערכה הפגנת ענק במינכן ● בנו של השאה האיראני הגולה: "מתקפה עשויה להאיץ את נפילת המשטר" ● צה"ל תקף תשתיות של חיזבאללה בדרום לבנון ● עדכונים שוטפים

הבורסה בתל אביב / צילום: Shutterstock

הבורסה בת"א ננעלה בירידות; מי ענקית הטק שנפלה?

המסחר בת"א ננהל בירידות במגמה שלילית - ת"א 35 ירד בכ-0.5%, ת"א 90 מאבד מערכו כ-0.7% ● חברות התעופה הובילו את הירידות ● חברת מגה אור עלתה בכ-1% והמשיכה לשעוט לעבר כניסה למדד ת"א 35 ● ירידות קלות על חוזים עתידיים בוול סטריט לקראת פרסום מדד המחירים לצרכן ● השקל מאבד גובה מול הדולר ● המסחר באירופה מתנהל במגמה מעורבת: הקאק בכ-0.4%, הפוטסי עולה בכ-0.2% ● הזהב רושם התאוששות קלה של  1%, הכסף עולה בכ-1.7% ● עדכונים שוטפים

טראמפ. הפסד במחוז טקסני שהיה רפובליקני 50 שנה / צילום: ap, John Locher

מבחן על סטרואידים: מתקרב רגע ההכרעה לכהונתו של טראמפ

בהתחשב בכך שהנשיא עצמו העיד "אנחנו חייבים לנצח, כי אם לא הם ידיחו אותי", בחירות האמצע הן מבחן על סטרואידים לכהונת טראמפ ● מעבר למהמורה הזו יש לו שלל אתגרים, החל מהתמודדות עם ענקיות הטק והשלכות הבינה המלאכותית, וכלה בחזית מול סין

דוד צרויה, מנכ''ל פלוס500 / צילום: נתנאל טוביאס

שוקי החיזוי מגלגלים מיליארדים בניבוי העתיד, אך בישראל אין עליהם פיקוח

שוקי החיזוי דוהרים למחזור של טריליון דולר והופכים ללהיט התורן של עולם ההשקעות ● הכניסה של Plus500 הישראלית מעוררת את המשקיעים, אך בישראל הרגולציה נותרה מאחור

הבית ברחוב חן בכרמיאל / צילום: טטיאנה טובמן

רק שלושה בתים ביישוב הזה נמכרו השנה ביותר מ-5 מיליון שקל. זה אחד מהם

מדובר בקוטג' חד־משפחתי שהוצע תחילה למכירה ב־5.8 מיליון שקל ● הקוטג' נבנה על מגרש משופע בצלע הר, ובסך הכול שטח המבנה הוא 280 מ"ר, שטח החלקה עומד על 536 מ"ר ● בשנים האחרונות מבוצעות בכרמיאל כ־600 עסקאות בשנה בממוצע, מהן כ־20 במחירים של 3 מיליון שקל ויותר