התשובה הישראלית לסרטונים של OpenAI חורכת את הרשת, אבל האם היא תעמוד במבחן המסחרי?

"סורה", הפיצ'ר החדש של OpenAI, הצליח להפתיע רבים כשייצר סרטוני וידאו איכותיים באמצעות פקודות מילוליות בלבד • לייטריקס הישראלית השיקה לאחרונה את התשובה שלה, שמיועדת לתעשיית הקולנוע והטלוויזיה • מה הסכנות בטכנולוגיה החדשה והאם מדובר במהפכה שתשנה את עולם הקולנוע ותקפיץ את שורת ההכנסות של לייטריקס?

צילום מסך מתוך LTX Studio של לייטריקס
צילום מסך מתוך LTX Studio של לייטריקס

השקת מערכת הסרטונים הריאליסטיים "סורה" לפני כשבועיים על-ידי ענקית הבינה המלאכותית OpenAI שמטה לסתות, לאחר שבאמצעות פקודות מילוליות בלבד הצליחו מהנדסי החברה להפיק סרטוני וידאו איכותיים מאוד שחלקם נראו מציאותיים. מכונית נוסעת לאורכו של כביש מיוער, כלב יושב מול מסך מחשב ומקליד על מקלדת, וזוג שלוב זרועות מטייל בטיילת בניחותא הרטיטו את הרשת, לצד אימאג'ים שעבדו מעט פחות טוב ונראו מלאכותיים. 

הבינה המלאכותית מתחילה לאיים על משרות צווארון לבן. מעט תעשיות חסינות
משאירה אבק לאנבידיה: המניה שזינקה ב-1,000% בשנה

OpenAI לא חשפה את תהליך יצירת הסרטונים לציבור אלא הסתפקה בשחרור התוצאות הטובות ביותר, ולמרות הפגמים שנראו פה ושם - תנועות בלתי הגיוניות, ריטוש תמונה מוגבר - נדמה היה שנרשמה אבן-דרך בהפיכת הבינה המלאכותית לכלי יצירה לכל דבר עבור תעשיית הטלוויזיה והקולנוע. ב-OpenAI נמנעו כמעט מלהציג דמויות אנושיות המביעות רגשות או מדברות. זו טכנולוגיה שעדיין רחוקה מבשלות.

אולם באמצעות מעט דמיון ותקווה, ניתן לראות כיצד באמצעות פקודות קוליות בלבד ניתן יהיה בעתיד הלא רחוק סרט מ-א' ועד ת'. גם אם לא סרט באורח מלא, הרי שהפקות של סצנות מסוימות שקשות להפקה, וידאו קליפים או פרסומות עשויות יהיו להקל מאוד את תהליך היצירה, וכתוצאה מכך לשחרר לשוק עובדי תוכן רבים שתרומתם לא תהיה נדרשת יותר.

בשבוע שעבר קירבה החברה הישראלית לייטריקס (Lightricks) עוד יותר את חזון היצירה של סרטים איכותיים הנוצרים באמצעות דמיונו הפרוע של היוצר וקולמוסה של הבינה המלאכותית: החברה מירושלים, שמוכרת יותר כיצרנית אפליקציית ריטוש הפנים FaceTune, הלכה שלב אחד אחרי OpenAI והשיקה מערכת ליצירת סרטונים שמיועדת בעיקר לשלב הפרה-פרודקשן בתעשיית הקולנוע והטלוויזיה.

בחברה מבינים שהאיכות אליה ניתן יהיה כיום אינה מספיקה כדי שתוקרן לצופים בתור התוצר הסופי, אך הוא יכול לשמש את אנשי התעשייה לצרכים פנימיים כמו פיץ' למשקיעים או פיתוח הסטורי בורד - המסמך המכוון את הוראות הבימוי והצילום עבור כל שוט וסצנה בסרט או בפרק של סדרת טלוויזיה. 

צילום מסך מתוך LTX Studio של לייטריקס
 צילום מסך מתוך LTX Studio של לייטריקס

השראה ממידג'רני

בלייטריקס שאבו השראה מטכנולוגיות שפותחו עוד זמן רב לפני ש"סורה" הושקה: הטכנולוגיות של סטבליטי ולומייר (של גוגל). למערכת שבנתה לייטריקס, LTX Studio, ניתן להזין תסריט והוראות בימוי, ואגב כך לייצר סרט שאומנם נראה מאוד לא מציאותי, אך קרוב מספיק כדי לספק לצוות ההפקה - או לחלופין למשקיעים פוטנציאליים בהפקה מסוימת - את הכיוון לדמיין מה מבקש היוצר להשיג. ניתן לתאר בפני המכונה באמצעות פקודת טקסט (Prompt) את השוט או את הסצנה, לתאר את הדמויות, את הרקע ואת התפאורה, לציין את הסגנון המבוקש - ריאליסטי, עתידני, סטים-פאנק - ולציין את המתרחש בהן. 

"כשיצאנו לדרך, קיבלנו השראה ממידג'רני, שאומנם הייתה מוצר בינה מלאכותית, אבל היא הייתה מבוססת עמוק בקרב היוצרים המקצועיים", מספר ד"ר זאב פרבמן, מנכ"ל לייטריקס. "ראינו שם צעירים מתחומים שונים שפתוחים לטכנולוגיה, ניגשנו אליהם והבנו מה שחשוב להם. הם רוצים להיות בשליטה מלאה על הסט, ואם יהיה להם מוצר שיסייע להם, למשל, בסצנה מסוימת להעביר את הרקע מחורפי לקייצי - הם ירצו לנסות אותו".

המערכת של לייטריקס תושק מאוחר יותר החודש במחיר שעדיין לא הוחלט, אך החברה מהירה להוציא על פיתוחה והשקתה הודעה לעיתונות ונתנה למספר משפיענים להתנסות בה. התוצאות חרכו את הרשתות החברתיות עם קדימונים בסגנונות ויזואליים שונים, מוזיקה דרמטית וקריינות. 

צילום מסך מתוך LTX Studio של לייטריקס
 צילום מסך מתוך LTX Studio של לייטריקס

פרבמן מסביר כי המערכת מבוססת על מודלי בינה מלאכותית שפותחו בחברה, כמו מודל Long Animated GIF ומודלים ויזואליים של חברת Stability AI, שלייטריקס אימצה לחיקה בשנתיים האחרונות. מודלים נוספים שולבו לנושא התיוג, שיפור התמונה באמצעות היזון חוזר והבנת השפה הטבעית.

המערכת של לייטריקס זוכה לתגובות חיוביות מצד מומחים, והיא גייסה לצידה כמה במאים וכותבים - כמו ארי פולמן, יוצר "ואלס עם באשיר" - שיסייעו לה באפיונה. אך האם הדבר ישפיע לטובה על הכנסותיה של החברה הגדולה? עוד מוקדם לדעת, בהתחשב בעובדה שהחברה טרם קבעה תמחור למוצר. 

החברה מייצרת הכנסות בעיקר מסדרת האפליקציות לעריכת תמונות וסרטונים Photoleap, Facetune ו-Videoleap, אותן היא מציעה בחינם, כאשר היא גובה תשלום על שימוש מלא במאפייניהן. לפני כשנתיים פנתה ישירות גם לשוק העסקי על-מנת לסייע למשפיענים ומשרדי פרסום לגייס נותני חסות ומפרסמים. 

סכנת ה"דיפ פייק" 

אחת הסכנות בהפצת מערכת עצמאית ליצירת סרטונים מבוססי בינה מלאכותית היא יצירת "דיפ פייק" - סרטוני וידאו המציגים ידוענים באופן שמעולם לא צולם, במטרה להביך אותם או לייצר דיסאינפורמציה לצרכי בחירות.

"הבעיה כבר היום היא מאוד רצינית", אומר פרבמן. "אפילו לפני הטכנולוגיות של OpenAI וג'מיני ניתן היה לייצר 'דיפ פייקים', פשוט הדבר נעשה על-ידי קבוצות מצומצמות. דווקא הפצה של מערכות ליצירת וידאו באמצעות בינה מלאכותית מעלה את הנושא למודעות ותורמת להעלאת ספקות באשר לתוצרים כאלה.

"כחברה יש לנו קווים אדומים במערכת: לא נאפשר עירום לפי גיל, וננטר, כמובן, דיווחים של משתמשים על 'דיפ פייקים' לא נאותים. יש כבר היום מחקרים על טכנולוגיה שמייצרת חתימה מבוססת בינה מלאכותית על סרטוני וידאו - הדבר הזה יוכל בעתיד לזהות את היוצרים שישתמשו במערכות הגדולות". 

ד''ר זאב פרבמן, מנכ''ל לייטריקס / צילום: אייל מרילוס
 ד''ר זאב פרבמן, מנכ''ל לייטריקס / צילום: אייל מרילוס

פרבמן גם שופך מים צוננים על כל אלה שחוששים שהמכונה תחליף את היוצרים, את הבמאים, את התסריטאים ואת השחקנים ותאפשר ליצור סרטים מא' ועד ת'. "אנחנו עוד לא שם בכלל. נכון שהבינה המלאכותית מאפשרת ליצור תוצרים מגניבים - כמו מצלמה שנוסעת אחרי רכב או שוט של עיר עתידנית, אבל קח דיאלוג בין שני אנשים ומצלמה שמתמקדת בהם - זה עוד לא שם, והדרך עוד ארוכה מאוד".