ספוטיפיי | פיצ'ר

למה אנשים מדלגים לשיר הבא, ואיך הטכנולוגיה תעזור לאמנים להתמודד עם זה

פרנסואה פאשט, שמנהל את מעבדת המחקר של ספוטיפיי, מספר בראיון ל"גלובס" על יצירת מוזיקה באמצעות בינה מלאכותית ומסביר כי אין כיום הבנה מספקת של מה אנשים אוהבים לשמוע: "צריך להתחשב בניואנסים - איזה קטעים אנשים אוהבים ומתי הם מאזינים"

טכנולוגיית ספוטיפיי בבית קפה / צילום: Mia Shanley, רויטרס
טכנולוגיית ספוטיפיי בבית קפה / צילום: Mia Shanley, רויטרס

כששומעים על טכנולוגיות בינה מלאכותית חושבים לרוב על רובוטים, זיהוי פנים או עוזרים וירטואליים כמו אלקסה וסירי, ונדיר שמקשרים אותן לתחומי האמנות, שנחשבים לצורת ביטוי אנושית מובהקת. אבל חוקר הבינה המלאכותית הצרפתי פרנסואה פאשט (Francois Pachet) החליט להתמקד במחקריו בדיוק בתחום זה, וספציפית ביצירה מוזיקלית. במסגרת מעבדת המחקר לטכנולוגיה ויצירה של ספוטיפיי (Spotify Creator Technology Research Lab) שאותה הוא מנהל, הוא מוביל את פיתוחם של כלי בינה מלאכותית שיסייעו למוזיקאים בתהליך היצירה של שירים חדשים. ואם הרעיון הזה מעלה בכם פחד מהיום בו בינה מלאכותית תחליף את המוזיקאים ותחסל את היצירה האנושית, פאשט מתעקש כי היום הזה לא יגיע לעולם, ושדווקא לאותם כלים ממוחשבים יש פוטנציאל לדחוף מוזיקאים להפוך ליצירתיים יותר.

"הרעיון במעבדה שלנו הוא לבצע מחקר לפיתוח טכנולוגיות עבור יוצרים. יש הרבה דרכים בהן טכנולוגיה יכולה לעזור ליוצרים, כמו בשיווק המוזיקה שלהם, בהגעה לקהל היעד ועוד. אבל אנחנו מתמקדים ספציפית ביצירת המוזיקה. אנחנו מפתחים טכנולוגיות בינה מלאכותית שונות עבור כתיבת שירים, תזמור (הוספת הכלים והקולות השונים לשיר כחלק מתהליך העיבוד, א"ג) וכו', ועובדים על להפוך אותן לזמינות לקהל הרחב", מסביר פאשט, שהגיע לתל אביב במסגרת כנס של טכנו ארט, חממה לסטארט-אפים בתחומי האמנות והתרבות.

לפני שהחל לעבוד בספוטיפיי ניהל פאשט את מעבדת מדעי המחשב של חברת סוני בפריז, והוביל פרויקט במסגרתו בינה מלאכותית יצרה שיר בשם "Daddy's Car" בסגנון שירי להקת הביטלס. כך זה עבד: מערכת הבינה המלאכותית הוזנה ב-45 שירים אמיתיים של הביטלס, זיהתה דפוסים במנגינות ויצרה שיר חדש. בנוסף, הוא יצר בשיתוף עם מוזיקאים שונים אלבום בשם Hello World שמכיל 15 שירים. בכל שיר בפרויקט זה המערכת הוזנה ביצירות מוזיקליות בסגנון אחד ויצרה מנגינה חדשה בהשראתן, ואילו את הקולות בשיר יצרה בהשראת שירים מסגנון אחר בהם הוזנה.

"אנחנו עובדים עכשיו בספוטיפיי על קאברים. אנחנו מקליטים שיר קיים בא-קפלה (קול הזמר לבד ללא ליווי של כלי נגינה, א"ג), ואז נותנים לבינה מלאכותית ליצור את הליווי של השיר בהשראת שירים שונים לגמרי", מסביר פאשט. לפני כמה חודשים הובילה המעבדה יצירת אלבום בשם American Folk Songs במסגרתו הוקלטו שירי פולק שונים בא-קפלה, כשהמנגינה המלווה נוצרה בעזרת בינה מלאכותית. "הזנו את האלגוריתם ביצירות מוזיקליות שכלל לא נוגעות לשיר, והבינה המלאכותית השתמשה בכל המקורות האלו כדי ליצור משהו שיישמע טוב עם הקולות", הוא אומר.

פרנסואה פשאט, מנהל מעבדת המחקר לטכנולוגיה ויצירה של ספוטיפיי / צילום: מתוך יוטיוב
 פרנסואה פשאט, מנהל מעבדת המחקר לטכנולוגיה ויצירה של ספוטיפיי / צילום: מתוך יוטיוב

"הטכנולוגיה מוציאה אמנים מאזור הנוחות"

פאשט מסביר כי "היצירה של האלבומים האלו בשיתוף עם מוזיקאים שמשתמשים בטכנולוגיות חשובה לי - כדי לא להשאיר את הכלים האלו בעולם המדעי עם דמואים ומאמרים, אלא לייצר מוזיקה אמיתית ולנסות אותה בעולם האמיתי. כשמוזיקאים משתמשים באבות-טיפוס שפיתחנו הם מספקים לנו פידבק - מה מעניין ומה לא. בסופו של דבר מה שמניע אותנו זה לא הטכנולוגיה עצמה אלא המוזיקה, אז חשוב לנו לברר מה המוזיקאי רוצה ובהתאם לנסות לתת לכך מענה. זו גישה שונה משל רוב החוקרים, שהמחקר שלהם מתבסס רק על הרעיונות הטכנולוגיים".

הוא מדגיש כי למרות השימוש בבינה מלאכותית כחלק בתהליך יצירת המוזיקה, אותם כלים אוטומטיים לא באים להחליף את האמנים האנושיים עצמם. "מה שלא אוטומטי בתהליך זו הבחירה של השירים השונים שמוזנים למערכת - וזו הבחירה של האמן, שהכרחית כדי ליצור משהו מעניין. הרי יש מיליארדי בחירות אפשריות ורובן לא יביאו ליצירת משהו מעניין. מכיוון שאי אפשר פשוט לייצר מיליארדי שירים ולנסות אותם, אז חייבים שתהיה כוונה אמנותית".

אתה לא חושב שזה ישתנה כשהטכנולוגיה תהפוך למתוחכמת יותר?

"לא. נעשה ניסוי מחשבתי: נגיד שיש מכונה שלוחצים בה על כפתור ומקבלים להיט ענק. מה מונע מאיתנו ללחוץ על הכפתור הזה פעמיים, שלוש או אפילו מיליארד פעמים? כלום, אבל מצד שני, אי אפשר באמת לייצר מיליארד להיטים. להיט הוא גם תוצר חברתי, לאנשים יש תשומת לב מוגבלת, וההצלחה של שיר נובעת גם מגורמים שלא קשורים לשיר עצמו. אף אחד לא יודע איך זה עובד ומכונה שתדע את זה תהיה חייבת שיהיה לה מודל של העולם. אנחנו מאוד רחוקים מזה, כי המודלים היום נוגעים רק למוזיקה עצמה".

אז אמנים לא צריכים להיות מודאגים.

"אמנים צריכים להיות נרגשים. הטכנולוגיה הזו דוחפת אותם החוצה מאזור הנוחות שלהם, ומאפשרת להם לחקור את הגבול של הסגנון שלהם. כמו שכבה דקה מסביב למה שהם בדרך כלל עושים. תמיד כשיוצאת טכנולוגיה חדשה יש אנשים שאומרים שזה דבר נורא ושהיא תהרוג תחום מסוים, ובפועל הרבה פעמים קורה ההפך. לדוגמה, אחרי שב-1992 מחשב ניצח את אלוף העולם בשחמט קספרוב, מספר שחקני השחמט גדל באופן אקספוננציאלי".

התוצאה שהבינה המלאכותית יוצרת מפתיעה אותך לפעמים?

"ההרמוניות שנוצרות הן יפהפיות, ולפעמים הן באמת לא קונבנציונליות. זה אף פעם לא נשמע לא טוב, אבל לפעמים המוזיקאים שעובדים איתנו מופתעים מחלק מסוים מהשיר ואומרים שהוא נשמע קצת מוזר. אמנם אי אפשר למדוד אם משהו נשמע טוב, אבל אם המוזיקאים לא היו אוהבים את התוצאה - הם לא היו רוצים שהשם שלהם יופיע על אותו השיר. הרבה אנשים שואלים אותי איך אני יודע שמשהו שיצרתי הוא טוב. דרך אחת היא להגיד - נוציא את המוזיקה הזו ונראה כמה היא פופולרית. אבל פופולריות זו לא אינדיקציה טובה. כי היא תלויה גם בשיווק ובהשקעה הכספית. לעומת זאת, אינדיקטור מאוד חזק הוא אם מוזיקאים שאיתם עבדנו - חלקם מאוד מוכרים כמו סטרומאה (Stromae, מוזיקאי בלגי שאחראי על להיטים בינלאומיים כמו "Alors on danse" ו-"Papaoutai", א"ג) - התרגשו מהיצירה והסכימו לשים את השם שלהם עליה. הם לא היו עושים את זה אם הם לא היו חושבים שהשיר נהדר".

פאשט מדגיש את התפקיד שבינה מלאכותית יכולה לשחק ברענון היצע המוזיקה הקיים היום: "לדעתי הרבה מהשירים הפופולריים היום נשמעים אותו הדבר, ואין מספיק מגוון, וכמו שהסברתי ניתן להשתמש בבינה מלאכותית כדי ליצור דברים חדשים - שנשמעים טוב אבל לא קונבנציונליים. לדעתי זו הדרך בה צריך להשתמש בטכנולוגיה הזו בתחום הזה. אני לא יכול להבטיח שכך אכן ישתמשו בזה, כי אפשר להשתמש בכל כלי בכל דרך, ואולי גם בדרכים שאני אפילו לא יכול לתאר לעצמי. אבל זו הסיבה שגורמת לי להתעניין בזה. אני לא מתעניין ביצירת שיר ידידותי לרדיו".

בהרצאה שנשא פאשט בישראל הוא התייחס גם לאלמנט נוסף - הצד של המאזינים עצמם, וההשפעה של הרגלי האזנה שלהם על האופן שבו יוצרים מוזיקה. "אני אובססיבי לגבי סקיפים (העברה יזומה לשיר הבא - א"ג)", אמר פאשט. "בספוטיפיי חקרו את הנושא בשנתיים האחרונות. כשמסתכלים על הנקודה בה אנשים מפסיקים להקשיב, 25% מהאנשים עושים סקיפ בטווח חמש השניות הראשונות. באופן כללי גילינו שהזמן בו אנשים לוחצים סקיפ תלוי בגיל, ולא מושפע ממגדר או מיקום או משתנה בימים שונים. כך שזה לא תלוי באנשים, אלא רק בשיר, והצלחנו לצפות באחוזים גבוהים מהו פרופיל הסקיפים של השיר עצמו. אני מקווה שבשנים הקרובות מוזיקאים יוכלו להשתמש בדרך בה אנשים הולכים להקשיב לשיר שלהם ככלי. אם תדע שהרבה אנשים יעשו סקיפ בנקודה מסוימת, אולי תוכל להשתמש בזה ולבצע מניפולציה מדויקת על הקהל. לדעתי זה ישנה הרבה דברים בעתיד".

פאשט גם מעלה סימן שאלה לגבי היכולת לדעת כיום האם מאזינים אוהבים שיר מסוים או לא. "היום המיפוי של השירים שאנשים אוהבים ולא אוהבים מאוד פרימיטיבי וראשוני, ואני חושב שאין לנו את המודלים הנכונים, כי כל מה שיש לנו זה את הפעילות של המשתמשים. לפי המודלים האלה, אם הקשבת לשיר 20 פעם - אתה אוהב אותו. אבל זה יותר מורכב. יש את מה שאתה עושה עם השיר, אבל גם את מה שאתה חושב עליו. אולי אתה אוהב רק קטעים מסוימים? אולי זה סתם היה ברקע? אולי אתה אוהב להקשיב לו רק כשאתה נוהג?

"יש כל כך הרבה דרכים להקשיב לשיר, וזה נכון גם לגבי סרטים, בגדים, וכל דבר שאנחנו צורכים או קונים. למשל, אני תמיד אומר שאני אוהב את הסרט '2001' של סטנלי קיובריק. עם זאת, כשאני באמת צופה בו - אני חושב שהוא מאוד משעמם. כי ראיתי אותו כבר חמש פעמים, הוא מאוד ארוך, ואני רגיל היום לסוג סרטים אחר. אבל הייתי ממליץ לאחרים לצפות בו. אז מה זה אומר על הטעם שלי? אני חושב שבעתיד יהיו לנו מודלים טובים יותר, כי המודלים שיש לנו היום הם לגמרי אבסורדיים. צריכות להיות לנו גם מילים נוספות שמתארות אהבה למשהו שאתה באמת נהנה ממנו ובאמת צורך, לעומת אהבה למשהו שנמאס לך ממנו. יש הרבה ניואנסים".

"אוספים היום יותר מדי מידע"

שינוי נוסף שהטכנולוגיות החדשות עשויות להביא לתחום המוזיקה, לדבריו, פרט להגברת היצירתיות, נוגע לתחום המשפטי - סוגיית זכויות היוצרים. "שאלת זכויות היוצרים נוגעת במקרה של שימוש בבינה המלאכותית לקלט ולפלט - ליצירות בהן מזינים את המכונה ולמה שהיא מייצרת", מסביר פאשט. "זה מורכב מבחינה משפטית כי הבינה המלאכותית לא מייצרת עותק, מה שמזינים אליה ומה שמקבלים אלה שני דברים שונים. נכון להיום החוקים בנושא שונים בין מדינות שונות, אבל הדברים האלו מתפתחים ומשתנים כי יש דרישה חדשה וצריך למצוא פתרון. לגבי הפלט השאלה הגדולה היא מי הבעלים של מה שהמכונה עשתה. לדעתי, כדי להעניק למשהו זכויות יוצרים חייבת להיות מעורבות אנושית, ומבחינתי אין ספק שהמשתמש בבינה המלאכותית הוא הבעלים של התוצאה, כי הבינה המלאכותית היא כלי. אם הייתי בונה פטיש זה לא הגיוני שאקבל זכויות על הבית שנבנה בעזרתו. אבל יש כאלה שטוענים שהתוצרים כן צריכים להיות בבעלות של מי שעיצב את הכלי, ואילו אחרים טוענים שהכלי עצמו צריך לקבל קרדיט. אנחנו לא בסיטואציה יציבה, דברים זזים, ואולי בעתיד בכלל יהיו דרכים חדשות לייצוג זכויות יוצרים ובעלות".

אילו התפתחויות אתה צופה בתחום כלי הבינה המלאכותית במוזיקה בשנים הקרובות?

"אני חושב שיהיו הרבה כלים מסחריים שיהיו זמינים, וחלק מהאנשים ישתמשו בהם מסיבה פשוטה - זה כיף. חלק כמובן ימשיכו להלחין שירים על גיטרה, וזה בסדר. ברגע שאנשים ישתמשו בזה יותר, זה כבר לא ייראה לנו קסום. הקסם נובע מזה שאנשים לא יודעים איך משהו עובד. אז ברגעים הראשונים של טכנולוגיה היא נחשבת קסם, ואחר כך זה פשוט משהו חדש". התפתחות נוספת שפאשט צופה בעתיד שנוגעת לכלים וחברות טכנולוגיה בכלל קשורה לפרקטיקות איסוף המידע על המשתמשים. לדבריו, היום נאסף יותר מדי מידע. "אנחנו לא יכולים להמשיך לאחסן או לעבד את כל הנתונים האלו והולכים להיות רק עוד ועוד. נצטרך לאסוף פחות מידע מלכתחילה, או למחוק חלק מהמידע שנאסף. לדעתי זה טוב. אני לא חושב שאנשים מוכנים לקבל את זה שכל מה שהם עושים בחיים שלהם נשמר ומאוחסן. זה לא הגיוני שכל המיילים שאדם שלח או כל התמונות שצילם בחייו יהיו זמינים גם כשהוא יהיה קשיש, או אפילו אחרי שימות. לא נוכל להמשיך לאחסן הכול". 

פרנסואה פשאט: חוקר בינה מלאכותית, מנהל מעבדת המחקר לטכנולוגיה ויצירה של ספוטיפיי • בן 55, רווק ומתגורר בפריז • קודם לכן שימש כמנהל מעבדת מדי המחשב של סוני בפריז • בעל דוקטורט דוקטורט מאוניברסיטת פריז VI: פייר ומארי קירי (UPMC) ותואר מהנדס מהמוסד הצרפתי Ecole des Ponts et Chaussées • אוהב לנגן ג'אז על גיטרה