הבינה המלאכותית לומדת לדבר את שפת החלבונים

חברת סיילספורס פיתחה מערכת שבונה חלבונים חדשים עם תכונות נדרשות באמצעות בינה מלאכותית

גם חלבונים הם רצף של ''מילים'' המרכיבות ''משפט'' / אילוסטרציה: Shutterstock, Christoph Burgstedt
גם חלבונים הם רצף של ''מילים'' המרכיבות ''משפט'' / אילוסטרציה: Shutterstock, Christoph Burgstedt

חברת סיילספורס, המוכרת כמובילה עולמית בתחום הענן ובתוכנות CRM וכחברה המשתמשת בבבינה מלאכותית לשיפור והתאמה אישית של שיווק ופרסום, יצרה את מה שלדבריה הוא החלבון הראשון בעולם במבנה 3D שהונדס לגמרי בטכנולוגיית AI. המחקר, שבוצע על ידי זרוע המחקר של החברה, פורסם לאחרונה בכתב העת Nature Biotechnology, מכתבי העת המובילים של Nature.

שאלתי עובדי יוניקורן צעירים מי התנסה בכלי בינה מלאכותית. הופתעתי מהתשובה
אורי הדומי, מדטרוניק: "התהליכים שקורים כיום מקשים לשמר מרכזי פיתוח בישראל"

"צוות החוקרים לקח את המערכת שלנו, שידעה ללמוד טקסט, ולימד אותה את שפת החלבונים", אומר רפי דלה טורה, דירקטור דאטה סיינס בסיילספורס ישראל. "המודל הבסיסי דומה למודלי שפה כמו ChatGPT. מודל שפה הוא מערך הסתברותי ממוחשב שלומד את סדר המילים המקובל במשפט ויכול ליצור ולהשלים על סמך ידע זה טקסט כתוב באופן עצמאי.
בתהליך האימון המודל נחשף לעשרות טרה בייט של טקסט, ונקבע הערך של מליארדי הפרמטרים החישוביים שמהם המודל מורכב.
אחרי שלב האימון, המודל משתמש בפרמטרים כדי לקבל החלטה לשונית, כמו השלמת המילה במשפט".

חלבונים כרצף של מילים

גם חלבונים הם רצף של "מילים" המרכיבות "משפט". במקרה הזה, מדובר בחומצות אמינו, שמרכיבות את המולקולה החלבונית. סיילספורס נתנה למערכת להתאמן על 280 מיליון חלבונים וללמוד את הסמנטיקה של שפת החלבונים. לאחר מכן ביקשה ממנה לנבא רצפים נוספים של חומצות אמינו, שיכולות להיות חלבון השייך למשפחה מסוימת של חלבונים עם פונקציונליות רצויה.

זו משימה לא כל כך פשוטה, משום שלא כל רצף של חומצות אמינו יודע להתקפל כך שייצור את מבנה התלת-ממד של החלבון. אין אדם שיודע את כל הכללים המכתיבים איך צריך להיראות רצף חומצות האמינו של חלבון כדי שהוא יתקפל נכון.

אחת מפריצות הדרך המדעיות הגדולות של השנים האחרונות הייתה פיתוח מערכת אלפא פולד של גוגל, שיודעת לנבא כיצד ייראה חלבון, כיצד הוא יתקפל באופן תלת ממדי, אם אנחנו יודעים מה רצף חומצות האמינו המרכיבות אותו.

באלפא פולד הדבר מתאפשר כשרצף חומצות האמינו כבר קיים. מערכת ProGen של סיילספורס התבקשה לעלות שלב ולבחור בעצמה את רצף חומצות האמינו שיש לו הסיכוי הטוב ביותר להתקפל כמו שצריך.

חלבון עם תכונות אנטי־בקטריאליות

החלבון שנוצר הוא חדש לגמרי. הוא תוכנן על ידי המכונה כך שיהיו לו תכונות פונקציונליות רצויות כמו פעילות אנטי-בקטריאלית. את הפעילות הרפואית שלו החברה עדיין תצטרך להוכיח. המוצר נמצא בימים אלה בניסויי מעבדה, השלב הראשון בסדרת ניסויים ארוכה שהוא יצטרך לעבור כדי להגיע לשוק. אבל הרעיון שניתן לייצר חלבון חדש באופן הזה למעשה הוכח.

במאמר שפרסמה החברה, צוין שהחלבונים שייצרה המערכת פעילים לא פחות מחלבונים מהטבע, אבל חולקים איתם אפילו פחות מ־30% של רצף משותף. כלומר, המערכת לא מעתיקה חלבונים קיימים בשינויים קלים. היא באמת בונה אותם לגמרי מחדש ובעצם ממציאה חלבונים חדשים שלא היו מוכרים בטבע.

"תכנון חלבונים באמצעים ממוחשבים כבר קיים זמן מה", אומר ד"ר אילן סמיש, מנכ"ל חברת Amai, שפיתחה חלבון מתוק המחליף סוכר בכלים של ביולוגיה חישובית. "עם זאת, השימוש בבינה מלאכותית כדי להביא את המוצר משלב תיאור הצורך ועד שלב מבנה החלבון הפעיל - זה דבר חדש".