וואלה!
וואלה!
וואלה!
וואלה!

וואלה! האתר המוביל בישראל - עדכונים מסביב לשעון

מסתבר שהוא השחקן הטוב בעולם: המחשב שהביס את מקצועני הפוקר

וואלה! NEWS בשיתוף עם האקדמיה הישראלית לפוקר

2.2.2017 / 16:15

אחרי שלושה שבועות של קרבות עם ארבעה שחקנים מהשורה הראשונה נספרו הצ'יפים, והתברר כי התוכנה "ליברטוס" רמסה את המקצוענים בפער בלתי-נתפס של 1.7 מיליון צ'יפים. מה היעד הבא של "ליברטוס", ואיפה ישראל במפת הבינה המלאכותית של עולם הפוקר?

אין תמונה. צילום מסך, מערכת וואלה!
התוכנה התקדמה מאוד לעומת ביצועיה מלפני שנתיים. שחקן משחק נגד תוכנת הפוקר בשנת 2015/מערכת וואלה!, צילום מסך

במהלך שלושת השבועות האחרונים תוכנת בינה מלאכותית בשם "ליברטוס" (Liberatus) ריסקה באופן שיטתי את מיטב שחקני הפוקר העולמיים במשחק הטקסס הולדם נו לימיט, בתחרות שנערכה בקזינו Rivers שבפיטסבורג.

ארבעה מקצועני פוקר עולמיים מהשורה הראשונה התחייבו לשחק 120 אלף ידי פוקר הדס-אפ (אחד על אחד) מול רובוט הפוקר שפיתחו צוות חוקרים מאוניבריסטת קארנגי מלון (Carnegie Mellon) באתגר שמיד זכה לשם השיווקי "בינה אנושית נגד בינה מלאכותית" (Brains VS AI). המקצוענים הסכימו להקדיש מזמנם ומרצם בתמורה לתהילה ולסיכוי לזכות בפרס של 200 אלף דולר אם יביסו את הבינה המלאכותית.

מלחמת ההתשה מול רובוט הפוקר נדמתה כמאבק אבוד מול כלב פיטבול שכל ניסיון לפתוח את הלסתות שלו רק מגביר את נעילת השיניים. לאחר ששקע אבק הקרב נספרו הצ'יפים והתברר כי בינת הפוקר המלאכותית ניצחה את המקצוענים בפער בלתי-נתפס של 1.7 מיליון צ'יפים. מדובר ב-17 אלף בליינדים גדולים שהורווחו על-ידי הרובוט, כ-14 בליינדים גדולים על כל 100 ידי פוקר ששוחקו. פער עצום שכזה נחשב למובהק סטטיסטית ומעיד בבירור על יכולת הפוקר העצומה של הרובוט.

לאחר מרתון מתיש של 20 ימי משחק רצופים, מקצועני הפוקר דניאל מקאלוי, דונג קים, ג'ייסון לס, וג'ימי צ'יו לא האמינו למראה עיניהם כאשר חזו ברובוט הפוקר מסתגל לאסטרטגיית המשחק שלהם, מצליח לנצל את החולשות שלהם ומתקן את הטעויות אותן מצאו המקצוענים. מיום ליום רובוט הפוקר נהפך לחכם יותר, עשה פחות טעויות וקירב אותם לסף ייאוש.

פרופ' תומס סנדהולם והמתמחה שלו נועם בראון מספרים על שיפור התוכנה שפיתחו

מלמדים את המחשב ללמוד

המוח האנושי שמאחורי מוח-הפוקר הם הפרופסור תומס סנדהולם והמתמחה שלו נועם בראון, שעיצבו את הגרסה הראשונית של הרובוט לפני שנתיים בלבד. אותה גרסה ראשונית שכונתה "קלאודיקו" (Claudico) נוצחה בקלילות על-ידי שחקני פוקר מובילים ונחשבה כניסיון כושל לבנות רובוט-פוקר אימתני.

שנתיים לאחר-מכן הגרסה העכשווית "ליברטוס", ריסקה את המתחרים האנושים ולראשונה בהסטוריה שמה את המחשב לפני האדם באחד ממשחקי הקלפים המורכבים ביותר אותם המציאה האנושות. מהלך הפוקר החזק ביותר בו השתמש המחשב היה ביצוע הימורים מעל לגודל הקופה ב"ריבר", סבב ההימורים האחרון, גם עם ידיים חזקות וגם עם בלופים מוחלטים.

משחק הפוקר נחשב למשחק הקלפים המורכב ביותר הידוע למדע המודרני. המשחק מציב בפני החוקרים האקדמיים אתגרים רבים מעבר למתמטיקה ותבניות הימורים. רובוט פוקר איכותי נדרש לבצע החלטות מסובכות בתנאי אי-וודאות ומידע חלקי, מול בני-אדם בשר ודם המבצעים מהלכים "טריקיים" כגון בלופים, הסוואה של ידיים חזקות, ולפעמים גם החלטות רגשיות נטולות הגיון ברור.

השיטה אותה פיתחו החוקרים על-מנת להתגבר על העורמה האנושית נקראת "למידת מכונה" (Machine Learning). בשיטה זו מאפשרים למחשב תהליכי לימוד אוטונומיים ללא מעורבות אנושית וללא תכנות מראש.

מיטב החוקרים מעריכים כי בעתיד ניתן יהיה להשתמש בבינת הפוקר המלאכותית על-מנת לשפר את תהליכי החיזוי וקבלת ההחלטות בתחומים רבים שרלוונטיים לחיינו - בפוליטיקה, כלכלה, בריאות ועוד - בהתבסס על מאגרי המידע העצומים העומדים לרשות האנושות, ותהליכי הלימוד והסקת המסקרנות המהירים של המכונות.

שולחן ללימוד משחק הפוקר בלאס וגאס, ספטמבר 2015. AP
השיטה אותה פיתחו החוקרים על-מנת להתגבר על העורמה האנושית נקראת "למידת מכונה"/AP

רובוט VS רובוט

אז אחרי שרובוט הפוקר "ליברטוס" טאטא את התחרות האנושית מתחת לשטיח, מה היעד הבא שלו?

מסתבר שהתחרות העיקרית הניצבת מול הרובוט הוא דווקא רובוט אחר שמכונה "ערימה עמוקה" (DeepStack) שפיתחה קבוצה מתחרה של חוקרים מאוניברסיטת אלברטה (Alberta). בתחרות הראשונה שבה התמודד "ערימה עמוקה" מול 33 שחקני פוקר מטעם התאחדות הפוקר העולמית (IFP), הצליח לנצח הרובוט את רובם המוחלט של המתמודדים האנושיים שהוצבו מולו. אמנם הוא שיחק מול כל מתמודד כ-3,000 ידי פוקר בלבד, מה שלא היווה מדגם סטטיסטי מייצג, אבל הפער בצ'יפים לטובת הרובוט היה ניכר.

בין המתחרים היה מקצוען הפוקר האמריקאי המוכר פיל לאק, וגם שלושה נציגים ישראלים – מקצועני הפוקר ומייסדי האקדמיה הישראלית לפוקר אייל "קסיאס" אשכר, שי "גאבור" צור, וסטס "סטסיה42" טישקביץ'.

רובוט פוקר כחול-לבן

כמו בשאר תחומי ההיי-טק, גם בתחום הבינה המלאכותית של הפוקר ישראל נמצאת חזק במירוץ. סטארט-אפ ישראלי שהקימו גיא סלע וסטס טישקביץ' בשנת 2013 עוסק בפיתוח בינת פוקר מלאכותית לצורכי לימוד פוקר. תוכנת הבינה המלאכותית פוקר-פייטר (Poker-Fighter) נותנת לשחקן פידבק מידי על כל החלטה בשולחן, מסבירה את הסיבה מאחורי המהלך, ומציעה מהלכים אפשריים אחרים בהינתן מידע על סוג היריב.

אמנם פוקר-פייטר הוא תוכנת לימוד פוקר שמיועדת לשחקנים חובבים, אבל מוח-הפוקר שעומד מאחוריה בהחלט מסוגל להתמודד מול מיטב השחקנים האנושיים והבינות המלאכותיות שיש כיום בשוק.

ייתכן שבעתיד הלא-רחוק במקום להסתכל בטלוויזיה על אליפות העולם לפוקר בלאס-וגאס, יצפו חובבי הפוקר באליפות העולם לפוקר באינטרנט, בה בינות-פוקר מלאכותיות ישחיזו חרבות ויבצעו בלופים מרהיבים, ומי יודע אולי תהיה זאת בינת-פוקר כחול-לבן שתגרוף לבסוף את כל הצ'יפים.

להתנסות ואימון פוקר בחינם בעזרת הפוקר-פייטר לחץ כאן

טרם התפרסמו תגובות

הוסף תגובה חדשה

+
בשליחת תגובה אני מסכים/ה
    4
    walla_ssr_page_has_been_loaded_successfully