بررسی الگوریتم MinMax | قسمت اول پیاده سازی هوش مصنوعی شطرنج

آموزش هوش مصنوعی شطرنج – توصیه شده – هوش مصنوعی

356 بازدید

۱۴۰۰-۰۷-۱۶

4 دقیقه

نویسنده: Zeus ‌
درباره نویسنده: زئوس هستم ساکن المپ

عبارت الگوریتم MinMax در انتهای قسمت قبلی آموزش پیاده‌سازی هوش مصنوعی شطرنج بیان کردیم که البته مدت زیادی هم از انتشار آن می‌گذرد به تاریخچه پیاده‌سازی هوش مصنوعی شطرنج پرداختیم و دیدیم که سابقه این ایده حتی به قبل از اختراع کامپیوترهای الکترونیکی برمیگرده که در نوع خودش خیلی هم جذاب می‌شود. اما مسئله‌ای که گیج‌کننده است این است که این منطق دقیقاً چطور عمل می‌کند، اگر منطق عملکردی به این میزان می‌تواند ساده باشد که در یک سیستم مکانیکی قابل پیاده‌سازی است پس چرا این‌قدر به نظر پیچیده و درهم‌تنیده می‌آید. در این قسمت سعی خواهیم کرد که به شکل کلی جواب این سؤال را بدهیم. جزئیات خیلی زیاد هستند و پرداختن به همه جنبه‌ها قطعاً هم از حوصله این پست و هم از حوصله من خارجه و سعی می‌کنم با نشان‌دادن مسیر کلی این ابهام رو از منطق پشت هوش مصنوعی رفع کنم. با سیسوگ در ادامه همراه باشید.

هوش مصنوعی شطرنج چطور فکر می‌کند؟

سؤال در نگاه اول سخت به نظر می‌رسد ولی جواب ساده است، هوش مصنوعی شطرنج فکر نمی‌کند، بله بر خلاف چیزی که از عبارت فوق برداشت می‌شود اتفاقی که در پشت پرده این الگوریتم می‌افتد فکرکردن نیست! (البته شاید هم در نگاهی باشد، نمی‌خواهم وارد بحث‌های فلسفی علم انسانی بشوم). پس چه اتفاقی می‌افتد؟

در واقع ما به‌عنوان برنامه‌نویس دو انتخاب پیش نداریم، راه اول این است که به شکل الگوریتم تمام حالت‌های ممکن را برنامه‌نویسی کنیم به شکل شرط‌های تودرتو، همان چیزی که در ساخت دستگاه KRK اتفاق افتاده است. (در قسمت اول مقاله هم فیلم آن را قرار دادیم و هم در خصوص آن توضیح دادیم.)

الگوریتم Torres y Quevedo برای بازی krk

در آن مورد خاص می‌شود از این روش استفاده کرد چرا که تعداد حالت‌های ممکن بسیار محدود است و شاید پیاده‌سازی آن کار دشواری نباشد ولی وقتی حرف از بازی شطرنج می‌شود صحبت از میلیون‌ها میلیون حالت ممکن است که پیاده‌سازی آن به این شکل قطعاً نشدنی است.

و راه دوم این است که به نحوی هر حرکت را امتیازدهی کنیم و در حرکت‌های ممکن امتیازهای کسب شده را بررسی کنیم، در نهایت آن حرکتی را انجام دهیم که بالاترین امتیاز را کسب کرده است. این قاعده به الگوریتم minmax مشهور است و برای بازی‌کردن اغلب بازی‌های کامپیوتری از همین روش استفاده می‌شود (تا قبل از این که هوش مصنوعی وارد عرصه شود) در ادامه جزئیات بیشتری از الگوریتم را بررسی خواهیم کرد.

الگوریتم MinMax چیست؟

در واقع این الگوریتم مکانیسمی نزدیک منطق تصمیم‌گیری ما دارد، این الگوریتم سعی می‌کند با کمترین هزینه (مینیمم) تصمیمی بگیرد که بیشترین سود (ماکزیمم) را نصیب ما کند. با فرض این که حریف به شکل منطقی بازی کند از این الگوریتم می‌توان دربازی‌های دونفره نوبتی به شکل گسترده استفاده کرد. دربازی‌های مثل بازی دوز (Tic-Tac-Toe) یا منطق شطرنج یا تخته نرد و امثالهم.

در الگوریتم minmax به دو بازیکن حداکثرکننده و حداقل‌کننده گفته می‌شود، حداکثر کننده سعی می‌کند که بالاترین امتیاز ممکن را بگیرد و در مقابل حداقل‌کننده سعی می‌کند که کمترین امتیاز ممکن را به دست آورد در حالت معین اگر حداکثرکننده برتری داشته باشد امتیاز مثبت خواهد بود و اگر حداقل‌کننده برتری داشته باشد امتیاز منفی خواهد بود.

این مقادیر و محاسبه توسط روش‌های اکتشافی (پیش‌بینی حرکت‌های ممکن در بازی) که برای هر بازی (منظور نوع بازی است) منحصربه‌فرد خواهد بود محاسبه می‌شود.

اوپس، این‌طور توضیح‌دادنش خیلی سخته بگذارید با یک مثال سعی کنم نحوه عملکرد این الگوریتم را بهتر توضیح بدم که در ادامه به آن خواهیم پرداخت.

الگوریتم مینمکس چطور کار می‌کند؟

بازی‌ای را در نظر بگیرید که دارای نهایتاً چهار حالت است و مسیرها برای رسیدن به هرکدام از چهار حالت مطابق شکل زیر است.

بررسی الگوریتم MinMax | قسمت اول پیاده سازی هوش مصنوعی شطرنج

فرض کنیم شما بازیکن حداکثر کننده هستید و اولین شانس حرکت را دارید، یعنی شما در سطح بالایی هستید و حریف شما در سطح بعدی است. باتوجه‌به اینکه حریف شما نیز بهینه بازی می‌کند، به‌عنوان یک حداکثرکننده، کدام حرکت را انتخاب می‌کنید؟

ازآنجایی‌که الگوریتم مینمکس یک الگوریتم بازگشتی است، تمام حالت‌های ممکن را چک می‌کند و بعد از اتمام بررسی‌ها تصمیم‌گیری می‌کند ما نیز چنین می‌کنیم که نحوه عملکرد ملموس‌تر باشد.

شما به عنوان یک بازیکن حداکثر کننده حرکت L را انتخاب می‌کنید، آنگاه حریف شما دو انتخاب خواهد داشت یا ۳ را انتخاب کند یا این که ۵ را انتخاب کند که با توجه به نقش حداقل‌کننده ۳ را انتخاب خواهد کرد.

شما به عنوان یک بازیکن حداکثر کننده حرکت R را انتخاب می‌کنید، آنگاه حریف شما دو انتخاب خواهد داشت یا ۲ را انتخاب کند یا این که ۹ را انتخاب کند که با توجه به نقش حداقل‌کننده مسلما ۲ را انتخاب خواهد کرد.

باتوجه‌به شرایط بالا که توضیح دادیم منطقی‌تر است که شما به‌عنوان حداکثرکننده حرکت به سمت چپ (L) را انتخاب کنید که در نهایت در بدترین حالت ممکن ۳ امتیاز خواهید گرفت. در نهایت درخت بازی به شکل زیر تصویر خواهد شد.

بررسی الگوریتم MinMax | قسمت اول پیاده سازی هوش مصنوعی شطرنج

همان‌طور که در تصویر می‌بینید اگر به راست بروید در نهایت ۲ امتیاز خواهید گرفت و اگر به چپ بروید ۳ امتیاز خواهید گرفت. در واقع حداقل کننده رقیب شماست که در کل بازی سعی خواهد کرد شما کمترین امتیاز ممکن را کسب کنید و شما مدام در تلاش هستید بیشترین امتیاز را به دست آورید.

منطق شطرنج

در این مقاله به شکل خیلی ساده سعی شد که الگوریتم minmax را با مثال توضیح دهیم چرا که منطق عملکردی هوش شطرنج ما از این الگوریتم استفاده می‌کند. مثال ذکر شده خیلی ساده بود و فقط هر بازیکن اجازه یک حرکت را داشت که در نهایت ۴ حالت ممکن خواهد بود. در بازی‌ای مثل بازی دوز اولین بازیکن ۹ حالت ممکن خواهد داشت و بازیکن دوم ۸ حالت و همین‌طور الان آخر …

در بازی شطرنج تعداد حالت‌های ممکن قابل‌شمارش نیست، از طرفی موقعیت هر مهره می‌تواند در تصمیم‌گیری تأثیر داشته باشد بااین‌حال همچنان منطق حاکم پشت انتخاب حرکت همین منطق ساده است.

در مقاله بعد سعی می‌کنم با استفاده از این الگوریتم و منطق شطرنج یک بازی ساده رو مثل بازی دوز پیاده‌سازی کنیم که هم درک بهتری از نحوه کار الگوریتم داشته باشید هم نحوه پیاده‌سازی اونو ببینید.

اطلاعات

356

لینک و اشتراک