تعادل در تنگل IOTA قسمت دوم
در مقاله تعادل در تنگل IOTA اهمیت یافتن تعادل نش برای بازی اتصال تراکنش ها به تنگل را توضیح دادیم. در مقاله (Equilibria in the tangle) وجود آن را ثابت کردیم و نشان دادیم که در این مرحله، همه گرههای خودخواه استراتژی مشابهی را در انتخاب تیپ در تنگل IOTA انتخاب میکنند. با این حال، ما هنوز باید ببینیم که این تعادل نش چه چیزی است. در حالی که این تئوری وجود یک تعادل نش “تقریبا متقارن” را اثبات می کند، این نتیجه چیزی در مورد ماهیت استراتژی و تأثیر آن بر عملکرد کلی تنگل نمی گوید. با توجه به پیچیدگی سیستم، برای تحلیل این نکات باید به شبیه سازی های کامپیوتری روی بیاوریم.
برای آشنایی بیشتر با تعادل نش، مقالات نگاهی مقدماتی به نظریه بازی ها و کاربرد نظریه بازی ها در ارزهای دیجیتال را مطالعه نمایید.
در طی چند هفته، شبیهسازیهای تنگل بر روی یک پردازنده Intel Xeon 12 با فرکانس 3.20 گیگاهرتز اجرا شد. نمونههایی از تقریباً 50000 تراکنش آزمایش شد که پارامترهای مختلف مربوط به نرخ ورود تراکنشهای جدید (λ)، هزینه (متغیری شبیه به میانگین زمان مورد نیاز برای تایید یک تراکنش)، “randomness” الگوریتم انتخاب تیپ تصادفی پیشفرض (α)، تاخیر انتشار شبکه (h) و درصد گره هایی که خودخواهانه رفتار می کنند در آن ها متغیر بود.
از طریق این شبیهسازیها، ما توانستیم تعادلهایی را برای انواع خاصی از استراتژیهای آزمایششده پیدا کنیم و نشان دادیم که، حتی زمانی که بخش بزرگی از گرهها یک استراتژی انتخاب تیپ حریصانه را در انتخاب تیپ در تنگل IOTA انتخاب میکنند، با خودخواه بودن چیز زیادی برای به دست آوردن ندارند. علاوه بر این، ما نشان دادیم که گرههای غیر خودخواه، با استفاده از استراتژی انتخاب تیپ پیشفرض، کارایی خود را با حضور گرههای حریص به طور قابل توجهی از دست نخواهند داد.
برای شروع، فرض کنید نسبت گرههای خودخواه که میتوانند بین استراتژی انتخاب تیپ پیشفرض و یک استراتژی خاص انتخاب تیپ «بهینهشده» انتخاب کنند، ثابت است و با γ ارائه میشود. بقیه گره ها نمی توانند استراتژی خود را انتخاب کنند، بنابراین همیشه از استراتژی پیشفرض استفاده می کنند. چنین بازیای با استراتژی مختلط معادل بازی دیگری خواهد بود که در آن بخشی از گرههای حریص، استراتژی بهینهشده و بقیه گرههای خودخواه، استراتژی پیشفرض را انتخاب میکنند. صرفا برای ساده سازی، از این به بعد این بازی جایگزین را در نظر داریم.
سپس، میپرسیم: از بین این گرههای خودخواه، چه تعداد با اراده خودشان استراتژی پیشفرض را در انتخاب تیپ در تنگل IOTA انتخاب میکنند؟ البته این نسبت را در نقطهای بررسی میکنیم که هزینه انتخاب استراتژی پیشفرض برابر با هزینه انتخاب استراتژی بهینهشده است. یعنی نقطهای که هیچ بازیکن خودخواهی با انحراف از استراتژی فعلی خود چیزی برای به دست آوردن ندارد. ما این نقطه را تعادل نش می نامیم.
برای یک سیستم معین (یعنی برای λ/h و α معین) هزینههای گرهها فقط به p بستگی دارد، یعنی درصد تراکنشهای صادر شده تحت استراتژی بهینهشده. (توجه داشته باشید که اگر γ درصد از گرهها خودخواه را در سیستم داشته باشیم و θ درصد از این گره ها استراتژی بهینهشده را انتخاب می کنند، خواهیم داشت: p=γθ). بنابراین، وقتی در مورد یافتن تعادل نش صحبت می کنیم، حتی اگر در مورد مقادیر θ، یعنی متغیر مربوط به استراتژی گره های حریص، صحبت کنیم، باید بررسی و مطالعه کنیم که چگونه هزینه ها در p تغییر می کند. سپس، این درصد p را به متغیر θ ترجمه می کنیم.
سه نتیجه ممکن وجود دارد:
- استراتژی پیش فرض همیشه برای همه مقادیر ممکن p بهتر است. در این حالت، تمام گره های خودخواه استراتژی پیش فرض را انتخاب می کنند (یعنی θ=0).
- استراتژی «بهینه شده» همیشه برای همه مقادیر ممکن p بهتر است. همه گرههای خودخواه، استراتژی «بهینهسازی شده» را انتخاب میکنند (یعنی θ=1).
- اگر هیچ یک از دو گزینه بالا درست نباشد، استراتژی پیشفرض با استراتژی «بهینهسازی شده» در یک نقطه خاص p برابری میکند. در این p (در واقع، در θ مربوط به این p)، تعادل نش سیستم پیدا خواهد شد.
برای نمودار زیر (شکل ۱)، استراتژی پیشفرض مورد استفاده در شبیه سازی، در انتخاب تیپ در تنگل IOTA ، دارای درجه بالایی از تصادفی بودن (0.01 = α) بود. شبیه سازی ها برای دو نرخ تراکنش ورودی (λ = 25 و λ = 50) اجرا شد. حال می پرسیم: کدام یک از سه سناریوی ممکن بالا درست خواهد بود؟ آیا گره های خودخواه همیشه استراتژی پیش فرض را انتخاب می کنند؟ یا همیشه استراتژی “بهینهشده” را انتخاب می کنند؟ یا فقط نسبتی از این گره ها یک استراتژی را بر دیگری انتخاب می کنند؟
در موارد نشان داده شده، هزینه استراتژی پیشفرض با هزینه استراتژی بهینهشده تلاقی می کند. نسبت گره هایی که از استراتژی بهینهشده استفاده می کنند در این نقطه تقاطع تقریباً 0.07=p برای 25=λ و 0.12=p برای 50=λ است. اکنون این درصدهای p باید به θ ترجمه شوند، جایی که نقاط تعادل نش خواهد بود. برای انجام این کار، با استفاده از دو مثال مجزا، دادهها را برای λ=25 تجزیه و تحلیل میکنیم که ما را به دو نتیجه احتمالی این مسئله هدایت میکند.

- فرض کنید که γ=0.5 درصد از گره ها خودخواهانه رفتار می کنند. حداکثر درصد ممکن تراکنش های صادر شده تحت استراتژی بهینهشده کدام است؟ واضح است که 0.5 است، زیرا گره های غیر حریص نمی توانند استراتژی بهینهشده را انتخاب کنند. بنابراین، p≤0.5 خواهد بود. حال برای به دست آوردن درصد تراکنش های صادر شده تحت استراتژی بهینهشده از p=0.07، باید θ=0.14 باشد. بنابراین، این تعادل نش خواهد بود.
- حال فرض کنید که γ=0.05 درصد از گره ها خودخواهانه رفتار می کنند. حداکثر درصد تراکنش های صادر شده تحت استراتژی بهینهشده کدام است؟ واضح است که به همان دلایل مثال قبل، 0.05 است. بنابراین، p ممکن، p≤0.05 خواهد بود، به این معنی که، در این حالت، ما همیشه یک استراتژی «بهینه» با هزینه کمتر، برای همه مقادیر p ممکن خواهیم داشت. بنابراین، همه گرههای خودخواه، استراتژی بهینه شده را انتخاب میکنند (یعنی θ=1).
به طور خلاصه، اگر هزینههای گرههای تحت استراتژی بهینه شده برابر با هزینههای گرههای تحت استراتژی پیش فرض در p=p باشد، تعادل نش در θ = min (1,p/Y) خواهد بود. یکی از کاربردهای مستقیم احتمالی این اطلاعات (در جنبه نظریه بازی) می تواند برای بهبود الگوریتم انتخاب تیپ پیش فرض در انتخاب تیپ در تنگل IOTA باشد. اگر الگوریتم انتخاب تیپ پیشفرض فعلی را برای الگوریتمی که از p درصد مواقع استراتژی بهینه شده و مابقی مواقع استراتژی پیش فرض را استفاده میکند تغییر دهیم، از آن جا که گرههای خودخواه در حالت تعادل نیز به آن نقطه تمایل پیدا میکنند، گرههای خودخواه هیچ انگیزهای برای انحراف از استراتژی پیش فرض نخواهند داشت.
اکنون که تعادل نش را پیدا کردهایم، یک سوال بیپاسخ باقی میماند: وجود استراتژیهای حریصانه چه هزینهای بر عملکرد کلی سیستم تحمیل میکند؟ آیا گره های غیر خودخواه (در مقایسه با موقعیتی که اصلاً گره خودخواهانه وجود ندارد) به طور معناداری آسیب می بینند؟
نمودار زیر (شکل۲) میانگین افزایش هزینه تحمیل شده بر گره های دنبال کننده استراتژی پیش فرض توسط گره های خودخواه را نشان می دهد. فرض کنید W(p) هزینه های گره های غیر خودخواه نشان داده شده در شکل ۱ باشد. افزایش هزینه به صورت (W(p)-W(0))/W(0) محاسبه می شود، بنابراین افزایش هزینه تفاوت هزینه یک گره غیر خودخواه در حضور p درصد تراکنش خودخواهانه و هزینه یک گره غیر خودخواه وقتی که اصلاً تراکنش خودخواهانهای وجود ندارد. همانطور که در نمودار نشان داده شده است، میانگین افزایش هزینه تحمیل شده بر روی گره های غیر خودخواه در واقع منفی است، به این معنی که وجود گره های خودخواه، به طور متوسط، هیچ آسیبی به سایر گره ها برای α های پایین وارد نمی کند.

توجه داشته باشید که نتیجه بالا لزوماً برای α بالاتر صدق نمی کند. همچنین، ما در اینجا ادعا نمی کنیم که گره های خودخواه همیشه به غیر خودخواهان کمک میکنند، زیرا ما فقط میانگین ها را تجزیه و تحلیل میکنیم، نه تمام حالت های هزینه های گره را. به عنوان مثال، توزیع های گسترده (به این معنی که برخی از گره ها هزینه بسیار کم و برخی دیگر هزینه بسیار بالایی دارند) ممکن است عملکرد سیستم را مختل کند. بنابراین در مطالعات بعدی باید تحلیل عمیق تری در این زمینه صورت گیرد.
علاوه بر این، سود گرههای خودخواه نسبت به گرههای غیر خودخواه در مقایسه با برخی رشدهای ذاتی در هزینههای محاسباتی از نظر اقتصادی جذاب نیست، به این معنی که سود حاصل از اقدام خودخواهانه در مقایسه با سود حاصل از الگوریتم انتخاب تیپ گره های غیر خودخواه کمتر است (در شکل ۳ توجه داشته باشید که حداکثر بهره ممکن در این مورد کمی بیش از 10٪ است). همچنین، ما “هزینه های اجتماعی” حریص بودن را در نظر نمی گیریم، زیرا وقتی گره ای خودخواه تشخیص داده می شود، می تواند توسط گره های دیگر کنار گذاشته شود، به این معنی که در دراز مدت، این گره ممکن است از شبکه ترد شود، مخصوصا زمانی که هیچ کس دیگر گره ها را مجبور به انجام این کار نمی کند.

به طور خلاصه، نتایج اولیه این تحقیق در مورد چگونگی تکامل تنگل در حضور گرههای خودخواه را بیان کرده است. تحقیقات بیشتر شامل گسترش فضای استراتژیهای انتخاب تیپ حریصانه احتمالی، اجرای شبیهسازی با تکنیکهای ML و AI و ادامه بهینهسازی الگوریتم پیش فرض انتخاب تیپ در تنگل IOTA خواهد بود تا این استراتژی هم برای گرههای خودخواه و هم غیر خودخواه بهینه باشد.
منبع:
https://blog.iota.org/equilibria-in-the-tangle-let-me-try-to-explain-part-2-6dcc8e7c0ad8/