الگوریتم بیداری خواب
لایه های شبکه عصبی. R، G وزنه هایی هستند که توسط الگوریتم خواب خواب برای تغییر داده ها در داخل لایه ها استفاده می شود.
الگوریتم بیداری خواب [1] یک IS آموزش بدون نظارت الگوریتم برای تصادفی چند لایه [ روشن مورد نیاز ] شبکه عصبی . این الگوریتم پارامترها را طوری تنظیم می کند که تخمین گر چگالی خوبی ایجاد کند. [2] دو مرحله یادگیری وجود دارد ، مرحله "بیدار" و مرحله "خواب" که بصورت متناوب انجام می شوند.[3] این نخستین بار به عنوان الگویی برای عملکرد مغز با استفاده از یادگیری تغییرات بیزی طراحی شد . پس از آن ، الگوریتم با یادگیری ماشین سازگار شد . می توان آن را راهی برای آموزش یک ماشین هلمهولتز [4] [5] دانست.. همچنین می تواند در Deep Belief Networks (DBN) مورد استفاده قرار گیرد .
فهرست
توضیحات [ ویرایش ]
الگوریتم بیدار خواب به عنوان پشته ای از لایه های حاوی بازنمایی داده ها مشاهده می شود. [6] لایه های فوق داده هایی از لایه زیر آن را نشان می دهد. داده های واقعی در زیر لایه زیرین قرار می گیرند و باعث می شوند که لایه های بالای آن به تدریج انتزاعی تر شوند. بین هر جفت از لایه ها ، وزن شناختی و وزن تولیدی وجود دارد که برای بهبود قابلیت اطمینان در طول زمان الگوریتم آموزش دیده اند. [7]
الگوریتم بیداری خواب است همگرا [8] و می تواند تصادفی [9] اگر مناسب جایگزین.
آموزش [ ویرایش ]
آموزش شامل دو مرحله است - مرحله "بیدار" و مرحله "خواب".
مرحله "بیدار" [ ویرایش ]
نورونها توسط اتصالات شناسایی شلیک می شوند (از آنچه می تواند ورودی باشد). اتصالات تولیدی (منتهی از خروجی به ورودی) اصلاح شده و احتمال افزایش فعالیت صحیح را در لایه زیر ایجاد می کنند - نزدیک تر به داده های واقعی از ورودی حسی. [10]
مرحله "خواب" [ ویرایش ]
این روند در مرحله "خواب" معکوس می شود - سلول های عصبی توسط اتصالات تولیدی شلیک می شوند در حالی که اتصالات شناسایی در حال تغییر هستند تا احتمال افزایش فعالیت صحیح در لایه بالا را ایجاد کنند - بیشتر به داده های واقعی از ورودی حسی. [11]
خطرات احتمالی [ ویرایش ]
یادگیری بیزی متغیر مبتنی بر احتمالات است . این احتمال وجود دارد که یک تقریب با اشتباه انجام شود و به اطلاعات بیشتر اطلاعات آسیب برساند. روند نزولی دیگر مربوط به نمونه های داده پیچیده یا خراب است و استنباط یک الگوی بازنمایی را دشوار می کند.
الگوریتم خواب بیدار پیشنهاد شده است که به اندازه کافی قدرتمند برای لایه های شبکه استنتاج به منظور بازیابی یک برآوردگر خوب از توزیع خلفی متغیرهای نهفته نیست. [12]
