طبقه بندی تحت نظارت الگوریتم آموزش ماشین: Bayes نایاب
یادگیری تحت نظارت این است که در آن شما متغیرهای ورودی (x) و یک متغیر خروجی (Y) را داشته باشید و از الگوریتم برای یادگیری تابع نقشه برداری از ورودی به خروجی استفاده می کنید.
Y = f (X)
هدف این است که تقریبی عملکرد نقشه برداری را به خوبی تنظیم کنید، زمانی که شما داده های ورودی جدید (x) را که می توانید متغیرهای خروجی (Y) برای آن داده ها را پیش بینی کنید.
این یادگیری تحت نظارت است زیرا فرآیند یادگیری الگوریتم از مجموعه داده های آموزشی می تواند به عنوان یک معلم نظارت بر فرایند یادگیری را در نظر بگیرد. ما پاسخ های صحیح را می دانیم، الگوریتم تکرار می کند پیش بینی ها بر روی داده های آموزشی و توسط معلم اصلاح می شود. یادگیری متوقف می شود زمانی که الگوریتم سطح قابل قبولی از عملکرد را به دست می آورد.
مشکلات یادگیری تحت نظارت می تواند بیشتر به مشکلات رگرسیون و طبقه بندی تقسیم شود.
طبقه بندی : مشکل طبقه بندی زمانی است که متغیر خروجی یک دسته است، مانند "قرمز" یا "آبی" یا "بیماری" و "بدون بیماری".
یکی از کاربردهای طبقه بندی نظارت شده خودروهای خود رانندگی است. اتومبیل ها باید زمانی که به سرعت و زمانی که به آرامی بر اساس زمین جاده ها آموزش دیده اند، آموزش داده شوند. وقتی که جاده صاف است و زمانی که آن کمرنگ است، سریع بروید.
به عنوان مثال، ما در طرح پراکندگی ما برای خودروی خود رانندگی 750 امتیاز می گیریم.
الگوریتم یادگیری ماشین ما چیست؟ تعریف آن چیزی است که سطح تصمیم گیری نامیده می شود. و هدف این است که یک مرزی تصمیم بگیریم که به ما کمک کند که زمین را که باید به آرامی حرکت کنیم و زمین را که می توانیم خیلی سریع به آن برسیم، کمک کنیم. این بدان معنی است که ما بتوانیم مرز را در جایی که ما بتوانیم دو کلاس را تقسیم کنیم.
بنابراین ما مرز تصمیم گیری خودمان را داریم که می توانیم بین دو طبقۀ ما تقسیم کنیم و برای هر نقطه دلخواه بلافاصله می توان آن را به عنوان زمین شناسی طبقه بندی کرد، جایی که ما باید به آرامی حرکت کنیم یا جایی که می توانیم خیلی سریع حرکت کنیم.
بنابراین برای این مرز تصمیم گیری از الگوریتم به نام Algorithm Bayes Naive Gauss استفاده می کنیم که از کتابخانه Scicit-learn یا Sklearn Python استفاده می کند.
الگوریتم Bayes نایاب گاوس:
Bayes نایاب یک الگوریتم طبقه بندی برای مشکلات دوگانه (دو کلاس) و طبقه بندی چند طبقه است. این تکنیک ساده تر از زمانی است که با استفاده از مقادیر ورودی باینری یا قطعی توصیف می شود.
این الگوریتم به دو مرحله، آموزش و تست تقسیم می شود.
- در مرحله آموزش،
- ما بعضی نقاط آموزشی ایجاد می کنیم.
- ماژول sklearn برای GaussianNB را از sklearn.naive_bayes وارد کنید
- ایجاد طبقه بندی
- متناسب با ویژگی های آموزشی و برچسب ها طبقه بندی شده است. یعنی آموزش - جایی که ما در واقع داده های آموزشی را به آن داده و الگوها را یاد می گیریم.
- سپس برچسب ها را برای نقاط جدید پیش بینی می کنیم.
اکنون در مرحله آزمایش،
ما دریافتیم که چگونه الگوریتم ما با نوشتن یک کد به ما می گوید که چه دقت از این طبقه بندی naive_bayes است که ما ساخته ایم. درست است تعداد دقیق هایی که صحیح طبقه بندی شده با تعداد کل، امتیاز در آزمون تنظیم.
کد مثال:
>>> از sklearn.metrics import accuracy_score
>>> accuracy_score (y_true، y_pred)
به این ترتیب ما می توانیم پیش بینی کنیم که کدام داده ها به چه گروهی تعلق دارند و دقت الگوریتم پیش بینی ما را با استفاده از sklearn پیدا کنیم.