یادگیری ماشین قطعی در مقابل تصادفی

  • 2022-11-15

در یادگیری ماشین از روشهای قطعی و تصادفی در بخشهای مختلف بر اساس سودمندی استفاده میشود. یک فرایند قطعی معتقد است که میانگین نرخ های شناخته شده بدون انحراف تصادفی برای جمعیت های عظیم اعمال می شود. از طرف دیگر یک فرایند تصادفی مجموعه ای از متغیرهای تصادفی مرتب شده با زمان را تعریف می کند که مسیرهای نمونه بالقوه را منعکس می کند. در این مقاله به تفاوت های اساسی بین عملکرد و برنامه های کاربردی می پردازیم. نکات اصلی مورد بحث در این مقاله در زیر شرح داده شده است.

فهرست مطالب

  1. مدل سازی فرایند قطعی و تصادفی
  2. چه زمانی می تواند هر دو مورد استفاده قرار گیرد?
  3. چگونه این روش کار?
  4. اشکال مختلف الگوریتم های تصادفی و قطعی
  5. مزایا و معایب قطعی و تصادفی
  6. کاربردهای الگوریتم های قطعی و تصادفی

بیایید با یک مرور کلی سطح بالا از فرایندهای قطعی و تصادفی شروع کنیم.

مدل سازی فرایند قطعی و تصادفی

مدل سازی قطعی تولید نتایج سازگار برای یک مجموعه داده شده از ورودی, بدون در نظر گرفتن چند بار مدل محاسبه شده است. ویژگی های ریاضی در این مورد شناخته شده است. هیچ کدام تصادفی نیستند و هر مشکل فقط یک مجموعه از مقادیر مشخص شده و همچنین یک پاسخ یا راه حل دارد. اجزای ناشناخته در یک مدل قطعی خارج از مدل هستند. این نتایج با نتایج قطعی به نتایج تصادفی مخالف می پردازد و کمک هزینه برای خطا را ندارد.

بلامی

برای دوز هفتگی خود از مواردی که در فناوری نوظهور وجود دارد ثبت نام کنید.

در مقابل, مدل سازی تصادفی ذاتا غیر قابل پیش بینی است, و اجزای ناشناخته به مدل یکپارچه. این مدل تعداد زیادی از پاسخ ها و نتایج را تولید می کند مانند اضافه کردن متغیرها به یک مشکل ریاضی دشوار برای دیدن اینکه چگونه بر راه حل تاثیر می گذارد. سپس روش یکسان چندین بار در تنظیمات مختلف انجام می شود.

شما به دنبال یک مخزن کامل از کتابخانه های پایتون مورد استفاده در علوم داده, چک کردن در اینجا .

چه زمانی می تواند هر دو مورد استفاده قرار گیرد?

یک مدل قطعی در مواردی اعمال می شود که نتایج دقیقا از طریق یک رابطه شناخته شده بین حالت ها و رویدادهایی که هیچ تصادفی یا عدم اطمینان وجود ندارد تعیین شود.

مثلا اگر بدانیم که مصرف مقدار ثابت قند باعث افزایش 2 برابر چربی در بدن می شود. سپس ' بله ' همیشه می توان دقیقا تعیین کرد که مقدار 'ایکس' شناخته شده است.

به همین ترتیب زمانی که رابطه بین متغیرها ناشناخته یا نامشخص است می توان از مدل سازی تصادفی استفاده کرد زیرا به تخمین احتمال احتمال وقایع متکی است.

به عنوان مثال بخش بیمه در درجه اول به مدل سازی تصادفی بستگی دارد تا پیش بینی کند که ترازنامه های شرکت در اینده چگونه ظاهر می شوند.

چگونه این روش کار?

مدل های قطعی رابطه بین نتایج و عوامل موثر بر نتایج را نشان می دهند. برای این نوع مدل ها باید رابطه بین متغیرها مشخص یا مشخص شود.

بیایید ساختن یک یادگیرنده ماشینی را در نظر بگیریم که بتواند در دوی 100 متر به یک ورزشکار کمک کند و مهمترین عامل در دوی 100 متر زمان است. هدف این مدل به حداقل رساندن زمان ورزشکار خواهد بود. دو عامل مهم موثر بر زمان سرعت و مسافت است.

مسافت طی شده توسط هر ورزشکاری یکسان است, برای همه ثابت است, تنها چیزی که متفاوت است سرعت است. اما سرعت های مختلف می تواند کنترل شود به عنوان عوامل موثر بر سرعت به عنوان موقعیت بدن شناخته شده, زمان پرواز, و غیره. زیرا می دانیم زمان به سرعت و مسافت بستگی دارد این مشکل را قطعی می کند.

جنبه تصادفی الگوریتم های یادگیری ماشین بیشتر در رویکردهای پیچیده و غیرخطی مورد استفاده برای حل مشکلات مدل سازی پیش بینی طبقه بندی و رگرسیون مشهود است. این روشها از تصادفی سازی در فرایند ساخت یک مدل از دادههای اموزشی استفاده میکنند و در نتیجه مدل متفاوتی برازش مییابد که هر بار الگوریتم مشابهی بر روی دادههای مشابه اجرا میشود.

در نتیجه, زمانی که در یک مجموعه داده تست نگهدارنده تست, مدل کمی اصلاح شده انجام متفاوت. به دلیل این رفتار تصادفی باید عملکرد مدل را با استفاده از امار خلاصه ای توصیف کرد که میانگین یا عملکرد پیش بینی شده مدل را نشان می دهد تا عملکرد مدل از هر جلسه تمرینی.

بیایید یک مشکل نورد را در نظر بگیریم. شما در حال نورد یک قالب در یک کازینو. اگر شما رول شش یا یک, شما برنده جایزه نقدی. در ابتدا یک فضای نمونه که شامل تمام امکانات برای نتایج رول می شود تولید می شود. احتمال برای هر تعداد در حال نورد محاسبه شده است که '0.17'. اما ما فقط به دو عدد '6' و '1' علاقه داریم. بنابراین احتمال نهایی 0.33 خواهد بود. این است که چگونه یک مدل تصادفی کار می کند.

بیایید نگاهی بیندازیم که چگونه یک مدل رگرسیون خطی می تواند هم به عنوان یک مدل قطعی و هم به عنوان یک مدل تصادفی در سناریوهای مختلف کار کند.

مدل های قطعی پیوند دقیق بین متغیرها را تعریف می کنند. در سناریوی قطعی رگرسیون خطی سه مولفه دارد. متغیر وابسته 'بله', متغیر مستقل 'ایکس' و رهگیری 'ج'. در اینجا یک معادله به عنوان مثال برای تکرار توضیحات فوق وجود دارد.

معادله فوق دارای نمودار چیزی شبیه به این با تمام نقاط داده در یک خط مستقیم است.

یک مدل تصادفی که خطای تصادفی را در نظر می گیرد. یک مولفه قطعی و همچنین یک مولفه خطای تصادفی وجود دارد. پیوند احتمالی بین بله و ایکس در این پارادایم فرضیه شده است. در اینجا یک معادله به عنوان مثال برای تکرار توضیح فوق وجود دارد.

در نمودار فوق میتوان مشاهده کرد که با توجه به مولفه خطا در معادله رگرسیون خطی تصادفی بودن در دادهها وجود دارد.

اشکال مختلف الگوریتم های تصادفی و قطعی

تحلیل اجزای اصلی

این یک رویکرد قطعی است زیرا هیچ پارامتری برای مقداردهی اولیه وجود ندارد. این خط از طریق مرکز با کوچکترین مجموع مربع فاصله بین نقاط با توجه به مجموعه ای از نقاط در فضای ن بعدی می یابد. شناسایی خطی که پیش بینی نقاط روی این خط به اندازه امکان پذیر است همان چیزی است (همانطور که با مجموع طول مربع اندازه گیری می شود).

سپس با محدودیت متعامد بودن به خط اول خط را از طریق مرکز با کمترین مجموع فواصل مربع تا نقاط پیدا می کند. مولفه اصل سوم, چهارم, و غیره. زیرا همه این روش ها به سادگی هندسی هستند, اجزای اصلی توابع داده قطعی هستند.

وزن نزدیکترین همسایگان

یک روش وزندار نزدیکترین همسایه نیز میتواند یک روش قطعی نامیده شود. این تکنیک از یک امار شناخته شده به عنوان "تابع توزین."وزن با گرفتن معکوس فاصله تعیین می شود. زیرا فاصله بین هر نقطه داده و نقطه پرس و جو در هر تکرار یکسان خواهد بود, وزن یک اصطلاح قطعی خواهد بود.

فرایند پواسون

روش پواسون یک فرایند تصادفی است که تعداد تصادفی نقاط یا وقایع را در طول زمان نمایش می دهد. تعداد نقاط در یک فرایند است که بین صفر و یک دوره خاص می افتد به عنوان یک متغیر تصادفی پواسون وابسته به زمان مشخص. مجموعه شاخص این فرایند از اعداد صحیح غیر منفی و فضای حالت از اعداد طبیعی تشکیل شده است. این روش به عنوان فرایند شمارش پواسون شناخته می شود زیرا ممکن است به عنوان یک عمل شمارش در نظر گرفته شود.

روند برنولی

فرایند برنولی مجموعه ای از متغیرهای تصادفی است که به طور تصادفی توزیع می شوند و هر کدام شانس یک یا صفر دارند. این روش مشابه به طور مستمر کوه در می رم یک سکه است, با احتمال برنده شدن بودن پ و ارزش بودن یک, و احتمال اخذ یک دم بودن صفر. به عنوان نتیجه احتمالی است که به همین دلیل این روش یک فرایند تصادفی است.

پیاده روی تصادفی

پیاده روی تصادفی ساده یک فرایند تصادفی با زمان گسسته است که از اعداد صحیح به عنوان فضای حالت استفاده می کند که بر اساس یک فرایند برنولی است و هر متغیر برنولی مقدار مثبت یا منفی می گیرد.

مزایا و معایب قطعی و تصادفی

بیایید نگاهی به مزایا و معایب هر دوی این فرایندها بیندازیم.

مزایا

  • مدل های قطعی از ساده بودن بهره مند می شوند.
  • درک قطعی ساده تر است و از این رو ممکن است برای برخی موارد مناسب تر باشد.
  • مدل های تصادفی انواع نتایج احتمالی و احتمال نسبی هر یک را فراهم می کنند.
  • مدل تصادفی از رایج ترین روش برای دستیابی به نتایج استفاده می کند.

اشکالاتی

  • در رویکرد قطعی هیچ احتمال تجمعی وجود ندارد که به همین دلیل موارد ذخیره کم بیش از حد خوش بین هستند.
  • در رویکرد تصادفی مدل پیچیدهتر است که رویکرد جعبه سیاه نیز نامیده میشود.
  • تعصبات ممکن است در مدل تصادفی پنهان باشد و بر افراط و تفریط تمرکز کند.

کاربردهای الگوریتم های قطعی و تصادفی

  • مدل های قطعی در تجزیه و تحلیل خطر سیل استفاده می شود.
  • مدل قطعی مورد استفاده در ماشین تورینگ یک ماشین است (اتوماتیک) قادر به شمارش هر زیر مجموعه دلخواه رشته های الفبای قابل قبول است. یک ماشین تورینگ دارای یک نوار بی نهایت طولانی است که برای اجرای عملیات خواندن و نوشتن است.
  • هدف مدلهای سرمایهگذاری تصادفی تخمین تغییرات قیمت و بازده داراییها و کلاسهای دارایی (مانند اوراق قرضه و سهام) در طول زمان است. با استفاده از شبیه سازی مونت کارلو, که ممکن است شبیه سازی چگونه یک نمونه کارها را انجام بر توزیع احتمال بازده سهام فردی بر اساس.
  • مدل سازی تصادفی بر بازاریابی و تغییر حرکت سلیقه ها و ترجیحات مخاطبان و همچنین درخواست و جذابیت علمی فیلم های سینمایی خاص تاثیر می گذارد (به عنوان مثال, افتتاحیه, دهان به دهان, دانش ذهن بالا در میان گروه های مورد بررسی, شناخت نام ستاره, و سایر عناصر اطلاع رسانی و تبلیغات رسانه های اجتماعی).

نتیجه گیری

یک رویکرد قطعی ساختاری ساده و قابل فهم دارد که تنها در صورت تعیین رابطه بین متغیرها قابل اعمال است. با استفاده از این مقاله تفاوت بین رویکردهای قطعی و تصادفی در یادگیری ماشین را درک کرده ایم.

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.