طبقه بندی

 

طبقه بندی

طبقه بندی همانند بحث خوشه بندی رابطه ی نزدیکی با یادگیری ماشین دارد. مسائل مربوط به طبقه بندی را می توان مسائل یادگیری با نظارت نیز به حساب آورد. برای این که مفهوم طبقه بندی را راحت تر درک کنید به مثال زیر توجه نمایید.
بانکی را در نظر بگیرید که قرار است به تعداد زیادی از متقاضیان دست چک بدهد بانک ویژگی های زیر را در نظرمی گیرد.

  1. مقدار سپرده گذاری
  2. داشتن ملک
  3. میزان درآمد

از طرفی این را نیز در نظر می گیرد که آیا فرد در گذشته دارای چک برگشتی بوده است یا خیر.

جدول زیر با توجه به مطلب گفته شده بدست آمده است.

 

 

چک برگشتی

میزان در آمد

داشتن ملک

مقدار سپرده گذاری

نام

ندارد

1.000.000

1

700.000

علی

دارد

800.000

0

600.000

محمد

 

 

با توجه به این که تعداد افراد متقاضی بسیار زیاد است بانک نمی تواند برای هر کدام از افراد جدول بالا را تکمیل کند در این مرحله می توان از طبقه بندی برای اطلاعات استفاده نمود.

طبقه بندی، این گونه به بانک کمک می کند که ویژگی هایی مانند مقدار سپرده گذاری ، داشتن ملک و میزان درآمد را گرفته و با توجه به نتایج قبلی مشخص می کند که آیا فرد دارای چک برگشتی است یا خیر.

 

مفاهیمی که مهم است در رابطه با طبقه بندی بدانید عبارتند از:

  • بُعد:

به هرکدام از ویژگی های مطرح شده در مسئله بُعد گویند؛ به طور مثال جدول فوق دارای سه بُعد می باشد.

 

  • برچسب:

بخشی از جدول یا اطلاعات که مشخص می کند فرد در کدام دسته قرار گرفته است. در جدول فوق ستون چک برگشتی برچسب می باشد که افراد را در دو دسته داشتن یا نداشتن چک برگشتی قرار می دهد.

 

همان طور که در ابتدا مقاله گفته شد مسائل مربوط به طبقه بندی را می توان با رویکرد یادگیری با نظارت مورد بررسی قرار داد. در مثال فوق یک ناظر ابتدا برچسب های مربوط به چند متقاضی را تکمیل می کند و سپس یاد گیری با نظارت با توجه به مقدارهای قرار گرفته توسط ناظر برای متقاضیان گذشته  و همچنین اطلاعات دیگر افراد مانند مقدار سپرده گذاری و … برچسب های متقاضیان جدید را تعیین می کند.