مقایسه شاخص دیویس-بولدین با فاصله درون‌خوشه‌ای در خوشه‌بندی داده‌ها

  • تاریخ ثبت: 24 آذر 1397
  • نویسندگان: محسن صابری,
  • کلمات کلیدی: خوشه‌بندی، فاصله درون‌خوشه‌ای، شاخص دیویس-بولدین، الگوریتم کلونی زنبور مصنوعی، مسئله چند ‌میانگین
خوشه‌بندی یک روش غیرمستقیم است که علی رغم سادگی می‌توان آن را به عنوان مهمترین مسئله در یادگیری بدون نظارت در نظر گرفت که با مجموعه‌ای از داده‌های بدون برچسب سروکار دارد و تلاش می‌کند تا داده‌های مشابه را در یک دسته‌ قرار دهد. (که به هر کدام از این دسته‌ها خوشه1 گفته می شود.) در این ارائه برای خوشه‌بندی داده‌ها از مسئله بهینه‌سازی چندمیانگین2 استفاده شده و در آن از «شاخص دیویس-بولدین»3 و «فاصله درون‌خوشه‌ای»4 به عنوان تابع هزینه استفاده شده و سپس با استفاده الگوریتم فراابتکاریِ کلونی زنبور مصنوعی مقدار تابع هزینه کاهش‌ یافته است. نتیجه حاصل از این مطالعه نشان می‌دهد که اگر‌چه «شاخص دیویس-بولدین» هر دو پارامتر موثر در ارزیابی خوشه‌بندی داده‌ها، یعنی «پیوستگی»5 و «تفکیک»6 را پوشش می‌دهد اما عملکرد ضعیف‌تری نسبت به «فاصله درون‌خوشه‌ای» که به پارمتر تفکیک بی توجه است و فقط پیوستگی را پوشش می‌دهد، دارد.