بررسی روشهای طبقهبندی دادههای نامتوازن پزشکی در حوزه بهداشت و درمان

  • تاریخ ثبت: 17 فروردین 1398
  • نویسندگان: سیدمحمد جوادی مقدم, فاطمه روستا
  • کلمات کلیدی: دادهکاوی، دادهکاوی در بهداشت و درمان، بهداشت و درمان
کشف دانش در پایگاه داده (KDD) با توجه به توسعهی روشها و تکنیکهای استفاده از دادهها با نگرانیهایی روبهروست. داده- کاوی، یکی از مهمترین گامها در فرآیند کشف و استخراج الگوها و دانش از حجم عظیم و نامفهومی از دادههاست. کاربرد دادهکاوی در حوزهی بهداشت و درمان، باعث پدیدار شدن سیستمهای تصمیمگیری اولیه و دیگر سیستمهای متنوع مرتبط با بهداشت و درمان شده است که بر پایهی دادههای تشخیصی و بالینی عمل میکنند. با توجه به اهمیت این حوزه و با هدف ارتقای دانش مربوط به تحقیقات دادهکاوی در این حوزه، تحقیق جاری مقا ت متعددی را از نظر روشهایی که جهت استخراج دانش به کارگرفتهاند، الگوریتمها و نتایج بدست آمده مورد بررسی قرار دادهاست. این بررسی سعی دارد تا براساس نتایج حاصله در این پژوهشها و بر اساس معیارهای عملکردی مشخص دستهبندی مناسبی از الگوریتمهای طبقهبندی ارایٔه دهد که میتواند در خط سیر پژوهشها، فرآیند تصمیمگیری و اتخاذ بهترین رویکرد، محققین این حوزه را یاری دهد. دقت و سرعت اجرای الگوریتم، توزیع دادهها و اندازهی مجموعه دادههای آموزشی، معیارهای اصلی در سنجش کارایی و اثربخشی الگوریتمها و مقایسهی آنها با یکدیگر هستند. نتایج بدست آمده حاکی از این است که الگوریتمهای آماری بهترین اثربخشی را در دستهبندی دادههای نامتوازن پزشکی داشتهاند در حالیکه الگوریتمهای مبتنی بر درخت تصمیم در این زمینه خیلی کارآمد نیستند.