¸Ó½Å·¯´×Àº ÁÖ¾îÁø µ¥ÀÌÅ͸¸À» ÀÌ¿ëÇÏ¿© ¿¹Ãø, ºÐ·ù, Â÷¿øÃà¼Ò, »ý¼º, Àç»ý µîÀ» ½ÇÇàÇÏ´Â µ¥ÀÌÅÍ°úÇÐ ¸ðÇüÀ» ¸»ÇÑ´Ù. Åë°èÇп¡¼´Â µ¥ÀÌÅÍ¿¡ ´ëÇÑ °¡Á¤À» ¹ÙÅÁÀ¸·Î »ó´çÇÑ ¼öÁØÀÇ Åë°èÀû, ¼öÇÐÀû Áö½ÄÀ» ÀÌ¿ëÇÏ¿© ÃßÁ¤, °ËÁ¤, ¿¹Ãø µîÀÇ Åë°èÀû Ãß·ÐÀ» ÇÏ°Ô µÈ´Ù. ±×·¯³ª ¸Ó½Å·¯´×Àº µ¥ÀÌÅÍ¿¡ ´ëÇÑ °¡Á¤ ¾øÀÌ ÁÖ¾îÁø µ¥ÀÌÅ͸¸À¸·Î ÁÁÀº Åë°èÀû Ãß·ÐÀ» µµÃâÇÒ ¼ö ÀÖµµ·Ï µ¥ÀÌÅÍÀÇ split, sample weights, resampling, randomization µîÀ¸·Î Åë°èÇÐÀÇ ±âº»Á¶°ÇÀ» ÃæÁ·½ÃÅ°°í ÀÖ´Ù. ±×·¯¹Ç·Î Åë°èÇÐÀÇ ±âº»Á¶°ÇÀÌ ¹«¾ùÀÎÁö¸¦ ¾Ë¾Æ¾ß ¸Ó½Å·¯´×ÀÇ ±Ù°£À» ÀÌÇØÇÒ ¼ö ÀÖ°í À̸¦ ¹ÙÅÁÀ¸·Î ÀڽŸ¸ÀÇ ¼º´ÉÀÌ ¿ì¼öÇÑ ¸Ó½Å·¯´× ¸ðÇüÀ» °³¹ßÇÒ ¼ö ÀÖ´Ù.
Åë°èÇÐÀÇ ±âº»Á¶°ÇÀº ÁÖ¾îÁø µ¥ÀÌÅÍ°¡ ¹ÌÁöÀÇ ¸ðÁý´ÜÀ¸·ÎºÎÅÍÀÇ ÀÓÀÇÇ¥º»À̸ç, ÀÌ·¯ÇÑ ÀÓÀÇÇ¥º»Àº ¹Ýº¹Çؼ ÃßÃâÇÒ ¼ö ÀÖ´Ù´Â °¡Á¤ÀÌ´Ù. ÀÓÀÇÇ¥º»À̶õ Ç¥º»ÀÌ ¹ÌÁöÀÇ ¸ðÁý´ÜÀ¸·ÎºÎÅÍ ÇÏ°Ô ÃßÃâµÇ¾ú´Ù´Â Àǹ̷Î, °£´ÜÇÏ°Ô ¸»Çؼ ÁÖ¾îÁø µ¥ÀÌÅÍ°¡ ¹ÌÁöÀÇ ¸ðÁý´ÜÀ» Àß ´ëÇ¥ÇÏ°Ô »ÌÇû´Ù´Â ¸»ÀÌ µÈ´Ù. µÎ ¹ø° °¡Á¤ÀÎ ¹Ýº¹Àû ÀÓÀÇÇ¥º»ÃßÃâÀº Åë°èÇÐÀÇ ÀÌ·ÐÀû Ãß·ÐÀ» °¡´ÉÇÏ°Ô ÇÏ¿© ¼ö¸®Åë°èÇаú È®·ü·ÐÀÇ ±Ù°£À» Á¦°øÇÑ´Ù.
±×·¯³ª ½ÇÁ¦ ¹®Á¦¿¡¼´Â µ¥ÀÌÅͼ Çϳª¸¸ °üÃøµÇ¾úÀ» »ÓÀÌ´Ù. ¸Ó½Å·¯´×¿¡¼´Â µ¥ÀÌÅÍÀÇ shufflingÀ» ÀüÁ¦·Î ÇÑ split°ú resamplingÀ» ÅëÇØ, Åë°èÇÐÀÇ ÀÓÀÇÇ¥º»°ú ¹Ýº¹ÃßÃâµÈ ÀÓÀÇÇ¥º»À» ½ÇÁ¦·Î ±¸ÇöÇؼ ´Ù¾çÇÑ Åë°èÀû Ãß·ÐÀ» ÇÏ°Ô µÈ´Ù. ÀÌ ÀÌ»óÀÇ Ãß°¡ÀûÀÎ ¼öÇÐÀû, Åë°èÀû Áö½ÄÀº ºÒÇÊ¿äÇÏ´Ù. Åë°èÇп¡¼Ã³·³ ¸ðÇüÀº ¸ÂÁö¸¸ ¸ðÇü¿¡ ÀÖ´Â ¸ð¼ö¸¸ ¸ð¸¥´Ù´Â ºÒÇÕ¸®ÇÑ °¡Á¤µµ ÇÏÁö ¾ÊÀ¸¸ç, ´ÜÁö µ¥ÀÌÅÍÀÇ splitÀ» ÅëÇØ ¸ðÇüÀÌ ¸Â´ÂÁö ±×¸®°í ¸ð¼öÃßÁ¤ÀÌ Á¦´ë·Î µÇ¾ú´ÂÁö¸¦ ½±°Ô Á¡°ËÇÒ ¼ö ÀÖ´Ù. resamplingÀ» ÅëÇØ º¸´Ù Á¤¹ÐÇÑ Åë°èÀû Ãß·ÐÀÌ °¡´ÉÇÏ°í ƯÈ÷ baggingÀ̶ó´Â ¾Ó»óºí·¯´×À» ½ÇÇàÇÒ ¼ö ÀÖ´Ù. Ç¥º»º° Áß¿äµµ¿¡ µû¶ó °¡ÁßÄ¡¸¦ ºÎ¿©ÇÏ´Â °ÍÀ» Ç¥º» weights¶ó°í ÇÑ´Ù. Ç¥º» weight´Â K-nearest neighborhood¸¦ ±â¹ÝÀ¸·Î ÇÏ´Â ¸ðµç Åë°èÀû ±â¹ý°ú ÃÖ÷´Ü ¸ðÇüÀÎ boosting¿¡¼ »ç¿ëÇÏ¸ç ¸Ó½Å·¯´×¿¡¼ ¸ð¼ö¸¦ ÃßÁ¤Çϱâ À§ÇÑ ¸ñÀûÇÔ¼öÀÎ ¼Õ½ÇÇÔ¼ö¿¡ ÀÌ¿ëµÈ´Ù. randomizationÀº ¸ðÇüÀÌ ºÒÇÊ¿äÇÑ ÀâÀ½(noise)¸¶Àú ÇнÀÇß´ÂÁö¸¦ Á¡°ËÇÏ´Â Áß¿äÇÑ ¼ö´ÜÀÌ´Ù.
±×·¯¹Ç·Î split, sample weights, resampling, ±×¸®°í randomization¶ó´Â keyword¸¦ °¡Áö°í ÀÌ Ã¥À» Àаí ÀÌÇØÇÑ´Ù¸é ¿©·¯ºÐÀº Åë°èÀû ±âº»¿ø¸®¿Í ¸Ó½Å·¯´×ÀÇ ¹æ¹ý·ÐÀÌ ¾î¶»°Ô À¶ÇյǾú´ÂÁö¸¦ ½ÀµæÇß´Ù°í »ý°¢Çصµ µÈ´Ù. ±×·¯¸é ÀÌ Ã¥ÀÇ ÁÖÁ¦ÀÎ Åë°èÀû ¸Ó½Å·¯´×¿¡ ÀÌ¾î¼ °øºÎÇØ¾ß ÇÒ µö·¯´×, °ÈÇнÀ, XAI, ±×¸®°í ÇÊ¿ä½Ã ½Ã°è¿ºÐ¼®±îÁö AI ºÐ¼® ¸ðÇüµéÀÇ ¿©ÇàÀ» Å« ¾î·Á¿ò ¾øÀÌ ³ª¾Æ°¥ ¼ö ÀÖÀ» °ÍÀÌ´Ù. ÀÌ·¯ÇÑ °üÁ¡¿¡¼ Á¦1ÀåÀ» ²Ä²ÄÈ÷ ÀÐ¾î º¸°í ÁÖ¾îÁø Äڵ带 ½ÇÇàÇØ º¸´Â °ÍÀº ¾ÕÀÇ ³× °¡Áö keywords¸¦ üÇèÀûÀ¸·Î ÀÌÇØÇÒ ¼ö ÀÖµµ·Ï ÇØÁØ´Ù.
ÁÁÀº Ã¥À» À§ÇØ ÃÖ¼±À» ´ÙÇßÁö¸¸ ºÎÁ·ÇÑ ºÎºÐÀÌ ÀÖÀ» ¼ö ÀÖ´Ù. ÀÌ Á¡Àº ¾çÇظ¦ ¹Ù¶ó¸ç, Ãâ°£ ÈÄ¿¡ ³ª¿Ã ¼ö ÀÖ´Â ¼öÁ¤»çÇ× µîÀº ÀÚÀ¯¾ÆÄ«µ¥¹Ì ȨÆäÀÌÁö ÀÚ·á½Ç(www.freeaca.com)¿¡ Á¦°øÇÒ ¿¹Á¤ÀÌ´Ï Âü°í ¹Ù¶õ´Ù. ³¡À¸·Î ÀÌ Ã¥ÀÇ °³³äµµ¸¦ ±×·ÁÁØ ¹ÚÁø¼¼ ±º¿¡°Ô °¨»çÀÇ ¸¶À½À» ÀüÇϸç, ²÷ÀÓ¾ø´Â ¼º¿ø°ú »ç¶ûÀ¸·Î Áö¿øÀ» ¾Æ³¢Áö ¾ÊÀº »ç¶ûÇÏ´Â ¾Æ³»¿Í µþ¾ÆÀÌ¿¡°Ôµµ °¨»çÇÑ ¸¶À½À» ÀüÇÑ´Ù.
°í·Á´ëÇб³ Á¤°æ´ëÇÐ Åë°èÇаú Á¹¾÷
°í·Á´ëÇб³ ´ëÇпø ¼®»ç°úÁ¤ Á¹¾÷(Åë°èÇÐ Àü°ø)
¹Ì±¹ Á¶Áö¾Æ´ëÇб³ ´ëÇпø Á¹¾÷(Åë°èÇÐ ¹Ú»ç)
ÇöÀç °í·Á´ëÇб³ Á¤°æ´ëÇÐ Åë°èÇаú ±³¼ö