ÀÌ Ã¥Àº µ¥ÀÌÅÍ ºÐ¼®À» À§ÇÑ ±âº»¼ ¶ó°í ÇÒ ¼ö ÀÖ´Ù.
µ¥ÀÌÅÍ»çÀ̾𽺠ÀÔ¹® A to ZÀº 4Â÷ »ê¾÷Çõ¸í¿¡¼ ²À ÇÊ¿äÇÑ µ¥ÀÌÅͺм®¿¡ ´ëÇÑ ³»¿ëÀ» ´Ù·é ±³Àç´Ù. »çȸÀûÀ¸·Î µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ´Â Àü¹®°¡¿¡ ´ëÇÑ ¼ö¿ä´Â ±ÞÁõÇÏ°í Àִµ¥ ÀÌ ºÐ¾ß¿¡ ¶Ù¾î³ ºÐ¼®·Â°ú âÀÇÀûÀÎ ÀÎÀç°¡ ºÎÁ·ÇÑ °ÍÀÌ Çö½ÇÀÌ´Ù.
ÀÌ Ã¥Àº µ¥ÀÌÅÍÀü¹®°¡¸¦ ¾ç¼ºÇϴµ¥ ÀÖ¾î¼ ²À ÇÊ¿äÇÑ ³»¿ëÀ¸·Î ¿ª¾îÁ® ÀÖÀ¸¸ç µ¥ÀÌÅÍÀü¹®°¡·Î ¼ºÀåÇϴµ¥ ÇÊ¿äÇÑ ±âÃÊÀûÀÎ ¸ðµç ³»¿ëÀ» Æ÷°ýÀûÀ¸·Î ´Ù·ç°í ÀÖ´Ù.
ÆÄÀ̽ãÀÇ ¼öÇÐ ¶óÀ̺귯¸®ÀÎ numpy¸¦ ºñ·ÔÇÏ¿© µ¥ÀÌÅÍ Åë°è ¶óÀ̺귯¸®ÀÎ pandas¿Í matplotlib µî¿¡ °üÇÑ ¼³¸í°ú ¿¹Á¦µéÀÌ °¡µæÇÑ Ã¥ÀÌ¸ç ±ÝÀ¶ µ¥ÀÌÅÍ ºÐ¼®, °ø°øµ¥ÀÌÅÍ ºÐ¼® µîÀ» ó¸®ÇÏ´Â ¿¹Á¦µéÀ» ÅëÇÑ µ¥ÀÌÅÍ ºÐ¼® È°¿ë¹ýÀ» ¾Ë·ÁÁִ åÀÌ´Ù.
4Â÷ »ê¾÷Çõ¸í¿¡¼ ¸Å¿ì Áß¿äÇÑ À§Ä¡¸¦ Â÷ÁöÇÏ°í ÀÖ´Â µ¥ÀÌÅÍ »çÀÌ¾ð½º¿Í ¸Ó½Å ·¯´×ÀÌ ÀϹÝÈµÈ Áö±Ý, ´Ù¾çÇÑ ¸Ó½Å ·¯´×°ú µö ·¯´×À» µ¥ÀÌÅÍ¿¡ Àû¿ëÇÏ´Â °ÍÀº ±×¸® ¾î·ÆÁö ¾ÊÀº ÀÏÀÌ µÆ´Ù. µ¥ÀÌÅÍ »çÀ̾𽺿¡¼ °¡Àå Áß¿äÇÑ °ÍÀº µ¥ÀÌÅÍ ±× ÀÚü´Ù. ÇÏÁö¸¸ µ¥ÀÌÅÍ Ã³¸® ±â¼ú¿¡¸¸ ÁýÁßÇÏ°í ÀÖ´Ù.
IT ÇöÀå¿¡¼ µ¥ÀÌÅÍ ¼öÁý °úÁ¤¿¡¼ ¼ö¸¹Àº ¿À·ù¸¦ Æ÷ÇÔÇÏ°Ô µÇ´Â °æ¿ì¸¦ ÀÚÁÖ º»´Ù. µû¶ó¼ µ¥ÀÌÅÍ Àüó¸®(Data pre-processing)´Â µ¥ÀÌÅÍ »çÀ̾𽺿¡¼ ¸Å¿ì Áß¿äÇÑ °úÁ¤ÀÌ´Ù.
ƯÈ÷, ºò µ¥ÀÌÅ͸¦ ´Ù·ç´Â ¸¹Àº »ç¶÷µé¿¡°Ô ÀÖ¾î µ¥ÀÌÅÍ ÀÚü°¡ Áö´Ï°í ÀÖ´Â ¿À·ù¸¦ ¹ß°ßÇÏ°í º¸Á¤ÇØÁÖ°í, ÃßÈÄ¿¡ ¸ðµ¨ÀÌ ¼ö¸³µÉ °æ¿ì ±× ÀÇ¹Ì¿Í Çؼ®¿¡ ´ëÇؼ ¼·Î ¿¬°á ½ÃÄѳª°¥ ¼ö ÀÖ´Â ·Î¿ì µ¥ÀÌÅÍ(Raw Data)¸¦ µé¿©´Ù º¼ ¼ö ÀÖ´Â ½Ç·ÂÀº Á¤¸» Áß¿äÇÏ´Ù.
¹Ù·Î ÀÌ Ã¥Àº ±×·± ºÎºÐÀ» ÁßÁ¡ÀûÀ¸·Î ÁýÇÊÇß´Ù.