»ùÓÚHadoop µÄ·Ö²¼Ê½ÍøÂçÅÀ³æ¼¼Êõ - ¼ÆËã»úÂÛÎÄ - Ò»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø--×¨Òµ´úÐ´´ú·¢SCI¡¢EI¡¢ºËÐÄÆÚ¿¯¡¢´úÐ´MBA¡¢Ë¶²©±ÏÒµÂÛÎÄ¡£QQ910330594

»¶Ó·ÃÎÊÒ»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø

¼ÓÈëÊÕ²Ø | ÉèÎªÖ÷Ò³ | ÁªÏµÎÒÃÇ

±¾Õ¾¶¯Ì¬

¸ü¶à

ÁªÏµÎÒÃÇ

¸ü¶à

QQ£º3949358033

Î¢ÐÅ£ºpaperwinner

¹¤×÷Ê±¼ä£º9:00-24:00

³É¹¦°¸Àý

¸ü¶à

¼ÆËã»úÂÛÎÄ

µ±Ç°Î»ÖÃ£ºÊ×Ò³ > ¼ÆËã»úÂÛÎÄ

»ùÓÚHadoop µÄ·Ö²¼Ê½ÍøÂçÅÀ³æ¼¼Êõ

À´Ô´£ºÒ»ÆðÓ®ÂÛÎÄÍø ÈÕÆÚ£º2015-09-28 ä¯ÀÀÊý£º5330 ¡¾ ×ÖÌå£º ´ó ÖÐ Ð¡ ¡¿

- 1 -µÚ1ÕÂ Ð÷ÂÛ1.1 ¿ÎÌâÀ´Ô´±¾¿ÎÌâÀ´Ô´ÓÚ¹þ¹¤´óÓïÑÔÓïÒô½ÌÓý²¿-Î¢ÈíÖØµãÊµÑéÊÒ»úÆ÷ÖÇÄÜÓë·ÒëÑÐ¾¿ÊÒÏîÄ¿“·Ö²¼Ê½¿çÓïÑÔÐÅÏ¢»ñÈ¡ºÍ¼ìË÷Æ½Ì¨”µÄ×Ó¿ÎÌâ¡£¸Ã¿ÎÌâµÄÖ÷ÒªÄ¿±êÊÇÉè¼ÆÊµÏÖÒ»¸ö»ùÓÚHadoop µÄ·Ö²¼Ê½ÅÀ³æÏµÍ³£¬¸ÃÅÀ³æÕë¶Ô27 ÖÖÓïÑÔÖ÷Á÷Ã½ÌåÍøÕ¾µÄÐÅÏ¢½øÐÐ²É¼¯£¬²¢·Ö±ð±£´æ£¬ÎªºóÃæµÄÐÅÏ¢´¦Àí¡¢´´½¨Ë÷ÒýºÍ¼ìË÷Ìá¹©Êý¾Ý¡£1.2 ¿ÎÌâÑÐ¾¿±³¾°¼°ÒâÒåÄ¿Ç°£¬»¥ÁªÍøÕý´¦ÓÚ·ÉËÙÇ°½øµÄ·¢Õ¹¹ý³ÌÖÐ£¬½øÈë21 ÊÀ¼ÍÒÔÀ´Æä·¢Õ¹ÊÆÍ·ÒÑÔ¶Ô¶³¬³öÈËÃÇÏëÏó¡£½ö¾ÍÎÒ¹ú¶øÑÔ£¬¸ù¾ÝÖÐ¹ú»¥ÁªÍøÂçÐÅÏ¢ÖÐÐÄ2011 Äê1ÔÂ·¢²¼µÄ¡¶µÚ27 ´ÎÖÐ¹ú»¥ÁªÍøÂç·¢Õ¹×´¿öÍ³¼Æ±¨¸æ¡·×îÐÂÊý¾ÝÏÔÊ¾[1]£º“½ØÖÁ2010 Äê12 ÔÂµ×£¬ÎÒ¹úÍøÃñ¹æÄ£Í»ÆÆ4.5 ÒÚ´ó¹Ø£¬´ïµ½4.57 ÒÚ£¬½Ï2009 Äêµ×Ôö¼Ó7330 ÍòÈË£»»¥ÁªÍøÆÕ¼°ÂÊÅÊÉýÖÁ34.3%£¬½Ï2009 ÄêÌá¸ß5.4 ¸ö°Ù·Öµã¡£ÎÒ¹úÊÖ»úÍøÃñ¹æÄ£´ï3.03 ÒÚ£¬½Ï2009 Äêµ×Ôö¼Ó6930 ÍòÈË¡£”ÓÉÓÚ»¥ÁªÍø¹æÄ£µÄ²»¶ÏÀ©´ó£¬ÔÚ»¥ÁªÍøÕâ¸ö´óÆ½Ì¨ÉÏµÄÐÅÏ¢ÕýÔÚÒÔÖ¸Êý¼¶Ôö³¤£¬¸÷ÖÖ¸÷ÑùµÄÐÅÏ¢×ÊÔ´±»ÕûºÏµ½Ò»Æð£¬¶øÇÒ´óÁ¿Êý¾ÝÊôÓÚµØÀíÎ»ÖÃ·ÖÉ¢µÄÒì¹¹Êý×Ö»¯ÐÅÏ¢£¬ËùÓÐÐÅÏ¢ÐÎ³ÉÁËÒ»¸öºê´óµÄÐÅÏ¢¿â¡£Õâ¸öÐÅÏ¢¿â°üÀ¨¼«Æä¾Þ´óµÄº£Á¿Êý¾Ý£¬ËùÒÔ£¬ÈçºÎ¿ìËÙ¡¢¸ßÐ§¡¢°²È«µØ´ÓºÆå«µÄÐÅÏ¢º£ÑóÖÐÕÒµ½ÍøÂçÓÃ»§¸ÐÐËÈ¤µÄÐÅÏ¢ÒÑ³ÉÎªµ±Ç°»¥ÁªÍø·¢Õ¹µÄÖ÷ÒªÄ¿±ê¡£ÎªÁË½â¾öÕâÒ»ÎÊÌâ£¬ËÑË÷ÒýÇæÓ¦ÔË¶øÉú£¬ËüµÄ³öÏÖ´ó´óÌá¸ßÁËÍøÂçÓÃ»§ËÑ¼¯ºÍ²éÕÒÐÅÏ¢µÄÄÜÁ¦¡£È»¶øËæ×Å»¥ÁªÍøÓÃ»§µÄÔö¶à£¬ÓÃ»§µÄÐèÇóÒ²Ô½À´Ô½¶àÑù»¯£¬ËÑË÷ÒýÇæµÄ·¢Õ¹±ØÐë¸ú×ÅÓÃ»§µÄÐèÇó±äµÃ·á¸»¡¢ÍêÉÆ¡£µ±ÏÂ£¬ÆÀ¼ÛËÑË÷ÒýÇæÐÔÄÜµÄºÃ»µÖ÷ÒªÓÐÈý¸öÖ¸±ê[2,23]:“Ê×ÏÈ£¬ÔÊ¼ÍøÒ³ÊýÄ¿µÄ¶àÉÙ£¬ÕâÖ÷ÒªÓëËÑË÷ÒýÇæÅÀ³æµÄÐÔÄÜºÍ¹æÄ£ÓÐ¹Ø£¬ÔÊ¼ÍøÒ³ÊýÄ¿¶à¡¢ÔÊ¼ÍøÒ³¿â¹æÄ£´ó²Å»áÂú×ãÓÃ»§·á¸»¶à²ÊµÄÐèÇó£¬ËÑË÷ÒýÇæ²Å»áÓÐÊÐ³¡£»Æä´Î£¬ËÑË÷ÒýÇæµÄÐÔÄÜ£¬Ö÷ÒªÌåÏÖÔÚÁ½·½Ãæ£¬Ò»ÊÇÊµÊ±ÐÔ£¬ÅÀ³æ±ØÐëÔÚ½Ï¶ÌµÄÊ±¼äÄÚ¸üÐÂÔÊ¼ÍøÒ³¿âÖÐ×îÐÂÊý¾Ý¡£¶þÊÇÊµÐ§ÐÔ£¬ËÑË÷ÒýÇæ±ØÐëÔÚ½Ï¶ÌµÄÊ±¼äÄÚ·µ»ØÓÃ»§Ìá½»query ¶ÔÓ¦µÄ½á¹û¼¯ºÏ£»×îºóÊÇËÑ¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 2 -Ë÷µÄÐ§¹û£¬ËÑË÷ÒýÇæÐèÒªÄÜ¹»²ÉÓÃ±È½ÏÓÅÐãµÄ¼ìË÷Ëã·¨ºÍÅÅÐòËã·¨£¬½«ÓÃ»§ÏëÒªµÄ½á¹û·µ»Ø¡£”ÈçºÎ½â¾öÔÚº£Á¿Êý¾ÝµÄÇé¿öÏÂÊ±¼äÓë¿Õ¼äÉÏµÄÃ¬¶Ü£¬±»¹«ÈÏÎªÊÇÏÂÒ»´úÐÅÏ¢¼ìË÷¼¼ÊõÑÐ¾¿µÄÒ»¸ö·½Ïò¡£Ãæ¶Ô¾Þ´óµÄÊý¾Ý¡¢´óÁ¿µÄ¼ìË÷ÇëÇóºÍÓÃ»§¶ÔÓÚ¼ìË÷Ê±¼äµÄ¿Á¿ÌÒªÇó£¬ÐÅÏ¢¼ìË÷µÄÐ§ÂÊ³ÉÎªÒ»¸öØ½´ý½â¾öµÄÎÊÌâ£¬ÒÀ¿¿µ¥»ú²»¿ÉÄÜÍê³ÉÕâÑùµÄÈÎÎñ¡£Èç¹ûµ¥´¿µØÒÀ¿¿Ìá¸ßÓ²¼þÐÔÄÜ¼´Ê¹Ó²¼þ·¢Õ¹×ã¹»¿ìÒ²ÎÞ·¨Âú×ãÐÅÏ¢Ôö³¤µÄËÙ¶È£¬ËùÒÔ±ØÐëÒÀ¿¿·Ö²¼Ê½ÐÅÏ¢¼ìË÷¼¼Êõ²ÅÄÜ½â¾ö¡£ÊÂÊµÉÏ£¬¼¸ºõËùÓÐÊ¹ÓÃµÄ´óÐÍËÑË÷ÏµÍ³¶¼²ÉÓÃÁË·Ö²¼Ê½µÄÌåÏµ½á¹¹À´´¦Àíº£Á¿Êý¾Ý´Ó¶ø½â¾öÐÅÏ¢¼ìË÷ÖÐµÄÐ§ÂÊÎÊÌâ¡£·Ö²¼Ê½ËÑË÷ÒýÇæÊÇ½«ºÜ¶àÌ¨»úÆ÷Í¨¹ý»¥ÁªÍøÂçÁ´½Óµ½Ò»Æð£¬È»ºóÔÙÈí¼þ²ã´ÎÊ¹µÃ¶àÌ¨»úÆ÷¿ÉÒÔÐÍ¬½â¾ö´ó¹æÄ£Êý¾ÝµÄ´¦Àí¡¢Ë÷ÒýºÍ¼ìË÷ÎÊÌâ¡£ËäÈ»ËüÎïÀíÉÏ°Ñ¶àÌ¨»úÆ÷Á¬½Óµ½ÁËÒ»Æð£¬µ«ÊÇÕâ¸ö¼¯ÈºÔÚÂß¼ÉÏÈÔÈ»ÊÇÒ»¸öÕûÌå¡£·Ö²¼Ê½ËÑË÷ÒýÇæÓÐ×ÅµÃÌì¶ÀºñµÄÓÅÊÆ£¬Ëü¿ÉÒÔºÜÇáËÉµØ½â¾ö´«Í³ËÑË÷ÒýÇæÎÞ·¨½â¾öµÄÎÊÌâ£¬Ö÷ÒªÓÅÊÆ¿ÉÒÔ×Ü½áÎªÒÔÏÂÎåµã[3,24]£ºËÑË÷ÒýÇæÖÐµÄ´æ´¢×ÊÔ´¡¢´¦ÀíÆ÷×ÊÔ´¡¢ÄÚ´æ×ÊÔ´ºÍÊý¾ÝÈ«²¿±»¼ìË÷·þÎñÆ÷Ëù¹²Ïí£¬²¢ÇÒ¼ìË÷·þÎñÆ÷·Ö²¼ÔÚ²»Í¬µØµØÀíÎ»ÖÃ£¬µ±ÓÃ»§Í¨¹ý¿Í»§¶ËÌá½»Ò»¸ö¼ìË÷ÇëÇóÊ±£¬¿Í»§¶Ë×Ô¶¯µØÏò¾àÀë×î½üµÄ¼ìË÷·þÎñÆ÷Ìá½»ÇëÇó£¬ÕâÑù¼õÇáÁËÆäËû¼ìË÷·þÎñÆ÷µÄ¸ºµ£¡£¸÷¸öÕ¾µã¿Í»§¶ËµÄ´úÀí·þÎñÆ÷Ïà»¥ºÏ×÷¸üºÃµØ·þÎñÓÚÓÃ»§µÄÇëÇó¡£ºóÌ¨ÐÅÏ¢´¦ÀíµÄ·Ö²¼Ê½¼ÆËãÄ£ÐÍÓÐ½ÏºÃµÄ¿ÉÀ©Õ¹ÐÔ£¬ÇÒÓëÇ°¶Ë±ð½Ð¶ÀÁ¢£¬±ãÓÚÎ¬»¤¡£¸÷ÖÖÐÅÏ¢µÄË÷Òý·ÖÉ¢µØ´æÔÚÓÚ²»Í¬»úÆ÷ÉÏµÄË÷ÒýÊý¾Ý¿âÖÐ£¬ÇÒÕâÐ©·ÖÉ¢µÄË÷ÒýÍ¨¹ýÍ³Ò»µÄ·Ö²¼Ê½ÎÄ¼þÏµÍ³Ä£ÐÍÕûºÏµ½Ò»Æð£¬ÕâÑùÃ¿Ò»¸öË÷ÒýÊý¾Ý¿âµÄÈÝÁ¿ºÜÐ¡£¬ÕâÊ¹µÃ²éÑ¯ËÙ¶È»á¸ü¿ì¡£ÈÝ´íÐÔºÃ£¬Ò»µ«Ä³Ð©¼ìË÷Æ÷»òÕßË÷ÒýÆ÷·¢Éú¹ÊÕÏ£¬²»Ó°ÏìÕû¸öËÑË÷ÒýÇæ¡£½øÈë21 ÊÀ¼ÍÒÔÀ´£¬»¥ÁªÍøÅÝÄÆÆËéµÄÒõÓ°ÉÐÎ´×ßÔ¶£¬Web2.0 µÄ¸ÅÄî±ãÅî²ª·¢Õ¹ÆðÀ´£¬Õâ¸ö¿ª´´ÐÔ¸ÅÄîµÄÌá³ö¸ø´¦ÔÚË¥ÍËÆÚµÄ»¥ÁªÍø´òÈëÒ»ÕëÇ¿ÐÄ¼Á¡£ÔÚÕâ¸ö·½ÐËÎ´°¬µÄWeb2.0 Ê±´ú£¬Facebook¡¢RenRen¡¢Twiter µÈÉçÇøÍøÕ¾£¬ÇÀ×ßÁËºÜ¶à´«Í³ÃÅ»§ÍøÕ¾µÄÓÃ»§¡£´óÓÃ»§Á¿ÒÔ¼°¸ßÓÃ»§²ÎÓë¶È£¬ÊÇÕâÐ©ÉçÇøÍøÕ¾µÄÌØµã¡£Òò´Ë£¬ÈçºÎ¸ßÐ§µØ·þÎñÓÚº£Á¿ÓÃ»§ÈºÌå£¬Ê¹ÓÃ»§·½±ã²¢¿ì½ÝµØÌåÑéÍøÕ¾ËùÌá¹©µÄ·þÎñ£¬ÒÑ¾³ÉÎªÕâÐ©ÉçÇøÍøÕ¾Ø½´ý½â¾öµÄÎÊÌâ¡£Í¬Ê±£¬ÒÀ¿¿Google º£Á¿Êý¾Ý¼ÆËãÄ£ÐÍ¹¹½¨ÆðÀ´µÄGoogle ¼ÆËã¼¯Èº£¬¸øGoogle Ìá¹©ÁËÇ¿´óµÄÐÅÏ¢´¦ÀíÄÜÁ¦¶øÇÒÊ¹µÃGoogle ÔÚº£Á¿Êý¾ÝÖÐ¼ìË÷µÄËÙ¶È¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 3 -´ó´óÌá¸ß¡£Òò´Ë£¬ÈçºÎ¸ßÐ§µØÀûÓÃÕâÖÖº£Á¿Êý¾Ý´¦Àí¼¼Êõ£¬Ê¹µÃ¸ü¶àµÄ¹«Ë¾»òÕß¸öÈËÒ²ÄÜ¹»ÓµÓÐÇ¿´óµÄ¼ÆËãÓëÐÅÏ¢´¦ÀíÄÜÁ¦£¬³ÉÎªÄÇÐ©ÓµÓÐ¾Þ´óÊý¾Ý×ÊÔ´µÄÆóÒµ¿ªÊ¼¿¼ÂÇµÄÎÊÌâ¡£ÕýÊÇÒòÎª»¥ÁªÍøÐÐÒµÖÐ¶Ôº£Á¿Êý¾Ý´¦ÀíµÄÐèÇó£¬ÔÆ¼ÆËã¾ÍÓ¦ÔË¶øÉú¡£ÓÉÓÚÔÆ¼ÆËãµÄ¸ÅÄî²Å¸Õ¸ÕÌá³ö£¬Ã¿¸öÆóÒµ¡¢¸öÈË¶ÔËü¶¼ÓÐ²»Í¬µÄÀí½â£¬Òò´ËËü»¹Ã»ÓÐÒ»¸öÃ÷È·µÄ¶¨Òå£¬µ«ÊÇÎÒÃÇ×Ý¹Û¸÷´óÆóÒµÈ¨Íþ¶ÔÔÆ¼ÆËãµÄ¶¨Òå£¬ÎÒÃÇ¿ÉÒÔ×Ü½á³öÔÆ¼ÆËãµÄÒ»Ð©ÌØµã¡£ÏÂÃæ¾Ù¼¸¸öÀý×Ó¿ÉÒÔ´ú±íÕâÐ©ÌØµã£¬Wikipedia ¹ØÓÚÔÆ¼ÆËãµÄ¶¨ÒåÎª“ÔÆ¼ÆËãÊÇÍø¸ñ¼ÆËãÏÂµÄÒ»ÖÖÐÂµÄ(´óÔ¼ÔÚ2007 Äêµ×³öÏÖ)±êÇ©£¬ËüÊ¹ÓÃ¹«ÓÃ¼ÆËã»òÆäËü·½·¨À´¹²Ïí¼ÆËã×ÊÔ´¡£ÔÆ¼ÆËãÊÇÒÀ¿¿±¾»ú·þÎñÆ÷»ò¸öÈËÉè±¸À´´¦ÀíÓÃ»§Ó¦ÓÃ³ÌÐòÖ®ÍâµÄÁíÒ»ÖÖÑ¡Ôñ”£»News Blog ÈÏÎª“ÔÆ¼ÆËãÊÇÒ»ÖÖ½«Ó²¼þÓëÈí¼þÍâ°ü¸øÒòÌØÍø·þÎñÌá¹©ÉÌµÄ¸ÅÄî”£» Forrester ÔòÈÏÎª“ÔÆ¼ÆËã¿´ÆðÀ´Ê®·ÖÏñÊÇÒ»ÖÖµäÐÍµÄÍ»ÆÆÐÔ¼¼Êõ”¡£µ½Ä¿Ç°ÎªÖ¹£¬Î¢Èí¡¢Amazon¡¢Google¡¢EMC¡¢IBM ºÍHP µÈÖÚ¶àIT Òµ¾ÞÍ·¶¼Ðû²¼ÒªÖØµã½¨ÉèÆóÒµÔÆ¼ÆËã¿ò¼Ü¡£Ò²ÓÐÁËºÜ¶à³É¹¦µÄÆóÒµ¼¶ÔÆ¼ÆËã°¸Àý¡£ÔÚËùÓÐÆóÒµ¼¶°¸ÀýÖÐ×îÎªÈËÃÇËùÊìÖªµÄÄª¹ýÓÚ2009 Äê10 ÔÂGoogle ºÍIBM ÁªºÏ¿ªÆôµÄ“ÔÆ¼ÆËã”¼Æ»®[25]£¬°üÀ¨Carnegie Mellon University¡¢StanfordUniversity¡¢University of California, Berkeley¡¢University of Washington¡¢MITÔÚÄÚµÄÖÚ¶àÖªÃû´óÑ§¶¼²Î¼ÓÁËÕâÒ»¼Æ»®£¬Í¬ÊÂ¹úÄÚµÄÇå»ª´óÑ§Ò²ÔÚ2010 Äê3ÔÂ·ÝÉêÇë¼ÓÈëÁËÕâÒ»¼Æ»®¡£ÔÚÕâÏî¼Æ»®ÖÐ£¬¸ßÐ£ºÍÆóÒµ¶¼ÊÇÊÜÒæÕß£¬¸ßÐ£¿ÉÒÔÀûÓÃÁ½¸öIT ¾ÞÍ·µÄ×ÊÔ´¿ª·¢³ö¸÷ÖÖ´´ÐÂµÄÓ¦ÓÃ£»¶ø¶ÔÓÚÆóÒµËûÃÇ¿ÉÒÔÀûÓÃ¸ßÐ£µÃÌì¶ÀºñµÄ¿ÆÑÐÁ¦Á¿È¥Ì½Ë÷ºÍ·¢Õ¹ÔÆ¼ÆËã¡£Óë´ËÍ¬Ê±£¬Amazon Ò²²»¸ÊÂäºóËûÃÇÍÆ³ö×Ô¼ºµÄÔÆ¼ÆËã¿ò¼ÜEC2[26]£¬ÕâÏîAmazon EC2 ·þÎñ¿ÉÒÔ¿´³ÉÊÇÒ»¸ö¿ª·ÅµÄÔÆ¼ÆËãÏµÍ³£¬Ëü¿ÉÒÔÎªÓÃ»§Ìá¹©º£Á¿Êý¾Ý¼ÆËãµÄÄÜÁ¦£¬ÓÐÐ§µØ½µµÍÊý¾Ý´¦ÀíµÄÊ±¼ä£¬Í¬Ê±±È×Ô¼º´î½¨Ò»¸öÔÆ¼ÆËãÆ½Ì¨Òª·½±ãµÄ¶à¡£µ±È»ÕâÐ©IT ¾ÞÍ·µÄ³É¹¦°¸ÀýÖÐ×î³É¹¦µÄµ±ÊôGoogle£¬Ä¿Ç°Ó¦ÓÃ×î¹ã¡¢×îÖøÃûµÄÔÆ¼ÆËã»ù´¡ÉèÊ©Ë¼Ïë¾ÍÊÇGoogle Ìá³öÀ´µÄ¡£Google ÔÚÒ»ÆªÃûÎª¡¶WebSearch For A Planet-The Google Cluster Architecture¡·[4]µÄÎÄÕÂÖÐÌá³öÁËËûµÄÔÆ¼ÆËã»ù´¡ÉèÊ©Ä£Ê½£¬ÔÚÕâÆªÎÄÕÂÖÐGoogle Ìá³öËûÃÇµÄÔÆ¼ÆËã»ù´¡ÉèÊ©°üÀ¨ËÄ¸ö²¿·Ö£º·Ö²¼Ê½ÎÄ¼þÏµÍ³GFS(Google File System)[5] £¬Map/Reduce ±à³ÌÄ£ÐÍ[6]£¬·Ö²¼Ê½µÄËø»úÖÆChubby[7]ºÍ´ó¹æÄ£·Ö²¼Ê½Êý¾Ý¿âBigTable[8]¡£ÕýÊÇÓÉÓÚÔÆ¼ÆËã¼¼ÊõÔ½À´Ô½±»ÖØÊÓ£¬ÊµÑéÊÒÔÚÐÅÏ¢¼ìË÷ºÍ×ÔÈ»ÓïÑÔ´¦ÀíÁìÓòÒÑÓÐµÄÑÐ¾¿»ù´¡ÉÏ£¬Éè¼ÆÊµÏÖÒ»¸ö·Ö²¼Ê½¿çÓïÑÔ¼ìË÷Æ½Ì¨£¬¸ÃÆ½Ì¨²ÉÓÃÔÆ¼Æ¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 4 -Ëã¼°ÔÆ´æ´¢¡£ÆäÖÐÊý¾Ý»ñÈ¡¡¢Êý¾Ý´¦Àí¾ù²ÉÓÃ·Ö²¼Ê½¿ò¼Ü¡£±¾ÈËµÄÖ÷Òª¹¤×÷ÊÇÔÚ¿ªÔ´·Ö²¼Ê½¿ò¼ÜHadoop Æ½Ì¨ÉÏ´î½¨·Ö²¼Ê½ÅÀ³æ¡£±¾ÎÄÊÇ½áºÏËù×÷¹¤×÷²ûÊöÈçºÎÔÚHadoop Æ½Ì¨ÉÏÉè¼ÆºÍÊµÏÖ·Ö²¼Ê½ÅÀ³æ¡£1.3 ±¾ÎÄÖ÷Òª¹¤×÷¼°ÄÚÈÝHadoop ÓÉ Apache Software Foundation ¹«Ë¾ÓÚ 2005 ÄêÇïÌì×÷Îª LuceneµÄ×ÓÏîÄ¿ Nutch µÄÒ»²¿·ÖÕýÊ½ÒýÈë¡£ËüÊÜµ½×îÏÈÓÉGoogle ¿ª·¢µÄ·Ö²¼Ê½¼ÆËãÄ£ÐÍ(MapReduce) ºÍ·Ö²¼Ê½ÎÄ¼þÏµÍ³(GFS)µÄÆô·¢£¬ÊÇ¹È¸èËùÌá³öµÄÕâÁ½²¿·ÖµÄÊµÏÖ¡£2006 Äê3 ÔÂ·Ý£¬MapReduce ºÍ Nutch Distributed File System (NDFS)·Ö±ð±»ÄÉÈë³ÆÎª Hadoop µÄÏîÄ¿ÖÐ¡£Hadoop ¿ò¼ÜÖÐ×îºËÐÄµÄÉè¼Æ¾ÍÊÇ£ºMap/Reduce ºÍHDFS¡£Map/Reduce ±¾Éí¾ÍÊÇÓÃÓÚ²¢ÐÐ´¦Àí´óÊý¾Ý¼¯µÄÈí¼þ¿ò¼Ü¡£Map/Reduce µÄ±¾ÖÊÊÇ¸ß¶È³éÏóºóµÄMap º¯ÊýºÍReduce º¯Êý¡£Ëü¿ÉÒÔÀí½âÎªÁ½¸ö²Ù×÷¹ý³Ì£ºMap ¹ý³ÌºÍReduce ¹ý³Ì£¬Ã¿Ò»¸ö¹ý³Ì¿ÉÄÜÓÐ¶à¸öMap º¯Êý»ð³µReduce º¯Êý¡£Map º¯ÊýµÄÔØÌå½ÓÊÜÒ»×éÊý¾Ý£¬ÔÚÖ´ÐÐMap º¯ÊýÖ®Ç°£¬Õâ×éÊäÈëÊý¾Ý»á±»½âÎö³É¼ü/Öµ¶ÔÁÐ±í£¬Map º¯Êý¼ÆËãµÄ¶ÔÏóÊÇÒ»¸ö¼ü/Öµ¶Ô¡£Reduce º¯Êý½ÓÊÜMap º¯ÊýµÄÊä³ö½á¹û£¬ÔÚÖ´ÐÐReduce º¯ÊýÖ®Ç°»á½«¼üÏàÍ¬µÄÖµ¾Ûµ½Ò»Æð½»¸øReduce ´¦Àí¡£Hadoop ·Ö²¼Ê½ÎÄ¼þÏµÍ³(HDFS)ÊÇÒ»¸öÔËÐÐÓÚHadoop ¿ò¼ÜÖ®ÉÏµÄÎÄ¼þÏµÍ³£¬ËûµÄ³É¹¦Éè¼Æ¿ÉÒÔÈÃÕâ¸öÎÄ¼þÏµÍ³ÔËÐÐÓÚÆÕÍ¨µÄ¸öÈËµçÄÔÖ®ÉÏ¡£ËüÓëÏÖÓÐµÄÎÄ¼þÏµÍ³ÓÐÐí¶àÏàËÆÖ®´¦£¬È»¶ø£¬ËüÓëÆäËûµÄ·Ö²¼Ê½ÎÄ¼þÏµÍ³µÄ²î±ðÒ²·Ç³£ÏÔÖø¡£Ö÷Òª±íÏÖÔÚ£ºHDFS µÄ¸ß¶ÈÈÝ´íÐÔ¡¢³É±¾µÍÁ®ÐÔ¡¢ÓµÓÐ¸ßÍÌÍÂÁ¿·ÃÎÊÊý¾ÝµÄ½Ó¿Ú¡¢¿ÉÍ¨¹ýPOSIX Á÷Ê½·ÃÎÊºÍÊÊºÏÓÚ¿ª·¢º£Á¿Êý¾ÝµÄÓ¦ÓÃ³ÌÐò¡£HDFSµÄÇ°ÉíÎªApache Nutch µÄÍøÂçËÑË÷ÒýÇæÏîÄ¿µÄ»ù´¡ÉèÊ©¡£HDFS ÏÖÔÚÊÇÒ»¸öApache Hadoop µÄ×ÓÏîÄ¿¡£±¾ÎÄÊÇÔÚÉîÈëÑÐ¾¿Hadoop µÄÔÀíºÍÓ¦ÓÃ»ù´¡ÉÏ£¬½áºÏÊµÑéÊÒÐèÇó£¬Éè¼ÆºÍ¿ª·¢ÁË»ùÓÚHadoop µÄ·Ö²¼Ê½ÅÀ³æ¡£²¢ÇÒÄ¿Ç°ÒÑÍ¶Èë³¤ÆÚÔËÐÐºÍÊ¹ÓÃ¡£ÑÐ¾¿¹¤×÷Ö÷Òª°üÀ¨ÒÔÏÂ¼¸µã£ºµ÷ÑÐABICloud[31]¡¢Hadoop[30]¡¢Sector/Sphere[28]µÈÄ¿Ç°Ó¦ÓÃ½Ï¹ã·ºµÄ¿ªÔ´·Ö²¼Ê½¿ò¼Ü¡£Îª·Ö²¼Ê½ÅÀ³æµÄÉè¼ÆÊµÊ©Ìá¹©¼¼ÊõÖ§³Å¡£ÊìÏ¤Hadoop µÄ·Ö²¼Ê½ÎÄ¼þÏµÍ³(HDFS)¡£°üÀ¨ÎÄ¼þÏµÍ³µÄ½á¹¹¡¢½ÚµãÖ®¼ä½»»¥µÄÍ¨ÐÅÐÒé¡¢ÈÝ´í·½Ê½¡¢Êý¾Ý·ÃÎÊ·½Ê½¡£ÒÔ·½±ãÅÀ³æÏµÍ³µÄ¿ª·¢¡£¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 5 -ÕÆÎÕHadoop µÄMap/Reduce ±à³ÌÄ£ÐÍ£¬°üÀ¨Map/Reduce ±à³ÌµÄÕû¸öÁ÷³Ì¡¢×÷ÒµµÄÅäÖÃ¡¢ÈçºÎÊ¹ÓÃMap/Reduce ·½Ê½¶ÁÐ´HDFS ÉÏÊý¾Ý¡¢¾ßÌåµÄMapº¯ÊýÓëReduce º¯ÊýµÄÊµÏÖ·½Ê½ºÍÊý¾Ý·Ö¿éµÄ¼¸ÖÖ·½Ê½¡£Éè¼Æ»ùÓÚHadoop ·Ö²¼Ê½ÅÀ³æµÄ¸÷¸öÄ£¿é£¬Ê¹µÃ¸÷¸öÄ£¿éÂú×ãMap/Reduce±à³ÌÄ£Ê½£¬ÒÔÊµÏÖÅÀÈ¡¹ý³ÌµÄ·Ö²¼Ê½¼ÆËã¡£Ã¿¸öÄ£¿é¶ÔÓ¦Ò»¸öMap/Reduce ¹ý³Ì²¢Íê³ÉÒ»¸ö¹¦ÄÜ¡£¿ª·¢·Ö²¼Ê½ÅÀ³æ£¬Éè¼ÆÊµÊ©·½°¸È·¶¨·Ö²¼Ê½ÅÀ³æµÄÕû¸öÁ÷³Ì¼°±àÂëÊµÏÖ¸÷¸öÄ£¿é£¬Íê³É¸÷¸öÄ£¿éµÄ¹¦ÄÜ¡£ÔÚÎ±·Ö²¼Ê½µ¥½Úµã»·¾³ÏÂ²¿ÊðÅÀ³æÏµÍ³£¬²âÊÔÅÀ³æµÄ×¥È¡Ð§ÂÊ¡¢ÎÈ¶¨ÐÔ¡£Í¬Ê±£¬¶ÔHadoop ·Ö²¼Ê½ÅäÖÃ»·¾³½øÐÐÓÅ»¯£¬Í¨¹ýÊµÑé½øÐÐ¸÷ÖÖ¹¦ÄÜ²âÊÔºÍÐÔÄÜ²âÊÔ£¬ÕÒ³öºÏÊÊµÄMap¡¢Reduce ¸öÊý£¬´Ó¶ø¸üºÃµØÀûÓÃHadoop ½øÐÐ·Ö²¼Ê½ÐÍ¬´¦Àí¡£1.4 ±¾ÎÄµÄÖ÷Òª×éÖ¯ºÍ½á¹¹±¾ÎÄÊ×ÏÈ½éÉÜÔÆ¼ÆËãµÄ·¢Õ¹×´¿ö¼°ÔÆ¼ÆËãÏà¹ØÔÀí£¬È»ºó¼òµ¥½éÉÜÄ¿Ç°Ó¦ÓÃ½Ï¹ã·ºµÄµÚÈý·½ÔÆ¼ÆËã¿ò¼ÜHadoop£¬°üÀ¨Hadoop ·Ö²¼Ê½Æ½Ì¨½á¹¹ºÍÈçºÎÔÚHadoop Æ½Ì¨¿ª·¢×Ô¼ºµÄÓ¦ÓÃ¡£ÁíÍâ£¬»¹»á½éÉÜ·Ö²¼Ê½ÅÀ³æµÄÑÐ¾¿ÏÖ×´¼°ÅÀ³æµÄ»ù±¾ÔÀí¡£Æä´Î£¬ÔÚÕâÐ©ÏêÏ¸µ÷ÑÐ»ù´¡ÉÏ£¬Õë¶ÔÏîÄ¿µÄÐèÇóÌá³ö»ùÓÚHadoop Æ½Ì¨·Ö²¼Ê½ÅÀ³æµÄÉè¼Æ·½°¸£¬Íê³ÉÕû¸öÏµÍ³µÄ½á¹¹Éè¼Æ¼°Á÷³Ì¿ØÖÆ£¬½«ÅÀ³æÏµÍ³°´ÕÕ¹¦ÄÜ·Ö½â³É¼¸¸öÄ£¿é£¬Ã¿¸öÄ£¿é¶ÔÓ¦Ò»¸öMap/Reduce Ä£Ê½ÒÔÊÊÓ¦Hadoop ·Ö²¼Ê½¼ÆËãµÄÐèÒª¡£ÔÙ´Î£¬¶Ô·Ö²¼Ê½ÅÀ³æµÄÊý¾Ý´æ´¢·½Ê½ºÍÊý¾Ý¸ñÊ½ÐÅÏ¢½øÐÐÁËÉè¼Æ£¬²¢Íê³ÉÁËÅÀ³æ¸÷·ÖÄ£¿é¾ßÌåÀàµÄÊµÏÖ¡£×îºó£¬½øÐÐÅÀ³æµÄ¸÷ÖÖ²âÊÔ£¬°üÀ¨·ÖÄ£¿é²âÊÔ¡¢¹¦ÄÜ²âÊÔ¡¢ÐÔÄÜ²âÊÔ£¬Í¬Ê±½áºÏHadoop ¼¯ÈºÅäÖÃµÄÓÅ»¯²ßÂÔÕÒ³ö×îºÏÊÊµÄMap¡¢Reduce ¸öÊý£¬´Ó¶ø¸üºÃµØÀûÓÃHadoop µÄ·Ö²¼Ê½ÐÍ¬´¦Àí¡£ÔÚÎÄÕÂ×îºó£¬ÏêÏ¸·ÖÎö±¾ÏµÍ³²¢½øÐÐÆÀ¼Û£¬¶Ô±¾¿ÎÌâ½øÐÐ×Ü½á¡£±¾ÎÄµÄÄÚÈÝ½á¹¹¹²·ÖÎªÎåÕÂ£¬½éÉÜÈçÏÂ£ºµÚÒ»ÕÂ£¬Ð÷ÂÛ£¬¼òµ¥½éÉÜ±¾¿ÎÌâµÄÀ´Ô´¡¢²ûÊö±¾¿ÎÌâµÄÑÐ¾¿±³¾°¼°ÑÐ¾¿ÒâÒå£¬ÁíÍâ£¬ÏêÏ¸½²Êö±¾ÎÄµÄÖ÷Òª¹¤×÷¼°ÑÐ¾¿ÄÚÈÝ²¢¸ø³öÈ«ÎÄµÄ×éÖ¯½á¹¹¡£µÚ¶þÕÂ£¬Ïà¹Ø¼¼ÊõÑÐ¾¿£¬±¾ÕÂÊÇ¶Ô·Ö²¼Ê½ÅÀ³æÏà¹Ø¼¼Êõ½øÐÐÏêÏ¸½éÉÜ£¬Ö÷Òª°üÀ¨ËÄ¸ö²¿·Ö£ºÔÆ¼ÆËã¼¼ÊõÏÖ×´¡¢ÔÀí£¬Hadoop ·Ö²¼Ê½Æ½Ì¨½á¹¹£¬ÅÀ³æµÄ»ù±¾ÔÀí£¬·Ö²¼Ê½ÅÀ³æµÄÑÐ¾¿ÏÖ×´¡£ÔÚÔÆ¼ÆËã¼¼ÊõÏÖ×´¡¢ÔÀí²¿·Ö£¬±¾ÎÄ´Ó»ú¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 6 -Ìå½á¹¹¡¢·þÎñºÍ¼¼ÊõÈý¸ö²ã´ÎÀ´²ûÊöÔÆ¼ÆËã¼¼ÊõµÄ·¢Õ¹ÏÖ×´ºÍÔÀí¡£ÔÚHadoop ·Ö²¼Ê½Æ½Ì¨½á¹¹²¿·Ö£¬±¾ÎÄ¶ÔHadoop µÄÁ½¸öºËÐÄ¼¼Êõ£º·Ö²¼Ê½ÎÄ¼þÏµÍ³(HDFS)ºÍ·Ö²¼Ê½¼ÆËãÄ£ÐÍ(Map/Reduce)½øÐÐÏêÏ¸½éÉÜ¡£ÔÚÅÀ³æµÄ»ù±¾ÔÀí²¿·Ö£¬±¾ÎÄ´ÓÅÀ³æÖÖÀà¡¢¹¤×÷·½Ê½¡¢ËÑË÷²ßÂÔµÈ·½ÃæÀ´·ÖÎöÅÀ³æµÄ»ù±¾ÔÀí¡£ÔÚ·Ö²¼Ê½ÅÀ³æµÄÑÐ¾¿ÏÖ×´²¿·Ö£¬ ±¾ÎÄÖ÷Òª½éÉÜGoogle ¡¢Mercator ¡¢InternetArchive µÈÄ¿Ç°½ÏÖøÃûµÄ·Ö²¼Ê½ÅÀ³æ¡£µÚÈýÕÂ£¬¹¦ÄÜ·ÖÎöÓë½á¹¹Éè¼Æ£¬±¾ÕÂÕë¶ÔÊµÑéÊÒÐèÇó¸ø³ö»ùÓÚHadoop ·Ö²¼Ê½ÅÀ³æµÄÉè¼Æ·½°¸£¬Í¬Ê±Íê³ÉÅÀ³æÏµÍ³µÄ½á¹¹Éè¼Æ¡£Ö÷ÒªÄÚÈÝ°üÀ¨5 ¸ö²¿·Ö£º·Ö²¼Ê½ÍøÂçÅÀ³æµÄÉè¼ÆÐèÇó¡¢ÏµÍ³²¼¾Ö¡¢ÅÀ³æÏµÍ³»ù±¾½á¹¹¡¢ÅÀ³æ×ÓÄ£¿éµÄ·Ö²¼Ê½½á¹¹ºÍ·Ö²¼Ê½ÅÀ³æµÄ¹¦ÄÜÍêÉÆ¡£ÔÚ·Ö²¼Ê½ÍøÂçÅÀ³æµÄÉè¼ÆÐèÇó²¿·Ö£¬±¾ÎÄÖ÷Òª½áºÏÊµÑéÊÒÐèÇóÀ´²ûÊöÉè¼Æ·Ö²¼Ê½ÅÀ³æµÄÄ¿±ê¡¢Òªµã¡£ÔÚÅÀ³æÏµÍ³²¼¾Ö²¿·Ö£¬±¾ÎÄ¸ø³ö·Ö²¼Ê½¿çÓïÑÔ¼ìË÷Æ½Ì¨µÄ¼Ü¹¹¡¢Æ½Ì¨µÄÄ£¿é»®·ÖÒÔ¼°ÅÀ³æÔÚÕû¸öÆ½Ì¨ÖÐµÄµØÎ»¡£ÔÚÅÀ³æÏµÍ³»ù±¾½á¹¹²¿·Ö£¬±¾ÎÄ½«½éÉÜ»ùÓÚHadoop ÅÀ³æµÄ»ù±¾Á÷³ÌÍ¼¡¢ÅÀ³æµÄ¿ò¼ÜÉè¼ÆºÍÅÀ³æµÄÄ£¿é»®·Ö¡£ÔÚÅÀ³æ×ÓÄ£¿éµÄ·Ö²¼Ê½½á¹¹²¿·Ö£¬±¾ÎÄ½«½éÉÜ¸÷¸ö×ÓÄ£¿éµÄMap-Reduce ÊµÏÖ¡£ÔÚ·Ö²¼Ê½ÅÀ³æ¹¦ÄÜÍêÉÆ²¿·Ö£¬±¾ÎÄÖ÷ÒªÊÇÕë¶ÔÅÀ³æÏµÍ³Éè¼ÆºÍÊµÏÖÊ±Óöµ½µ½Ò»Ð©¼¼ÊõÏ¸½ÚÎÊÌâ×ö³öÏàÓ¦µÄ½â¾ö·½°¸¡£µÚËÄÕÂ£¬·Ö²¼Ê½ÅÀ³æ¾ßÌåÊµÏÖ£¬±¾ÕÂÊÇÔÚµÚÈýÕÂÉè¼ÆµÄ»ù´¡ÉÏ¶Ô»ùÓÚHadoop ·Ö²¼Ê½ÅÀ³æµÄ×ÓÄ£¿é½øÐÐÁË¾ßÌåÉè¼Æ£¬°üÀ¨Êý¾Ý½á¹¹¡¢Êý¾Ý¸ñÊ½¡¢¾ßÌå´úÂëµÄ±àÐ´µÈµÈ¡£Ö÷ÒªÄÚÈÝ°üÀ¨5 ¸ö²¿·Ö£º×¥È¡Ä£¿é(CrawlerDiver)µÄÊµÏÖ¡¢·ÖÎöÄ£¿é(ParserDiver)µÄÊµÏÖ¡¢ÓÅ»¯Ä£¿é(OptimizerDiver)µÄÊµÏÖ¡¢ºÏ²¢Ä£¿é(MergeDriver)µÄÊµÏÖºÍ×ª»¯XML Ä£¿é(HtmlToXmlDiver)µÄÊµÏÖ¡£ÔÚ×¥È¡Ä£¿é²¿·Ö£¬±¾ÎÄÖ÷Òª½éÉÜÅÀ³æ×¥È¡¹¦ÄÜµÄMap-Reduce ÊµÏÖ£¬°üÀ¨ÏÂÔØÍøÒ³¡¢¶àÏß³ÌÈÎÎñµÈ¡£ÔÚ·ÖÎöÄ£¿é²¿·Ö£¬±¾ÎÄÖ÷Òª½éÉÜÅÀ³æÌáÈ¡Á´³öÁ´½Ó²¿·ÖµÄMap-Reduce ÊµÏÖ£¬¾ßÌå°üÀ¨Map/Reduce Ä£ÐÍµÄÉè¼Æ¡¢HTML ½âÎöµÈ¡£ÔÚÓÅ»¯Ä£¿é²¿·Ö£¬±¾ÎÄÖ÷Òª½éÉÜÈçºÎÓÃMap/Reduce ÊµÏÖ¶Ô·ÖÎöÄ£¿éÌáÈ¡³öÀ´µÄÁ´³öÁ´½Ó½øÐÐ¹ýÂËÈ¥µôÖØ¸´Á´½Ó¡£ÔÚºÏ²¢Ä£¿é²¿·Ö£¬±¾ÎÄÖ÷Òª½éÉÜÈ¥ÖØ¹¦ÄÜµÄMap-Rduce ÊµÏÖ¡£ÔÚ×ª»¯XML Ä£¿é²¿·Ö£¬±¾ÎÄÖ÷Òª½éÉÜ½«HTML ×ª»¯ÎªXML ²¿·ÖµÄMap-Rduce ÊµÏÖ¡£µÚÎåÕÂ£¬ÐÔÄÜ·ÖÎöÓëÆÀ¼Û£¬¶ÔÕû¸ö»ùÓÚHadoop µÄ·Ö²¼Ê½ÅÀ³æÏµÍ³ÐÔÄÜ½øÐÐ·ÖÎöºÍÆÀ¼Û£¬²¢ÔÚ¸ø³öÏµÍ³µÄ½çÃæÕ¹Ê¾¡£±¾ÕÂÖ÷Òª°üÀ¨ËÄ¸ö·½Ãæ£ºÊ×ÏÈ£¬ÏµÍ³µÄ½çÃæÕ¹Ê¾£¬Õâ¸ö½çÃæÖ÷ÒªÊÇ·Ö²¼Ê½ÎÄ¼þÏµÍ³µÄWEB UI£¬Í¨¹ýËü¿ÉÒÔÖ±¹ÛµØ¿´µ½¼¯ÈºÖÐÈ«²¿ÒÑ×¥È¡ÍøÒ³¡£Æä´Î£¬¶ÔÒÑ×¥È¡µÄÊý¾Ý½øÐÐÍ³¼ÆºÍ·ÖÎö¡£ÔÙ¹þ¶û±õ¹¤Òµ´óÑ§¹¤Ñ§Ë¶Ê¿Ñ§Î»ÂÛÎÄ- 7 -´Î£¬Óë·Ç·Ö²¼Ê½ÅÀ³æÏµÍ³µÄÐÔÄÜ±È½Ï£¬Í»³ö·Ö²¼Ê½ÅÀ³æµÄÓÅµã¡£×îºó£¬¶Ô±¾ÏµÍ³µÄ¹Ø¼üÎÊÌâµÄ½â¾ö°ì·¨×ö³öÌ½ÌÖºÍÆÊÎö¡£×Ü½áºÍÕ¹Íû£¬×îºó¶ÔÈ«ÎÄ½øÐÐ×Ü½á£¬¹éÄÉ³öÉè¼ÆµÄÒªµã£¬ÊáÀíÈ«ÎÄµÄ½á¹¹£¬ÕûÀí±¾ÎÄÉè¼ÆµÄ»ùÓÚHadoop ·Ö²¼Ê½ÅÀ³æµÄÓÅµãºÍÈ±µã¡£

[·µ»Ø]

ÉÏÒ»Æª£º´óÊý¾Ý»·¾³ÏÂµÄÍøÂçÖ÷¶¯ÈëÇÖ¼ì²â·½·¨ÑÐ¾¿
ÏÂÒ»Æª£º »ùÓÚÎÄ±¾ÍÚ¾ò¼¼Êõ¶Ô¹ÉÆ±ÂÛÌ³µÄ·ÖÎö