大数据搜集技术,对数据进行ETL操作,经过对数据进行提取、转化、加载,最终发掘数据的潜在价值,然后提供给用户解决方案或许决策参阅。那么,大数据搜集体系有哪些分类呢?今天就跟从小编一同来了解下吧!
1ãä½ç³»æ¥å¿æéä½ç³»
对æ¥å¿æ°æ®ä¿¡æ¯è¿è¡æ¥å¿æéãæéï¼ç¶åè¿è¡æ°æ®åæï¼åæå ¬å¸äºå¡æ¸ éæ¥å¿æ°æ®ä¸çæ½å¨ä»·å¼ãç®è¨ä¹ï¼æéæ¥å¿æ°æ®æä¾ç¦»çº¿åå¨çº¿çå®æ¶åæè¿ç¨ãç®å常ç¨çå¼æºæ¥å¿æéä½ç³»ä¸ºFlumeã
2ãç½ç»æ°æ®æéä½ç³»
ç»è¿ç½ç»ç¬è«åä¸äºç½ç«æ¸ éæä¾çå ¬å ±API(å¦Twitteråæ°æµªå¾®åAPI)çæ¹å¼ä»ç½ç«ä¸è·åæ°æ®ãè½å¤å°éç»æåæ°æ®ååç»æåæ°æ®çç½é¡µæ°æ®ä»ç½é¡µä¸æååºæ¥ï¼å¹¶å°å ¶æåãæ¸ æ´ã转åæç»æåçæ°æ®ï¼å°å ¶åå¨ä¸ºä¸è´çæ¬å°æ件æ°æ®ã
ç®å常ç¨çç½é¡µç¬è«ä½ç³»æApache NutchãCrawler4jãScrapyçç»æã
3ãæ°æ®åºæéä½ç³»
ç»è¿æ°æ®åºæéä½ç³»ç´æ¥ä¸ä¼ä¸äºå¡åå°æå¡å¨ç»åï¼å°ä¼ä¸äºå¡åå°æ¯æ¶æ¯å»é½å¨åç大éçäºå¡è®°è½½åå ¥å°æ°æ®åºä¸ï¼æåç±ç¹å®çå¤çå许ä½ç³»è¿è¡ä½ç³»åæã
ç®å常ç¨èç³»åæ°æ®åºMySQLåOracleçæ¥åå¨æ°æ®ï¼RedisåMongoDBè¿æ ·çNoSQLæ°æ®åºä¹å¸¸ç¨äºæ°æ®çæéã
å ³äºå¤§æ°æ®ééç³»ç»æåªäºåç±»ï¼éè¤å°ç¼å°±åæ¨å享å°è¿éäºãå¦ææ¨å¯¹å¤§æ°æ®å·¥ç¨ææµåçå ´è¶£ï¼å¸æè¿ç¯æç« å¯ä»¥ä¸ºæ¨æä¾å¸®å©ãå¦ææ¨è¿æ³äºè§£æ´å¤å ³äºæ°æ®åæå¸ã大æ°æ®å·¥ç¨å¸çæå·§åç´ æçå 容ï¼å¯ä»¥ç¹å»æ¬ç«çå ¶ä»æç« è¿è¡å¦ä¹ ã