Home Basic Hadoop क्या है ? Hadoop के फायदे क्या है?

Hadoop क्या है ? Hadoop के फायदे क्या है?

0
Hadoop क्या है ? Hadoop के फायदे क्या है?

Hadoop क्या है:– दोस्तो क्या आपको पता है Hadoop क्या है तथा Hadoop के फायदे क्या है। आए दिन हम सुनते
है कि एक दिन में इतने videos देखे गए, एक दिन में इतने million email भेजे गए तो आखिर इतने
बड़े डेटा को analyse कैसे किया जाता है।

बड़ी बड़ी कंपनी यह कैसे पता लगाती है कि पूरी दुनिया में किसने क्या देखा तथा कितने मेसेज और
ईमेल भेजे गए, इसके लिए बहुत बड़े और पॉवरफुल tools का उपयोग होता है जिसका नाम है Hadoop। इसमें किसी भी big डेटा को analyse करने कि ताकत होती है।

https://www.equicklearning.com/dbms-kya-hai-in-hindi/

बिग डेटा का मतलब जैसे अभी मैंने आपको बताया कि एक दिन में लोगो ने क्या भेजा और इंटरनेट पर
क्या देखा इसका हिसाब रखना होता है अब दुनिया में 750 करोड़ लोग है और इतना सारा डेटा है
लेकिन इस Hadoop से यह करना थोड़ा आसान कर दिया है।

आगे पोस्ट में हम जानेंगे कि Hadoop के फायदे क्या है और Hadoop की परिभाषा क्या होती
है, लेकिन यह जानने के लिए आपको यह पोस्ट पढ़नी पड़ेगी यह पोस्ट पढ़ने के लिए Hadoop
क्या है यह आपको काफी अच्छे से समझ आ जायेगा।

Hadoop क्या है

Hadoop एक open source software framework हैं जो बहुत huge data स्टोरेज
प्रोवाइड करता है। software framework को आप किसी प्रकार का सॉफ्टवेयर मत समझना वल्कि यह सिर्फ एक फ्रेमवर्क है, जैसे Java एक framework हैं वह किसी भी प्रकार का सॉफ्टवेयर नहीं है उसी तरह Hadoop भी open source software framework हैं।

इसका इस्तेमाल बहुत बड़े डाटा को स्टोर तथा उसको प्रोसेस करने के लिए किया जाता है, इसकी खास बात है कि इसमें डिस्ट्रिब्यूटेड स्टोरेज को इस्तेमाल किया जाता है और distributed processing की जाती है। इसका यह मतलब हुआ कि इतने बड़े डेटा को अगर कोई एक कंप्यूटर प्रोसेस करेगा तो प्रोसेसिंग होने में काफी टाइम लगेगा और कंप्यूटर स्लो हो जाएगा।

इसलिए इसमें प्रोसेसिंग को बहुत सारे अलग अलग कंप्यूटर में बांट दिया जाता है जिससे प्रोसेसिंग
आसान और बहुत कम समय में हो जाती है और इसके जरिए किसी भी बड़े से बड़े डेटा को आंकलन
संभव हो पाता है। यह एक open source framework हैं जो सभी के लिए उपलब्ध है हालांकि इसको Java में लिखा गया है।

इसमें अलग अलग कंप्यूटर के काम करने को नोड्स कहा जाता है, इसे इस प्रकार डिजाइन किया गया है
कि किसी भी फाइल को प्रोसेस कर सके, अब समझते है Hadoop का आर्किटेक्चर क्या है?

Hadoop का आर्किटेक्चर

इसमें हम समझने वाले है कि Hadoop का आर्किटेक्चर कैसा होता है इसका रोल क्या होता है तथा इसमें कौन कौन से कंपोनेंट होते है।

1. Common utilities

Hadoop और इसके कंपोनेंट को सही से चलने के लिए यह Common utilities फाइल बेहद मदद करती है। Common utilities वह स्क्रिप्ट, इंफॉर्मेशन, या फिर मॉड्यूल, फाइल या फिर लाइब्रेरी है जो Hadoop के दूसरे कंपोनेंट को सही से चलाने में मदद करती है।

Common utilities ऐसी इंफॉर्मेशन, स्क्रिप्ट प्रोवाइड करता है जिससे आप Hadoop को कॉर्डिनेट या फिर स्टार्ट कर सकते हो, यह
मॉड्यूल Hadoop के लिए बेहद जरूरी होता है यही से कंट्रोल होता है कि Hadoop किस तरह से काम करेगा

2. Yarn Framework

Yarn का फुल होता “yet another resource negotiator” होता है यह Hadoop में 2 तरह से काम करता है पहला Js और दूसरा Rm।

Js – इसे job scheduling कहते है। जब भी आपको बहुत बड़ा डेटा प्रॉसेसिंग के लिए दिया जाता है अब आपके पास इतना पॉवरफुल कंप्यूटर तो है नहीं कि अकेला ही प्रोसेस कर लेगा इसलिए उसको छोटे छोटे Jobs (पार्ट्स) में बांट दिया जाता है।

अब इसमें यह देखा जाता है कि कौन सा job ज्यादा जरूरी है किस job को कौन सा टाइप
मिलना चाहिए और कौन सा job कितने तेज़ी से प्रोसेस करेगा यह सारा काम Js मैनेज करता है।

Rm – इसका मतलब “Resource Management” होता है, किसी भी डेटा को स्टोर करने और उसको प्रोसेस करने के किए
resources होना बहुत जरूरी है तो वो जो भी resource होंगे तथा उनको मैनेज करना यह सारा काम Rm करता है।

यह दोनों framework yarn मॉड्यूल में बहुत ज्यादा मदद करते है।

3. HDFS

इसका फुल फॉर्म “Hadoop Distributed file system” होता है जैसा की इसके नाम से ही समझ सा रहा है यह एक डिस्ट्रिब्यूटेड स्टोरेज होती है जिसका फायदे यह होता है processing पॉवर बढ़ जाती है और इसका बैकअप बनाने में आसानी होती है।

अगर आपका कोई एक नोड्स डाउन हो गया तो दूसरे नोड्स से सारा डेटा लेकर फिर से काम किया
जा सकता है तथा इसके साथ यह आपके डेटा के ऐक्सेस को काफी बढ़ा देता है इसलिए Hadoop
में यह बेहद जरूरी होता है।

4. Map reduce

Basically यह map reduce yarn framework पर बेस्ड है और इसको डिस्ट्रिब्यूटेड Processing भी कहा जाता है। जब आपको बिग डेटा दिया गया है तो सीरियल processing से काम नहीं चलता उसके लिए सबसे बेस्ट और कारगर तरीका है डिस्ट्रिब्यूटेड Processing।

यह किसी भी डेटा को parallel प्रोसेस करता है जिससे टाइम बचता है तथा प्रोसेसिंग एक्यूरेट होती
है। इसमें भी 2 फेज होते है पहले में मैप होगा और दूसरे मे रिड्यूस होकर आउटपुट जाएगा।

Hadoop के फायदे

देखिए किसी भी टेक्नोलॉजी या किसी भी चीज के दो पहलू होते है उसके फायदे और नुकसान तो चलिए अब जानते है कि Hadoop के फायदे क्या है?

1. इसकी कम्प्यूटिंग पॉवर बहुत अच्छी है यह इसलिए क्यूंकि इसका नेचर डिस्ट्रिब्यूटेड है।
2. इसकी स्टोरेज भी बहुत मैक्सिमम होती है।
3. यह fault tolerance होता है मतलब कि अगर एक नोड्स डाउन भी हो जाती है तो उस
नोड्स का काम दूसरे नोड्स में बांट दिया जाता है जिससे प्रोसेसिंग रुकती नहीं है।
4. किसी भी देता को प्रोसेस करने में flexible होता है, मतलब कोई भी डेटा जैसे ऑडियो,
वीडियो या किसी भी प्रकार कि फाइल को adapt करके उसको flexibility से प्रोसेस करता है।
5. इसकी कॉस्ट बहुत कम है क्यूंकि यह एक ओपन framework है जो सभी के लिए उपलब्ध है
इसलिए इसकी कॉस्ट बेहद कम है।

Hadoop के नुकसान

1. इसका सबसे बड़ा नुकसान यह है कि इसमें स्मॉल डेटा प्रोसेस नहीं होता, अब क्यूंकि इसे बहुत विशाल डेटा को एक्सक्यूट करने के लिए बनाया गया है इसलिए छोटे डेटा को यह फिट नहीं बैठता।
2. अगर आप Hadoop में एक दम नए हो तो आपको सिक्योरटी issue आ सकते है क्यूंकि इसमें सिक्योरिटी को एनाबल करना होता है।
3. इसकी प्रोग्रामिंग language में इतना ज्यादा flexibility नहीं होती है।

Final Word

दोस्तों इस पोस्ट के माध्यम से मैंने आपको बताया कि Hadoop क्या है और Hadoop के फायदे क्या है? यह टॉपिक इतना आसान नहीं है लेकिन मैंने अपनी तरफ से पूरी कोशिश कि है की आपको सरल तरीके से समझा सकूं।

अगर आपको इस पोस्ट से कुछ सीखने को मिला तो हमसे कॉमेंट बॉक्स में जरूर शेयर कीजिए, तथा आपको और कौन से विषय पर आर्टिकल चाहिए आप हमे यह भी बता सकते हो, बाकी अंत तक पोस्ट पढ़ने के लिए शुक्रिया।

NO COMMENTS

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Exit mobile version