हेल्लो friends, आज इस पोस्ट में हम Four of Big Data in Hindi के बारें में पढेंगे तो चलिए शुरू करते हैं:-
Four Vs of Big Data in Hindi
कुछ विशेषताएं होती हैं जिनके द्वारा big data को define किया जाता है. इन विशेषताओं को Four Vs कहा जाता है. – Volume, Variety, Veracity और Velocity.
Volume –
एक मुख्य विशेषता जो data को बड़ा बनाती है वह है इसका volume (मात्रा). Volume का अर्थ है इसके size से है. इसका size बहुत ही ज्यादा अधिक होता है. यह सामन्यतया terabyte (TB), तथा petabyte (PB) से भी अधिक होता है.
डेटा की इतनी बड़ी मात्रा को प्रोसेस करने के लिए traditional (पारम्परिक) storage और processing capabilities की तुलना में अलग processing technique की आवश्यकता होती है.
दूसरे शब्दों में कहें तो, “बिग डाटा में data sets इतने बड़े होते है कि उन्हें regular laptop या computer से प्रोसेस नही किया जा सकता.”
एक high volume डाटा का उदाहरण:- India में एक दिन में Facebook पर upload होने वाला data.
हर साल data 50 प्रतिशत की दर से बढ़ता है और कोई नही जानता कि नया data कितना generate होगा परन्तु एकत्रित की जा रही जानकारी (information) बहुत बड़ी होगी।
Variety –
Variety (विविधता) बिग डेटा को वास्तव में बड़ा बनाती है। बिग डेटा जो है वह अलग-अलग sources से आता है. और data सामान्यतया यह तीन प्रकार का होता है:- structured, semi-structured और Unstructured data.
Data की variety के लिए हमें अलग processing capabilities और विशेष algorithms की जरूरत होती है.
high variety sets का उदाहरण:- एक city में अलगअलग locations से ली जाने वाली CCTV ऑडियो और विडियो files.
बहुत सारें sources जैसे कि- social media, CRM system, call center logins, emails, audio, video, आदि जो है वह अलग-अलग प्रकार का डाटा उत्पन्न करती है.
Veracity –
Veracity का तात्पर्य data की विश्वसनीयता (trustworthiness) से है. data का बहुत बड़ी मात्र में होना यह नही है कि डाटा सही और accurate ही होगा. Data की quality इस बात पर निर्भर करती है कि data कहा से आया है, इसे कैसे collect किया गया है, और इसे कैसे analyze किया गया है.
Velocity –
Velocity का अर्थ जनरेट होने वाले data की speed से है और कितनी जल्दी company इस डाटा को analyze करती है और उपयोग करती है.
High velocity का data इतनी तेज गति से जनरेट होता है कि इसे process करने के लिए advance tools की आवश्यकता होती है.
सही निर्णय लेने के लिए डाटा को हमेशा clean, consistent और consolidate होना चाहिए.
High velocity data का उदाहरण:- twitter मैसेज तथा Facebook पोस्ट से उत्पन्न होने वाला डाटा.
निवेदन:- अगर आपके लिए यह आर्टिकल useful रहा हो तो इसे अपने दोस्तों और सहपाठियों के साथ जरुर share कीजिये. और आपके जो भी questions है आप उन्हें नीचे कमेंट करके बताइए. thanks.