අද වෙනකොට හැමෝම වගෙ කතා කරන්න පටන් අරන් තියන මාතෘකාවක් තමයි මේ බිග් ඩේටා කියන්නේ ලොකේ තියන ප්රසිදම සමගම් වල ඉදන් රටවල් වල මුදල් , පරිපලනය වගෙ ගොඩක් දේවල් පලනය කරන්න මෙ බිග් ඩේටා පාවිච්චි කරනවා. බිග් ඩේටා කියන එක සාම්න්යයෙන් මේ වගේ ලිපියකින් පැහැදිලි කරන්න බෑ. බිග් ඩෙටා කියන්නේ මොකද්ද කියලා කෙටියේන් බලමු :
බිග් ඩේටා කියන එකට මේ වගේ කෙටියෙන් පැහැදිලිකිරිමක් දෙන්න පුලුවන්
සාම්ප්රදායික ඩෙටා ප්රොසෙසින්ග් ක්රම වලට ප්රොසෙස් කරන්න බැරි හා ගබඩා කරලා තියාගන්න බැරී විශාල හා සoකිර්ණ දත්ත ප්රමානයකට බිග් ඩෙට කියලා කෙටියෙන් කියන්න පුලුවන්.
BIG DATA වලට උදාහරණ :
- නිව්යෝර්ක් කොටස් හුවමාරුව නව දත්ත ටෙරාබයිට් එකක වෙළඳ දත්ත ප්රමාණයක් දිනකට ජනනය කරයි.
- සංඛ්යාලේඛන වලට අනුව සෑම දිනකම ටෙරාබයිට් 500+ පමණ නව දත්ත ප්රමානයක් සමාජ මාධ්ය වෙබ් අඩවිය වන ෆේස්බුක් හි දත්ත ගබඩාවලට ඇතුල් වේ. මෙම දත්ත ප්රධාන වශයෙන් ඇති වන්නේ ඡායාරූප සහ වීඩියෝ එක්කිරිම කිරීම්, පණිවිඩ හුවමාරුව, යනාදියෙනි.
- තනි ජෙට් එන්ජිමකට විනාඩි 30 ක ගුවන් ගමන් කාලයක් තුල ටෙරාබයිට් 10 + දත්ත ජනනය කළ හැකිය. දිනකට ගුවන් ගමන් දහස් ගණනක් සමඟ, දත්ත උත්පාදනය තුලින් බොහෝ විට පෙටබයිට් දක්වා ළඟා වේ.
- Self-driving car වලින් තප්පරයකට 1GB පමණ දත්ත ප්රමණයක් නිපද වේ
Do you know? 1021 bytes equal to 1 zettabyte or one billion terabytes forms a zettabyte.
BIG DATA වල ලක්ෂණ (3v concept) :
(i) Volume( ඩේටා ප්රමානය) –
දත්තවල වටිනාකම තීරණය කිරීමේදී දත්ත ප්රමාණය ඉතා තීරණාත්මක කාර්යභාරයක් ඉටු කරයි. එසේම, කිසියම් දත්තයක් ඇත්ත වශයෙන්ම විශාල දත්තයක් ලෙස සැලකිය හැකිද නැද්ද යන්න දත්ත ප්රමනය මත රඳා පවතී. එබැවින්, ‘Volume’ යනු BIG DATA සමඟ ගනුදෙනු කිරීමේදී සලකා බැලිය යුතු එක් ලක්ෂණයකි.
(ii) Variety(දත්ත වල විවිධත්වය)- මේම විවිධ වර්ගයෙ දත්ත කොටස් 3 කට දක්වන්න පුලුවන් :
- Structured
- Unstructured
- Semi-structure
Do you know? Data stored in a relational database management system is one example of a ‘structured’ data.
(iii) Velocity (දත්ත ඇතිවෙන වේගය) –
‘Velocity‘ යන්නෙන් අදහස් කරන්නේ දත්ත උත්පාදනය කිරීමේ වේගයයි. ඉල්ලීම් සපුරාලීම සඳහා දත්ත කොතරම් වේගයෙන් ජනනය කර සැකසෙනවාද යන්න, දත්තවල සැබෑ වේගය තීරණය කරයි.එසේම, කිසියම් දත්තයක් ඇත්ත වශයෙන්ම විශාල දත්තයක් ලෙස සැලකියහැකිද නැද්ද යන්න දත්ත ප්රමනය මත රඳා පවතී. එබැවින්, ‘Volume’ යනු BIG DATA සමඟ ගනුදෙනු කිරීමේදී සලකා බැලිය යුතු එක් ලක්ෂණයකි.
In 2020, there will be around 40 trillion gigabytes of data.
Big data කියලා එකක් ඇතිවෙන්න ප්රදානම හේතුව තමයි සම්ප්රදායික data processing ක්රම වල තියන දුර්වලතා. එව තමයි ඒ ඩේටා ප්රොසෙසින්ග් ක්රම හදනකොට එවා හදුන්වලා දෙන අය හිතලා නෑ වර්තමානය වෙනකොට එවා මෙතරම් විශාල ලෙස ප්රොසෙස් කරන්න වෙයි කියා.
You may also like : Potential Security Threats To Your Computer Systems.