داده های حجیم :

امروزه داده هاي حجیم  در مرکز توجه علوم مدرن و کسب و کار است. این داده ها از تراکنشهاي آنلاین، ایمیلها، ویدیوها، صدا، تصاویر، جریانهاي کلیک، گزارش خطاها، پستها، گزارشات جستجو، رکوردهاي اطلاعات سلامت، عملیات متقابل در شبکه هاي اجتماعی، داده هاي علمی، حسگرها، تلفن هاي همراه و نرم افزارهاي روي تلفن هاي همراه تولید میشوند.
دیتابیس هاي حاوي این داده ها به سرعت رشد می کنند و نظارت، فرم دهی، ذخیره، مدیریت، اشتراك گذاري، آنالیز و مجازي سازي آنها از طریق ابزارهاي نرم افزاري معمول دشوار است. یکی از چالشهاي مهم محققین و کارشناسان این است که با رشد سریع داده هاي حجیم ،نیاز به اقدامات مناسب جهت آنالیز و بروز رسانی داده به سرعت افزایش مییابد.

آمار ها بیانگر آن است که :

حجم اطلاعاتی که تا سال 2003 توسط انسان ایجاد شد تنها 5 اگزابایت(1018)  بایت است. اما امروزه این حجم از اطلاعات تنها در عرض دو روز ایجاد2 اگزابایت داده تولید میشود و حدود 90 % دادههاي موجود تنها در دو سال اخیر تولید شده است.هر کامپیوتر شخصی حدود 500 گیگابایت اطلاعات در خود نگهداري میکند و در دنیا حدود 20 میلیون کامپیوتر شخصی وجود دارد. در گذشته فرآیند توصیف ژن انسان حدود 10 سال طول میکشید در حالی که امروز در کمتر از یک هفته انجام میشود. شرکتی مثل گوگل بیلیو نها سرور در سطح جهان دارد. حدود 6 بیلیون مشترك تلفن همراه در جهان همه روزه 10 میلیون پیام متنی ارسال و دریافت میکنند و تا سال 2020 حدود 50 بیلیون وسیله متصل به اینترنت و شبکه وجود خواهد داشت. از سال 2012 ، دادههاي حجیم به عنوان یک پروژه مهم و جهانی مطرح شد. پروژهاي که به جمع آوري، بصري سازي  و آنالیز مقدار زیادي داده می پردازد. در راستاي این پروژه اطلاعات آماري زیادي ارایه گردید. فیس بوک دو ماهانه حدود 955 میلیون کاربر فعال به 70 زبان زنده دنیا دارد و حدود 140 بیلیون عکس در آن بارگذاري می شود و 125 میلیون ارتباط دوستی2  بیلیون لایک و توضیحات  برقرار می گردد. هر روزه     30 بیلیون نوشته وارسال میگردد. در یوتیوب  هر  دقیقه 48 ساعت ویدیو بارگذاري و هر روزه 4 بیلیون فیلم اجرا میگردد. گوگل نیز از سرویسهاي زیادي پشتیبانی میکند از7  بیلیون صفحه در هر روز و 20 پتابایت (1015) بایت فرآیند از جمله نظارت بر
و ترجمه روزانه به 66 زبان؛ یک بیلیون توییت   در هر 72 ساعت، بیشتر از140 میلیون فعالیت کاربران توییتر است 571 .وب سایت جدید در هر دقیقه از روز ایجاد می شود . در طی دهه آینده حجم اطلاعات 50 بار افزایش می یابد، البته همزمان تعداد تکنولوژي هاي خاص سی برابر می شود اطلاعاتی که براي نگهداري این دادهها ایجاد می شود نیز 5می گردد.

انواع مختلف منابع تولید داده هاي حجیم به شرح زیر است:

الف- مدیاي اجتماعی: مدیاي اجتماعی، اطلاعاتی است که از طریق به به اشتراك گذاري و یا تبادل اطلاعات از طریق آدرس هاي اینترنتی و یا ازطریق ارتباطات مجازي و شبکه هاي مجازي به دست می آیند، نظیر اطلاعات یکه در پروژه هاي اشتراکی، بلاگها، میکروبلاگ ها، فیسبوك و توییتر تولیدمی شوند.

ب- داده هاي ماشین: داده ماشینی، اطلاعاتی است که به صورت اتوماتیک توسط سخت افزار و نرم افزارهاي ابزارهایی نظیر کامپیوترها، وسایل پزشکی یا دیگر ماشینها بدون دخالت انسان تولید میشود.

ج- حسگرها: وسایل حسگر مختلفی براي اندازهگیري کمیت هاي فیزیکی و تبدیل آنها به سیگنال وجود دارد که بخشی از دادههاي حجیم
را تولید مینماید.

د- تراکنش هاي اینترنتی : (IoT)یک مجموعه از اشیایی است که به صورت یکتا قابل تعریف هستند و به عنوان بخشی از اینترنت می باشند. این اشیاء شامل تلفن هاي کوچک، دوربین هاي دیجیتال و تبلتها هستند. وقتی این وسایل از طریق اینترنت به یکدیگر متصل می شوند قادرند بیشترپردازشهاي کوچک و سرویسهاي پشتیبانی پایش اقتصادي، محیطی و سلامت مورد نیاز را فراهم آورند. تعداد زیاد وسایل متصل به اینترنت، انواع مختلفی از سرویس ها را فراهم می آورند و مقادیر زیادي داده و اطلاعات تولید مینمایند.

نوکیا »
نوکیا یک کمپانی ارتباطی موبایل است که تولیدات آن بخش مهمی از زندگی مردم را فرا گرفته است. تعداد زیادي از مردم از موبایل هاي نوکیا براي ارتباطات، تصویربرداري و به اشتراك گذاري اطلاعات استفاده میکنند؛ بنابراین نوکیا به جمع آوري و آنالیز مقدار زیادي اطلاعات از طریق موبایل ها پرداخت . نوکیا براي استفاده وسیع از داده هاي حجیم به یک اکوسیستم از تکنولوژي ها نیاز دارد که شامل یک ترادیتا انبار داده، تعداد زیادي مراکز دادهاست. نوکیا Hadoop و تکنولوژيهاي ویژوال سازي و MySQL اوراکل و بالغ بر 100 ترابایت داده ساخت یافته بر روي چندین تراداده دارد و همچنین انبار HDFS چندین پتابایت داده چندساختاري بر روي انبار داده خود دارد.

نتیجه :

در حال حاضر، داده از نظر اندازه در حال بزرگ شدن است و این روند رو به رشد با افزایش تنوع داده تولید شده بیشتر می شود.  سرعت تولید داده به دلیل استفاده زیاد از وسایل همراه و حسگرهاي متصل به اینترنت در حال افزایش است. داده هاي تولید شده فرصتی مناسب براي همه صنایع و حرفه ها ایجاد می کنند تا با آنالیز داده هاي حجیم به آگاهی بهتر نسبت به کسب و کار خود دست یابند. امروزه شرکت های تحلیل اطلاعاتی سرویسهایي براي ذخیره، پردازش و آنالیز داده، برای داده های حجیم در سطح جهانی ایجاد کرده اند. این سرویس ها چهره تکنولوژي هاي ارتباطی را تغییرداده اند.  همچنین وقوع داده نامتعادل در دسته بندي داده هاي حجیم و محیط های داخلی و خارجی سیستم های کاری و اطلاعاتی موضوع حایز اهمیتی است که میتواند نقش این شرکت ها را در آینده نشان و زمینه ساز بزرگترین تغییرات در دهکده جهانی و سیستم های کاری را فراهم کند.









نظرات

پست‌های معروف از این وبلاگ

ایده 1