5 টি মূল অঞ্চল যেখানে বড় ডেটা একটি বড় প্রভাব ফেলছে

লেখক: Eugene Taylor
সৃষ্টির তারিখ: 9 আগস্ট 2021
আপডেটের তারিখ: 1 জুলাই 2024
Anonim
আর্কিটেকচার কাটা #1 - একটি বিশেষজ্ঞের সাথে বিশ্লেষণ [কিভাবে একটি বাস্তব সমাধান স্থপতি কাজ করে] #ity
ভিডিও: আর্কিটেকচার কাটা #1 - একটি বিশেষজ্ঞের সাথে বিশ্লেষণ [কিভাবে একটি বাস্তব সমাধান স্থপতি কাজ করে] #ity

কন্টেন্ট


সূত্র: নেমেডিয়া / ড্রেসমটাইম ডটকম

ছাড়াইয়া লত্তয়া:

বিগ ডেটা সর্বত্র বড় ব্যবসা, তবে এই প্রযুক্তিটি সবচেয়ে বেশি লাভবান করার কয়েকটি নির্দিষ্ট ক্ষেত্র।

আমি যখন এই নিবন্ধটি শুরু করেছি, তখন আমি বিভিন্ন ধরণের বড় ডেটা প্ল্যাটফর্মগুলির তালিকা করার পরিকল্পনা করছিলাম। তবে, তিনটি দিন পরে সমস্ত বিগ ডেটা অফারগুলি - রিলেশনাল বনাম অ-রিলেশনাল, এসকিউএল বনাম নো এসকিউএল এবং ডাটাবেস বনাম ফ্রেমওয়ার্ক - কিছুটা অর্ডার দেওয়ার জন্য, সিদ্ধান্ত নেওয়ার চেষ্টা করার পরে, আমি সেই জগাখিচুড়ি এড়াতে সিদ্ধান্ত নিয়েছি।

চোটে অপমান যুক্ত করার জন্য, আমি নিবন্ধটির অংশ হিসাবে সেই ব্যক্তিকে পরিচয় করিয়ে প্রত্যাশা করেছিলাম যিনি "বিগ ডেটা" শব্দটি তৈরি করেছিলেন। তবে, আমি এটিও করতে পারি না। কোন সম্মত উত্তর নেই। প্রকৃতপক্ষে, একটি মূলত উত্সাহিত গবেষণা প্রকল্প রয়েছে যা মূলত কে বড় ডেটা নিয়ে এসেছে তা খতিয়ে দেখছে। পরিবর্তে, আমি বড় ডেটা ব্যবহারের কয়েকটি মূল উপায়গুলি একবার দেখে নিই। আরও অনেক গুরুত্বপূর্ণ। এবং এটি আপনার চেয়ে বেশি আকর্ষণীয় এবং অবাক করার মতো।


কীভাবে এটা ঘটেছিল

Traditionalতিহ্যবাহী ডেটা মাইনিং ব্যবহার করে বিশ্লেষকরা বছরের পর বছর ধরে ডেটা ম্যানিপুলেট করে চলেছেন। এই একই বিশ্লেষকরা এখন ব্যবসায়, বেসরকারী সংস্থাগুলি এবং সরকারী সংস্থাগুলি দ্বারা প্রাপ্ত পরিমাণ এবং বিভিন্ন উপাত্তের সাথে লড়াই করা কঠিন হয়ে পড়ছে।

বড় ডেটা প্রবেশ করুন, ডেটা মাইনিংয়ের পরবর্তী বিবর্তনীয় পদক্ষেপ। আজকের ডিজিটাল বিশ্বে প্রচুর ডাটাবেস এবং অগণিত ধরণের ডেটা তৈরির জন্য বড় ডেটাগুলি ডিজাইন করা হয়েছিল। যদি "বৃহত্তর" আপনার যদি গুগল এবং এটি সংগ্রহ করা সমস্ত ডেটা সম্পর্কে চিন্তা করে থাকে, আপনি বলপার্কে থাকবেন। আপনাকে অবাক করে দেওয়ার বিষয়টি হ'ল গুগল বিশ্বের বৃহত্তম ডাটাবেসগুলির শীর্ষ দশ তালিকার মধ্যে চতুর্থ। ২০১৪ সালের জানুয়ারী পর্যন্ত, ওয়ার্ল্ড ডেটা সেন্টার ফর ক্লাইমেট 220 টেরাবাইট ডেটা নিয়ে তালিকায় শীর্ষে রয়েছে এবং এটি নির্দিষ্ট কারও এজেন্সি দ্বারা নিয়ন্ত্রিত ডাটাবেসের আকার সম্পর্কে কারও অনুমান।

অবশ্যই, বড় ডেটা গ্রহণ করেছিল কারণ এটি বিস্তৃত পরিমাণে ভিন্ন ভিন্ন ডেটা ম্যানিপুলেট করা এবং আশ্চর্যজনক - এবং আশ্চর্যজনকভাবে বিস্তারিত এবং ব্যক্তিগত - জিনিসগুলি আবিষ্কার করে discover জন সামসার, এইচআর শিল্প বিশ্লেষক, নিম্নলিখিত উদাহরণটি সরবরাহ করেন:


"আজ আমরা হাইপোথিসিস তৈরি করি এবং ডেটা সংগ্রহ করি। আগামীকাল আমরা বিপরীতটি করবো। তথ্য গঠনের ধ্রুবক এবং অবিচলিত সংগ্রহ আমাদের প্রশ্ন গঠনের আগে ডেটা দেখতে সক্ষম করবে। এর অর্থ আমরা যে প্রশ্নগুলি করি নি তার উত্তর পাব। ' জিজ্ঞাসা করতে জানি না We আমরা সত্য বলে আমরা ধরে নিয়েছি এমন গোটা গোছগুলিকে আমরা চিন্তাভাবনা করব। "

অবশ্যই, আমরা এই ডেটা ব্যবহারের জন্য কয়েকটি ভয়ঙ্কর পদ্ধতি সম্পর্কে শুনেছি যেমন তার পরিবার এমনকি এটি সনাক্ত করার আগেই কোনও যুবতী মহিলার গর্ভাবস্থা নির্ধারণের লক্ষ্যগুলি। তবে বড় ডেটাও অনেক কম অশুভ কারণের জন্য ব্যবহার করা হচ্ছে। এখানে কয়েকটি সংস্থা রয়েছে যা এটির সবচেয়ে বেশি সুবিধা দিচ্ছে:

কেউ যখন সফ্টওয়্যার মানের সম্পর্কে চিন্তা করে না তখন আপনি আপনার প্রোগ্রামিং দক্ষতা উন্নত করতে পারবেন না।

একটি সুস্পষ্ট ক্ষেত্রের বড় ডেটা চিকিত্সা সংস্থা জুড়ে নিরাপদে এবং নির্ভুলভাবে বৈদ্যুতিন স্বাস্থ্য রেকর্ড পরিচালনা করতে সহায়তা করবে। সঠিক রেকর্ড থাকা রোগীদের উন্নত পরিষেবা এবং হ্রাস ত্রুটি সরবরাহ করবে। স্বাস্থ্যসেবা ক্ষেত্রটি সুস্পষ্ট কারণে রোগীর গোপনীয়তা সম্পর্কিত সরকারী বিধিবিধান মেনে চলার জন্য ধীর গতিতে বড় ডেটা মানিয়ে নিচ্ছে।

যেমন আগেই উল্লেখ করা হয়েছে, বড় ডেটা অনস্ক্রিত প্রশ্নের উত্তর সরবরাহ করার জন্য পরিচিত। স্বাস্থ্যসেবা ক্ষেত্রে, এর অর্থ হতে পারে একটি নতুন ড্রাগ বা চিকিত্সা সন্ধান করা যা অন্যথায় খুঁজে পাওয়া যেত না। ম্যাককিনজি অ্যান্ড কোম্পানির মতে, বড় তথ্য অদূর-ভবিষ্যতের ভবিষ্যতে নিম্নলিখিতগুলি সম্ভব করে তুলতে পারে:

  • জৈবিক প্রক্রিয়াগুলির ওষুধগুলির ভবিষ্যদ্বাণীপূর্ণ মডেলিং আরও পরিশীলিত এবং বিস্তৃত হয়।
  • রোগীদের সামাজিক যোগাযোগের মতো তথ্যের আরও উত্সের ভিত্তিতে ক্লিনিকাল ট্রায়ালগুলিতে নাম লেখানোর জন্য চিহ্নিত করা হয়।
  • নিরাপত্তা বা অপারেশনাল সমস্যাগুলি দ্রুত সনাক্ত করতে ট্রায়ালগুলি বাস্তব সময়ে পর্যবেক্ষণ করা হয়।
  • অনমনীয় ডেটা সিলোগুলির পরিবর্তে যেগুলি শোষণ করা কঠিন, ডেটা বৈদ্যুতিনভাবে ক্যাপচার করা হয় এবং বিভিন্ন ইউনিটের মধ্যে সহজেই প্রবাহিত হয়।

বড় তথ্য, বড় সুযোগ

কিছু নির্দিষ্ট ক্ষেত্রে বড় ডেটা ব্যবহার করা হচ্ছে, তবে এটি নিম্নলিখিত অঞ্চলে সমস্ত সংস্থার জন্য সুযোগ দেয়:

যে কোনও কম্পিউটিং এবং নেটওয়ার্কিং ডিভাইস লগ ডেটা সম্পর্কে। ডেটা পরিমাণে লগ হওয়ার পরিমাণ অঘোষিত হয়ে যায়। বড় ডেটা সহজেই পরিমাণ পরিমাণের ডেটা পরিচালনা করতে পারে, প্রশাসকদের নেটওয়ার্ক কার্যকলাপ পর্যবেক্ষণ করতে, সমস্যা নির্ণয় করতে বা উদাহরণস্বরূপ রুবিন আমাকে নির্দিষ্ট নেটওয়ার্ক ট্র্যাফিক প্যাটার্নগুলি সন্ধান করে যা ম্যালওয়্যার ক্রিয়াকলাপ নির্দেশ করে।

আপনি যদি এই নিবন্ধটি পড়ছেন তবে এটি মোটামুটি নিরাপদ বাজি যা আপনি ওপেনএসএসএল-এর আশেপাশের হার্টবেল্ড ইস্যু সম্পর্কে অবগত আছেন। প্রযুক্তিগত সমস্যাটি ছাড়াও, দুশ্চিন্তাটি বেশ কয়েক বছর ধরেই রয়েছে বলে উদ্বেগ রয়েছে। রুবিন উল্লেখ করেছেন যে বড় তথ্য ডেটা বিশ্লেষকদের সাথে কাজ করে নেটওয়ার্ক প্রশাসকদের ম্যানেজ করে এমন একটি প্রোগ্রাম তৈরি করতে দেয় যা দূষিত হৃদস্পন্দনের জন্য সমস্ত নেটওয়ার্ক লগ অনুসন্ধান করবে। এই ইএফএফ পোস্টে উল্লেখ করা হয়েছে:

"বিস্তৃত প্যাকেট লগ রয়েছে এমন কোনও নেটওয়ার্ক অপারেটররা দূষিত হার্টবিটগুলির জন্য যাচাই করতে পারে, যার বেশিরভাগই 18 03 02 00 03 01 বা 18 03 01 00 03 01 (অথবা সম্ভবত 18 03 03 00 03 01 01) এর টিসিপি পেওলড থাকে" "

নীচের উদাহরণটি শো অডিট কমান্ডের নমুনা আউটপুট:

রাউটার # শো অডিট

* সেপ্টেম্বর 14 18: 37: 31.535:% অডিট -1-রুন_ভিশন: হ্যাশ:

24D98B13B87D106E7E6A7E5D1B3CE0AD ব্যবহারকারী:

* সেপ্টেম্বর 14 18: 37: 31.583:% অডিট -1-রুন_কনফিগ: হ্যাশ:

4AC2D776AA6FCA8FD7653CEB8969B695 ব্যবহারকারী:

* সেপ্টেম্বর 18 18: 37: 31.595:% অডিট-1-STARTUP_CONFIG: হ্যাশ:

95DD497B1BB61AB33A629124CBFEC0FC ব্যবহারকারী:

* সেপ্টেম্বর 14 18: 37: 32.107:% অডিট -1-ফাইল সিস্টেম: হ্যাশ:

330E7111F2B526F0B850C24ED5774EDE ব্যবহারকারী:

* সেপ্টেম্বর 18 18: 37: 32.107:% অডিট -1-হার্ডওয়ারE_কনিফিগ: হ্যাশ:

32F66463DDA802CC9171AF6386663D20 ব্যবহারকারী:


আপনি যদি সময় স্ট্যাম্পগুলি অনুসরণ করেন তবে এই সমস্ত প্রবেশের সময় ব্যবধানটি এক সেকেন্ডেরও কম ছিল। আমি এক দিনের জন্যও তা এক্সট্রোপোলেট করতে চাই না, দু'বছর ছেড়ে দাও!

কিছু দেখার জন্য

আপনি যদি কাজের বিজ্ঞাপনগুলি পরীক্ষা করেন তবে বড় ডেটা বিশেষজ্ঞদের জন্য তীব্র প্রয়োজন রয়েছে। আমি রুবিনকে এ সম্পর্কে জিজ্ঞাসা করেছি। তিনি সম্মত হন, উল্লেখ করে তাঁর শিক্ষার্থীরা তাদের সম্ভাবনা সম্পর্কে উচ্ছ্বসিত। আমি তখন বুঝতে পেরেছি যে বড় ডেটা প্ল্যাটফর্মগুলি, বিশেষত ওপেন সোর্স হিসাবে বিবেচিত, একটি টাইমলাইন অনুসরণ করছে যে লিনাক্স কী মূলধারার হয়ে উঠেছে তার সাথে খুব মিল।

বিশ্ববিদ্যালয়গুলি বিগ-ডেটা প্ল্যাটফর্মগুলির ওপেন সোর্স সংস্করণগুলিকে আলিঙ্গন করে, বিশেষত হাদুপ, কারণ তারা বিনামূল্যে, এবং শিক্ষার্থীরা উত্স কোডটি পরিচালনা করতে পারে। সুতরাং যে সমস্ত স্নাতক যারা এই সমস্ত কাজের সূচনা পূরণ করেন তারা ওপেন সোর্স প্ল্যাটফর্মগুলির সাথে কাজ করা পছন্দ করতে পারেন, কারণ এটি তাদের পক্ষে সবচেয়ে ভাল। এটি দেখতে আকর্ষণীয় হবে।