![হাদোপ সম্পর্কে 7 টি বিষয় জানুন - প্রযুক্তি হাদোপ সম্পর্কে 7 টি বিষয় জানুন - প্রযুক্তি](https://a.continuousdev.com/technology/7-things-to-know-about-hadoop.jpg)
কন্টেন্ট
- হাদুপ এর শুরুটা কীভাবে করলেন?
- হাদোপ সম্পর্কে এত গুরুত্বপূর্ণ কী?
- পড়াতে স্কিমা কী?
- মধু কি?
- হাদোপ কোন ধরণের ডেটা বিশ্লেষণ করে?
- আপনি কি হাদোপের সত্যিকারের বিশ্বের উদাহরণ দিতে পারেন?
- হাদুপ ইতিমধ্যে অপ্রচলিত বা কেবল মরফিং করছে?
সূত্র: প্রেসারুয়া / ড্রিমসটাইম ডট কম
ছাড়াইয়া লত্তয়া:
হাদুপ এখন বছরের পর বছর ধরে ডেটা বিশ্লেষণে সহায়তা করে আসছে তবে এটি সম্পর্কে আপনি কিছু জানেন না এমন সম্ভবত আরও কিছু জিনিস রয়েছে।
হাদুপ কী? এটি হলুদ খেলনা হাতি। আপনি যা আশা করেছিলেন তা নয়? এটি সম্পর্কে: ডগ কাটিং - এই ওপেন-সোর্স সফ্টওয়্যার প্রকল্পের সহ-স্রষ্টা - তার ছেলের কাছ থেকে নাম ধার করেছিলেন যিনি তার খেলনা হাতি হাদুপকে ডাকেন। সংক্ষেপে, হ্যাডোপ একটি সফ্টওয়্যার কাঠামো যা অ্যাপাচি সফ্টওয়্যার ফাউন্ডেশন ডেটা-ইনটেনসিভ, ডিস্ট্রিবিউটেড কম্পিউটিং ডেভেলপ করতে ব্যবহৃত হয় by এবং এটি অন্য একটি বাজওয়ার্ড পাঠকদের একটি মূল উপাদান: যথেষ্ট পরিমাণে পাওয়া যায় না বলে মনে হয় না। এই অনন্য, অবাধে লাইসেন্সযুক্ত সফ্টওয়্যার সম্পর্কে আপনার সাতটি বিষয় জানা উচিত।হাদুপ এর শুরুটা কীভাবে করলেন?
বারো বছর আগে, গুগল বিপুল পরিমাণে ডেটা সংগ্রহ করে তা পরিচালনা করতে একটি প্ল্যাটফর্ম তৈরি করেছিল। সংস্থাটি প্রায়শই এটি করে, গুগল তার নকশাটি দুটি কাগজপত্রের আকারে জনসাধারণের কাছে উপলভ্য করেছে: গুগল ফাইল সিস্টেম এবং মানচিত্রে uceএকই সময়ে, ডগ কাটিং এবং মাইক কাফেরেলা একটি নতুন সার্চ ইঞ্জিন নাচতে কাজ করছিলেন। দু'জন কীভাবে বিপুল পরিমাণে ডেটা পরিচালনা করবেন তা নিয়ে লড়াই করে যাচ্ছিলেন। তারপরে এই দুই গবেষক গুগলের কাগজপত্রগুলি পেয়েছিলেন। ভাগ্যবান ছেদটি কাটিং এবং ক্যাফেরেলা কে একটি আরও ভাল ফাইল সিস্টেম এবং ডেটা ট্র্যাক রাখার উপায়ের সাথে পরিচয় করিয়ে সবকিছু পরিবর্তন করেছিল এবং শেষ পর্যন্ত হ্যাডোপ তৈরির দিকে নিয়ে যায়।
হাদোপ সম্পর্কে এত গুরুত্বপূর্ণ কী?
আজ, ডেটা সংগ্রহ করা আগের চেয়ে সহজ। এই সমস্ত ডেটা থাকা অনেক সুযোগ উপস্থাপন করে তবে চ্যালেঞ্জগুলিও রয়েছে:- প্রচুর পরিমাণে ডেটা প্রক্রিয়াকরণের নতুন পদ্ধতিগুলির প্রয়োজন।
- ক্যাপচার করা তথ্যটি একটি অরক্ষিত বিন্যাসে রয়েছে।
এর পরে, তাদের বিন্যাসে থাকা কাঠামোগত ডেটা বা ডেটা মোকাবেলা করতে হয়েছিল যে স্ট্যান্ডার্ড রিলেশনাল ডাটাবেস সিস্টেমগুলি পরিচালনা করতে অক্ষম। কাটিং এবং ক্যাফেরেলা হ্যাডোপকে যে কোনও ধরণের ডেটার সাথে কাজ করার জন্য ডিজাইন করেছিলেন: কাঠামোগত, কাঠামোগত, চিত্রযুক্ত, অডিও ফাইল, এমনকি। এই ক্লৌডেরা (হ্যাডোপ ইন্টিগ্রেটার) শ্বেত কাগজটি কেন এটি গুরুত্বপূর্ণ তা ব্যাখ্যা করে:
- "আপনার সমস্ত ডেটা ব্যবহারযোগ্য করে তোলার মাধ্যমে, কেবলমাত্র আপনার ডাটাবেসে যা আছে তা নয়, হাদুপ আপনাকে গোপনীয় সম্পর্কগুলি উন্মোচন করতে দেয় এবং উত্তরগুলি প্রকাশ করে যা সর্বদা পৌঁছানোর বাইরে থাকে। আপনি হার্ড ডেটার উপর ভিত্তি করে আরও সিদ্ধান্ত নেওয়া শুরু করতে পারেন, শিকারের পরিবর্তে, এবং চেহারা সম্পূর্ণ ডেটা সেটগুলিতে, কেবল নমুনা এবং সারাংশ নয় ""
পড়াতে স্কিমা কী?
যেমনটি আগেই উল্লেখ করা হয়েছিল, হ্যাডোপের অন্যতম সুবিধা হ'ল এটির কাঠামোগত ডেটা পরিচালনা করার ক্ষমতা। এক অর্থে, এটি "রাস্তার নিচে লাথি মারছে"। শেষ পর্যন্ত তথ্য বিশ্লেষণের জন্য কোনও ধরণের কাঠামোর প্রয়োজন।সেই কারণেই পঠন সংক্রান্ত স্কিমা কার্যকর হয়। পঠিত স্কিমা হ'ল ডেটাটি কোন ফর্ম্যাটটিতে রয়েছে, কোথায় ডেটা সন্ধান করবেন (মনে রাখবেন ডেটাটি বেশ কয়েকটি সার্ভারের মধ্যে ছড়িয়ে ছিটিয়ে রয়েছে) এবং ডেটাতে কী করা উচিত - এটি কোনও সাধারণ কাজ নয়। বলা হয়ে থাকে যে হ্যাডোপ সিস্টেমে ডেটা ম্যানিপুলেট করার জন্য ব্যবসায় বিশ্লেষক, একজন পরিসংখ্যানবিদ এবং জাভা প্রোগ্রামারের দক্ষতা প্রয়োজন। দুর্ভাগ্যক্রমে, এই যোগ্যতাগুলির অনেক লোক নেই।
মধু কি?
হ্যাডোপ যদি সফল হতে থাকে তবে ডেটা সহ কাজ করা সহজ করতে হবে। সুতরাং, মুক্ত-উত্সব ভিড় কাজ করতে পেরে এবং মাতালকে তৈরি করেছে:- "এইচআইভি এই ডেটাতে কাঠামো প্রজেক্ট করার জন্য এবং এইচআইকিউএল নামে একটি এসকিউএল-জাতীয় ভাষা ব্যবহার করে ডেটাটিকে জিজ্ঞাসা করার একটি প্রক্রিয়া সরবরাহ করে the একই সময়ে এই ভাষাটি অসুবিধাগ্রস্থ হলে বা প্রথাগত মানচিত্র / হ্রাসকারী প্রোগ্রামারগুলিকে তাদের কাস্টম ম্যাপারগুলি এবং হ্রাসকারীগুলিতে প্লাগ করতে দেয় traditional এই যুক্তিটি HiveQL এ প্রকাশ করতে অক্ষম। "
এইচআইভি উভয় বিশ্বের সেরাকে সক্ষম করে: এসকিউএল কমান্ডগুলির সাথে পরিচিত ডাটাবেস কর্মীরা ডেটা ম্যানিপুলেট করতে পারে এবং পড়ার প্রক্রিয়াতে স্কিমার সাথে পরিচিত বিকাশকারীরা এখনও কাস্টমাইজড কোয়েরি তৈরি করতে সক্ষম।
হাদোপ কোন ধরণের ডেটা বিশ্লেষণ করে?
ওয়েব অ্যানালিটিক্স হ'ল প্রথম জিনিস যা মনে আসে, ওয়েবসাইটগুলি অপ্টিমাইজ করার জন্য ওয়েব লগ এবং ওয়েব ট্র্যাফিক বিশ্লেষণ করে। উদাহরণস্বরূপ, ওয়েব অ্যানালিটিক্সের মধ্যে অবশ্যই হ্যাডোপ ব্যবহার করে সংস্থাটির জমা হওয়া ডেটা টেরাবাইটের সারণি করা যায়।সংস্থাগুলি ঝুঁকি বিশ্লেষণ, জালিয়াতি সনাক্তকরণ এবং গ্রাহক-বেস বিভাজন সম্পাদনের জন্য হডোপ ক্লাস্টার ব্যবহার করে। ইউটিলিটি সংস্থাগুলি তাদের বৈদ্যুতিক গ্রিড থেকে সেন্সর ডেটা বিশ্লেষণ করতে হাদোপ ব্যবহার করে, যাতে তাদের বিদ্যুতের উত্পাদন অনুকূলিত করে তোলে। টার্গেট, 3 এম এবং মেডট্রনিক্সের মতো একটি বড় সংস্থাগুলি পণ্য বিতরণ, ব্যবসায়ের ঝুঁকি মূল্যায়ন এবং গ্রাহক-বেস বিভাগকে অনুকূলকরণের জন্য হাদুপ ব্যবহার করে।
বিশ্ববিদ্যালয়গুলি হ্যাডোপেও বিনিয়োগ করা হয়। সফ্টওয়্যার সেন্ট টমাস গ্র্যাজুয়েট প্রোগ্রামস বিশ্ববিদ্যালয়ের একজন সহযোগী অধ্যাপক ব্র্যাড রুবিন উল্লেখ করেছিলেন যে তাঁর হ্যাডোপ দক্ষতা বিশ্ববিদ্যালয়ের গবেষণা দলগুলি দ্বারা সংকলিত প্রচুর পরিমাণে তথ্য সংগ্রহ করতে সহায়তা করছে।
আপনি কি হাদোপের সত্যিকারের বিশ্বের উদাহরণ দিতে পারেন?
এর অন্যতম সুপরিচিত উদাহরণ হ'ল টাইমসম্যাচিন। নিউইয়র্ক টাইমস-এর পূর্ণ পৃষ্ঠা সংবাদপত্র টিআইএফএফ চিত্রগুলির সংযুক্ত রয়েছে, সম্পর্কিত মেটাডেটা এবং ১৯৫২ সাল থেকে ১৯২২ সাল পর্যন্ত টেরাবাইটের ডেটা পরিমাণের নিবন্ধ। ইসি 2 / এস 3 / হ্যাডোপ সিস্টেম এবং বিশেষায়িত কোড ব্যবহার করে এনওয়াইটির ডেরেক গটফ্রিড,:- "৪০৫,০০০ টি খুব বড় টিআইএফএফ চিত্র, এসজিএমএলে ৩.৩ মিলিয়ন নিবন্ধ এবং টিআইএফএফগুলিতে আয়তক্ষেত্রাকার অঞ্চলগুলিতে ম্যাপিং প্রবন্ধের ৪০৫,০০০ এক্সএমএল ফাইল। "
অ্যামাজন ওয়েব সার্ভিসেস ক্লাউডে সার্ভার ব্যবহার করে গটফ্রিড উল্লেখ করেছেন যে তারা টাইমসম্যাচিনের জন্য প্রয়োজনীয় সমস্ত ডেটা 36 ঘন্টারও কম সময়ে প্রক্রিয়া করতে সক্ষম হয়েছিল।
হাদুপ ইতিমধ্যে অপ্রচলিত বা কেবল মরফিং করছে?
হাদুপ এখন প্রায় এক দশক ধরে প্রায় হয়েছে। এটির অনেকগুলি এর অপ্রচলিত বক্তব্য রয়েছে। একজন বিশেষজ্ঞ ড। ডেভিড রিকো বলেছেন যে "আইটি পণ্যগুলি স্বল্পকালীন হয় dog কুকুরের বছরে গুগলসের পণ্যগুলি প্রায় 70০ হয় এবং হাদুপ ৫ 56 বছর বয়সী" "রিকো যা বলে তার কিছুটা সত্য হতে পারে। দেখা যাচ্ছে যে হাদোপ একটি বড় ব্যবস্থার মধ্য দিয়ে চলছে। এটি সম্পর্কে আরও জানতে, রুবিন আমাকে টুইন সিটিস হ্যাডোপ ইউজার গ্রুপের সভায় আমন্ত্রণ জানিয়েছিলেন, এবং আলোচনার বিষয়টি ছিল ইয়ার্নের পরিচিতি:
- "অ্যাপাচি হ্যাডোপ 2 এ একটি নতুন ম্যাপ্রেইডুস ইঞ্জিন অন্তর্ভুক্ত রয়েছে, এর আগের প্রয়োগের চেয়ে আরও অনেক সুবিধা রয়েছে যার মধ্যে আরও ভাল স্কেলিবিলিটি এবং রিসোর্স ব্যবহার রয়েছে Y নতুন বাস্তবায়নটি ইএআরএন নামক বিতরণ অ্যাপ্লিকেশনগুলি চালনার জন্য একটি সাধারণ রিসোর্স ম্যানেজমেন্ট সিস্টেমের উপর নির্মিত।"