হাদোপ সম্পর্কে 7 টি বিষয় জানুন

লেখক: Eugene Taylor
সৃষ্টির তারিখ: 8 আগস্ট 2021
আপডেটের তারিখ: 20 জুন 2024
Anonim
হাদোপ সম্পর্কে 7 টি বিষয় জানুন - প্রযুক্তি
হাদোপ সম্পর্কে 7 টি বিষয় জানুন - প্রযুক্তি

কন্টেন্ট


সূত্র: প্রেসারুয়া / ড্রিমসটাইম ডট কম

ছাড়াইয়া লত্তয়া:

হাদুপ এখন বছরের পর বছর ধরে ডেটা বিশ্লেষণে সহায়তা করে আসছে তবে এটি সম্পর্কে আপনি কিছু জানেন না এমন সম্ভবত আরও কিছু জিনিস রয়েছে।

হাদুপ কী? এটি হলুদ খেলনা হাতি। আপনি যা আশা করেছিলেন তা নয়? এটি সম্পর্কে: ডগ কাটিং - এই ওপেন-সোর্স সফ্টওয়্যার প্রকল্পের সহ-স্রষ্টা - তার ছেলের কাছ থেকে নাম ধার করেছিলেন যিনি তার খেলনা হাতি হাদুপকে ডাকেন। সংক্ষেপে, হ্যাডোপ একটি সফ্টওয়্যার কাঠামো যা অ্যাপাচি সফ্টওয়্যার ফাউন্ডেশন ডেটা-ইনটেনসিভ, ডিস্ট্রিবিউটেড কম্পিউটিং ডেভেলপ করতে ব্যবহৃত হয় by এবং এটি অন্য একটি বাজওয়ার্ড পাঠকদের একটি মূল উপাদান: যথেষ্ট পরিমাণে পাওয়া যায় না বলে মনে হয় না। এই অনন্য, অবাধে লাইসেন্সযুক্ত সফ্টওয়্যার সম্পর্কে আপনার সাতটি বিষয় জানা উচিত।

হাদুপ এর শুরুটা কীভাবে করলেন?

বারো বছর আগে, গুগল বিপুল পরিমাণে ডেটা সংগ্রহ করে তা পরিচালনা করতে একটি প্ল্যাটফর্ম তৈরি করেছিল। সংস্থাটি প্রায়শই এটি করে, গুগল তার নকশাটি দুটি কাগজপত্রের আকারে জনসাধারণের কাছে উপলভ্য করেছে: গুগল ফাইল সিস্টেম এবং মানচিত্রে uce

একই সময়ে, ডগ কাটিং এবং মাইক কাফেরেলা একটি নতুন সার্চ ইঞ্জিন নাচতে কাজ করছিলেন। দু'জন কীভাবে বিপুল পরিমাণে ডেটা পরিচালনা করবেন তা নিয়ে লড়াই করে যাচ্ছিলেন। তারপরে এই দুই গবেষক গুগলের কাগজপত্রগুলি পেয়েছিলেন। ভাগ্যবান ছেদটি কাটিং এবং ক্যাফেরেলা কে একটি আরও ভাল ফাইল সিস্টেম এবং ডেটা ট্র্যাক রাখার উপায়ের সাথে পরিচয় করিয়ে সবকিছু পরিবর্তন করেছিল এবং শেষ পর্যন্ত হ্যাডোপ তৈরির দিকে নিয়ে যায়।

হাদোপ সম্পর্কে এত গুরুত্বপূর্ণ কী?

আজ, ডেটা সংগ্রহ করা আগের চেয়ে সহজ। এই সমস্ত ডেটা থাকা অনেক সুযোগ উপস্থাপন করে তবে চ্যালেঞ্জগুলিও রয়েছে:

  • প্রচুর পরিমাণে ডেটা প্রক্রিয়াকরণের নতুন পদ্ধতিগুলির প্রয়োজন।
  • ক্যাপচার করা তথ্যটি একটি অরক্ষিত বিন্যাসে রয়েছে।
কাঠামোগত প্রচুর পরিমাণে কাঠামোহীন তথ্য ব্যবহারের চ্যালেঞ্জগুলি কাটিয়ে উঠার জন্য কাটিং এবং ক্যাফেরেলা একটি দ্বি-অংশ সমাধান নিয়ে এসেছিল। ডেটা-পরিমাণের সমস্যাটি সমাধান করার জন্য, হ্যাডোপ একটি বিতরণ করা পরিবেশ - পণ্য সার্ভারের একটি নেটওয়ার্ক - একটি সমান্তরাল প্রক্রিয়াকরণ ক্লাস্টার তৈরি করে, যা নির্ধারিত টাস্কটি বহন করার জন্য আরও প্রসেসিং শক্তি নিয়ে আসে।

এর পরে, তাদের বিন্যাসে থাকা কাঠামোগত ডেটা বা ডেটা মোকাবেলা করতে হয়েছিল যে স্ট্যান্ডার্ড রিলেশনাল ডাটাবেস সিস্টেমগুলি পরিচালনা করতে অক্ষম। কাটিং এবং ক্যাফেরেলা হ্যাডোপকে যে কোনও ধরণের ডেটার সাথে কাজ করার জন্য ডিজাইন করেছিলেন: কাঠামোগত, কাঠামোগত, চিত্রযুক্ত, অডিও ফাইল, এমনকি। এই ক্লৌডেরা (হ্যাডোপ ইন্টিগ্রেটার) শ্বেত কাগজটি কেন এটি গুরুত্বপূর্ণ তা ব্যাখ্যা করে:

    "আপনার সমস্ত ডেটা ব্যবহারযোগ্য করে তোলার মাধ্যমে, কেবলমাত্র আপনার ডাটাবেসে যা আছে তা নয়, হাদুপ আপনাকে গোপনীয় সম্পর্কগুলি উন্মোচন করতে দেয় এবং উত্তরগুলি প্রকাশ করে যা সর্বদা পৌঁছানোর বাইরে থাকে। আপনি হার্ড ডেটার উপর ভিত্তি করে আরও সিদ্ধান্ত নেওয়া শুরু করতে পারেন, শিকারের পরিবর্তে, এবং চেহারা সম্পূর্ণ ডেটা সেটগুলিতে, কেবল নমুনা এবং সারাংশ নয় ""

পড়াতে স্কিমা কী?

যেমনটি আগেই উল্লেখ করা হয়েছিল, হ্যাডোপের অন্যতম সুবিধা হ'ল এটির কাঠামোগত ডেটা পরিচালনা করার ক্ষমতা। এক অর্থে, এটি "রাস্তার নিচে লাথি মারছে"। শেষ পর্যন্ত তথ্য বিশ্লেষণের জন্য কোনও ধরণের কাঠামোর প্রয়োজন।

সেই কারণেই পঠন সংক্রান্ত স্কিমা কার্যকর হয়। পঠিত স্কিমা হ'ল ডেটাটি কোন ফর্ম্যাটটিতে রয়েছে, কোথায় ডেটা সন্ধান করবেন (মনে রাখবেন ডেটাটি বেশ কয়েকটি সার্ভারের মধ্যে ছড়িয়ে ছিটিয়ে রয়েছে) এবং ডেটাতে কী করা উচিত - এটি কোনও সাধারণ কাজ নয়। বলা হয়ে থাকে যে হ্যাডোপ সিস্টেমে ডেটা ম্যানিপুলেট করার জন্য ব্যবসায় বিশ্লেষক, একজন পরিসংখ্যানবিদ এবং জাভা প্রোগ্রামারের দক্ষতা প্রয়োজন। দুর্ভাগ্যক্রমে, এই যোগ্যতাগুলির অনেক লোক নেই।

মধু কি?

হ্যাডোপ যদি সফল হতে থাকে তবে ডেটা সহ কাজ করা সহজ করতে হবে। সুতরাং, মুক্ত-উত্সব ভিড় কাজ করতে পেরে এবং মাতালকে তৈরি করেছে:

    "এইচআইভি এই ডেটাতে কাঠামো প্রজেক্ট করার জন্য এবং এইচআইকিউএল নামে একটি এসকিউএল-জাতীয় ভাষা ব্যবহার করে ডেটাটিকে জিজ্ঞাসা করার একটি প্রক্রিয়া সরবরাহ করে the একই সময়ে এই ভাষাটি অসুবিধাগ্রস্থ হলে বা প্রথাগত মানচিত্র / হ্রাসকারী প্রোগ্রামারগুলিকে তাদের কাস্টম ম্যাপারগুলি এবং হ্রাসকারীগুলিতে প্লাগ করতে দেয় traditional এই যুক্তিটি HiveQL এ প্রকাশ করতে অক্ষম। "

এইচআইভি উভয় বিশ্বের সেরাকে সক্ষম করে: এসকিউএল কমান্ডগুলির সাথে পরিচিত ডাটাবেস কর্মীরা ডেটা ম্যানিপুলেট করতে পারে এবং পড়ার প্রক্রিয়াতে স্কিমার সাথে পরিচিত বিকাশকারীরা এখনও কাস্টমাইজড কোয়েরি তৈরি করতে সক্ষম।

হাদোপ কোন ধরণের ডেটা বিশ্লেষণ করে?

ওয়েব অ্যানালিটিক্স হ'ল প্রথম জিনিস যা মনে আসে, ওয়েবসাইটগুলি অপ্টিমাইজ করার জন্য ওয়েব লগ এবং ওয়েব ট্র্যাফিক বিশ্লেষণ করে। উদাহরণস্বরূপ, ওয়েব অ্যানালিটিক্সের মধ্যে অবশ্যই হ্যাডোপ ব্যবহার করে সংস্থাটির জমা হওয়া ডেটা টেরাবাইটের সারণি করা যায়।

সংস্থাগুলি ঝুঁকি বিশ্লেষণ, জালিয়াতি সনাক্তকরণ এবং গ্রাহক-বেস বিভাজন সম্পাদনের জন্য হডোপ ক্লাস্টার ব্যবহার করে। ইউটিলিটি সংস্থাগুলি তাদের বৈদ্যুতিক গ্রিড থেকে সেন্সর ডেটা বিশ্লেষণ করতে হাদোপ ব্যবহার করে, যাতে তাদের বিদ্যুতের উত্পাদন অনুকূলিত করে তোলে। টার্গেট, 3 এম এবং মেডট্রনিক্সের মতো একটি বড় সংস্থাগুলি পণ্য বিতরণ, ব্যবসায়ের ঝুঁকি মূল্যায়ন এবং গ্রাহক-বেস বিভাগকে অনুকূলকরণের জন্য হাদুপ ব্যবহার করে।

বিশ্ববিদ্যালয়গুলি হ্যাডোপেও বিনিয়োগ করা হয়। সফ্টওয়্যার সেন্ট টমাস গ্র্যাজুয়েট প্রোগ্রামস বিশ্ববিদ্যালয়ের একজন সহযোগী অধ্যাপক ব্র্যাড রুবিন উল্লেখ করেছিলেন যে তাঁর হ্যাডোপ দক্ষতা বিশ্ববিদ্যালয়ের গবেষণা দলগুলি দ্বারা সংকলিত প্রচুর পরিমাণে তথ্য সংগ্রহ করতে সহায়তা করছে।

আপনি কি হাদোপের সত্যিকারের বিশ্বের উদাহরণ দিতে পারেন?

এর অন্যতম সুপরিচিত উদাহরণ হ'ল টাইমসম্যাচিন। নিউইয়র্ক টাইমস-এর পূর্ণ পৃষ্ঠা সংবাদপত্র টিআইএফএফ চিত্রগুলির সংযুক্ত রয়েছে, সম্পর্কিত মেটাডেটা এবং ১৯৫২ সাল থেকে ১৯২২ সাল পর্যন্ত টেরাবাইটের ডেটা পরিমাণের নিবন্ধ। ইসি 2 / এস 3 / হ্যাডোপ সিস্টেম এবং বিশেষায়িত কোড ব্যবহার করে এনওয়াইটির ডেরেক গটফ্রিড,:

    "৪০৫,০০০ টি খুব বড় টিআইএফএফ চিত্র, এসজিএমএলে ৩.৩ মিলিয়ন নিবন্ধ এবং টিআইএফএফগুলিতে আয়তক্ষেত্রাকার অঞ্চলগুলিতে ম্যাপিং প্রবন্ধের ৪০৫,০০০ এক্সএমএল ফাইল। "

অ্যামাজন ওয়েব সার্ভিসেস ক্লাউডে সার্ভার ব্যবহার করে গটফ্রিড উল্লেখ করেছেন যে তারা টাইমসম্যাচিনের জন্য প্রয়োজনীয় সমস্ত ডেটা 36 ঘন্টারও কম সময়ে প্রক্রিয়া করতে সক্ষম হয়েছিল।

হাদুপ ইতিমধ্যে অপ্রচলিত বা কেবল মরফিং করছে?

হাদুপ এখন প্রায় এক দশক ধরে প্রায় হয়েছে। এটির অনেকগুলি এর অপ্রচলিত বক্তব্য রয়েছে। একজন বিশেষজ্ঞ ড। ডেভিড রিকো বলেছেন যে "আইটি পণ্যগুলি স্বল্পকালীন হয় dog কুকুরের বছরে গুগলসের পণ্যগুলি প্রায় 70০ হয় এবং হাদুপ ৫ 56 বছর বয়সী" "

রিকো যা বলে তার কিছুটা সত্য হতে পারে। দেখা যাচ্ছে যে হাদোপ একটি বড় ব্যবস্থার মধ্য দিয়ে চলছে। এটি সম্পর্কে আরও জানতে, রুবিন আমাকে টুইন সিটিস হ্যাডোপ ইউজার গ্রুপের সভায় আমন্ত্রণ জানিয়েছিলেন, এবং আলোচনার বিষয়টি ছিল ইয়ার্নের পরিচিতি:

    "অ্যাপাচি হ্যাডোপ 2 এ একটি নতুন ম্যাপ্রেইডুস ইঞ্জিন অন্তর্ভুক্ত রয়েছে, এর আগের প্রয়োগের চেয়ে আরও অনেক সুবিধা রয়েছে যার মধ্যে আরও ভাল স্কেলিবিলিটি এবং রিসোর্স ব্যবহার রয়েছে Y নতুন বাস্তবায়নটি ইএআরএন নামক বিতরণ অ্যাপ্লিকেশনগুলি চালনার জন্য একটি সাধারণ রিসোর্স ম্যানেজমেন্ট সিস্টেমের উপর নির্মিত।"
হ্যাডোপ ডাটাবেস এবং কন্টেন্ট ম্যানেজমেন্ট চেনাশোনাগুলিতে প্রচুর গুঞ্জন পায় তবে এর চারপাশে এখনও অনেক প্রশ্ন রয়েছে এবং কীভাবে এটি সর্বোত্তমভাবে ব্যবহার করা যায় can এই মাত্র কয়েক। আপনার যদি আরও থাকে তবে সেগুলি আমাদের উপায়। ভাল টেকোপিডিয়া ডটকমের সেরা উত্তর দিন।