ডিপ লার্নিং মডেলগুলির একটি ভ্রমণ

লেখক: Lewis Jackson
সৃষ্টির তারিখ: 11 মে 2021
আপডেটের তারিখ: 25 জুন 2024
Anonim
ডিপ লার্নিং মডেলগুলির একটি ভ্রমণ - প্রযুক্তি
ডিপ লার্নিং মডেলগুলির একটি ভ্রমণ - প্রযুক্তি

কন্টেন্ট


সূত্র: ক্রান 77 / ড্রিমসটাইম ডটকম

ছাড়াইয়া লত্তয়া:

গভীর শেখার মডেলগুলি কম্পিউটারগুলি খুব মজাদার এবং আকর্ষণীয় ফলাফল সহ তাদের নিজেরাই চিন্তা করতে শেখাচ্ছে।

আরও বেশি বেশি ডোমেন এবং শিল্পগুলিতে গভীর শেখার প্রয়োগ হচ্ছে। চালকবিহীন গাড়ি থেকে শুরু করে গো বাজানো, চিত্রের সংগীত জেনারেট করার জন্য, প্রতিদিন নতুন গভীর শেখার মডেল আসছে। এখানে আমরা বেশ কয়েকটি জনপ্রিয় গভীর শেখার মডেলগুলি দেখতে পাচ্ছি। বিজ্ঞানীরা এবং বিকাশকারীরা এই মডেলগুলি নিচ্ছেন এবং তাদেরকে নতুন এবং সৃজনশীল উপায়ে সংশোধন করছেন। আমরা আশা করি এই শোকেসটি আপনাকে কী সম্ভব তা দেখতে অনুপ্রেরণা জাগাতে পারে। (কৃত্রিম বুদ্ধিমত্তার অগ্রগতি সম্পর্কে জানতে, কম্পিউটারগুলি কী মানুষের মস্তিষ্ক অনুকরণ করতে সক্ষম হবে?)

নিউরাল স্টাইল

কেউ যখন সফ্টওয়্যার মানের সম্পর্কে চিন্তা করে না তখন আপনি আপনার প্রোগ্রামিং দক্ষতা উন্নত করতে পারবেন না।

নিউরাল কাহিনীকার


নিউরাল স্টোরিলেটার এমন একটি মডেল যা কোনও চিত্র দেওয়া হলে, চিত্র সম্পর্কে একটি রোম্যান্সের গল্প তৈরি করতে পারে। এটি একটি মজাদার খেলনা এবং তবুও আপনি ভবিষ্যতের কল্পনা করতে পারেন এবং এই সমস্ত কৃত্রিম বুদ্ধিমত্তার মডেলগুলি যে দিকে চলেছে সেদিকে লক্ষ্য রাখতে পারেন।

উপরের ফাংশনটি "স্টাইল-শিফটিং" অপারেশন যা মডেলকে উপন্যাস থেকে গল্পের স্টাইলে স্ট্যান্ডার্ড ইমেজ ক্যাপশন স্থানান্তর করতে দেয়। স্টাইল শিফটিংটি "আর্টিকাল স্টাইলের নিউরাল অ্যালগরিদম" দ্বারা অনুপ্রাণিত হয়েছিল।

উপাত্ত

এই মডেলটিতে ব্যবহৃত দুটি মূল উত্স রয়েছে। এমএসকো হ'ল মাইক্রোসফ্টের একটি ডেটাসেট যার প্রায় 300,000 চিত্র রয়েছে, প্রতিটি চিত্রের সাথে পাঁচটি ক্যাপশন রয়েছে। MSCOCO হ'ল একমাত্র তত্ত্বাবধান করা ডেটা, যার অর্থ এটি হ'ল একমাত্র ডেটা যেখানে মানুষের প্রবেশ করতে হবে এবং প্রতিটি চিত্রের জন্য স্পষ্টভাবে ক্যাপশন লিখতে হয়েছিল।

ফিড-ফরোয়ার্ড নিউরাল নেটওয়ার্কের অন্যতম প্রধান সীমাবদ্ধতা হ'ল এর কোনও স্মৃতি নেই। প্রতিটি পূর্বাভাস পূর্ববর্তী গণনা থেকে স্বতন্ত্র, যেন নেটওয়ার্কটি এখন পর্যন্ত করা প্রথম এবং একমাত্র পূর্বাভাস। তবে অনেকগুলি কাজের জন্য যেমন একটি বাক্য বা অনুচ্ছেদে অনুবাদ করার জন্য ইনপুটগুলিতে ক্রমবর্ধমান এবং স্বতঃস্ফূর্তভাবে সম্পর্কিত ডেটা থাকা উচিত। উদাহরণস্বরূপ, আশেপাশের শব্দগুলি সরবরাহ না করে একটি বাক্যে একটি শব্দের অনুধাবন করা কঠিন।


আরএনএনগুলি আলাদা কারণ তারা নিউরনের মধ্যে সংযোগের আরও একটি সেট যুক্ত করে। এই লিঙ্কগুলি একটি গোপন স্তরের নিউরনগুলি থেকে ক্রিয়াকলাপগুলি ক্রমের পরবর্তী ধাপে নিজের মধ্যে ফিরে যেতে অনুমতি দেয়। অন্য কথায়, প্রতিটি পদক্ষেপে, একটি লুকানো স্তর তার নীচের স্তর থেকে এবং ক্রমের পূর্ববর্তী পদক্ষেপ থেকে উভয়ই সক্রিয়করণ গ্রহণ করে। এই কাঠামোটি মূলত পুনরাবৃত্ত নিউরাল নেটওয়ার্ক মেমরি দেয়। সুতরাং অবজেক্ট সনাক্তকরণের কার্যের জন্য, কোনও আরএনএন তার পূর্ববর্তী কুকুরগুলির শ্রেণিবিন্যাসের উপর নির্ভর করে বর্তমান চিত্রটি কুকুর কিনা তা নির্ধারণ করতে সহায়তা করতে পারে।

চর-আরএনএন টেড

লুকানো স্তরের এই নমনীয় কাঠামোটি আরএনএনগুলিকে অক্ষর-স্তরের ভাষা মডেলগুলির জন্য খুব ভাল হতে দেয়। চর আরএনএন, মূলত আন্দ্রেজ কার্পাথির দ্বারা নির্মিত, এমন একটি মডেল যা একটি ফাইলকে ইনপুট হিসাবে নেয় এবং একটি আরএনএনকে প্রশিক্ষণের জন্য একটি অনুক্রমের সাথে পরবর্তী চরিত্রের পূর্বাভাস শিখতে প্রশিক্ষণ দেয়। আরএনএন অক্ষর দ্বারা অক্ষর তৈরি করতে পারে যা আসল প্রশিক্ষণের ডেটার মতো দেখাবে। বিভিন্ন টিইডি টকের লিপি ব্যবহার করে একটি ডেমো প্রশিক্ষণ দেওয়া হয়েছে। এক বা একাধিক কীওয়ার্ডকে মডেলটি ফিড করুন এবং এটি একটি টেড টকের ভয়েস / স্টাইলে কীওয়ার্ড (গুলি) সম্পর্কে একটি উত্তরণ তৈরি করবে।

উপসংহার

এই মডেলগুলি মেশিন বুদ্ধিমত্তায় নতুন অগ্রগতি দেখায় যা গভীর জ্ঞানের কারণে সম্ভব হয়েছে। গভীর শিক্ষণ দেখায় যে আমরা এমন সমস্যাগুলি সমাধান করতে পারি যা আমরা আগে কখনই সমাধান করতে পারি নি এবং আমরা এখনও সেই মালভূমিতে পৌঁছিনি। গভীর শেখার উদ্ভাবনের ফলে পরবর্তী কয়েক বছর ধরে চালকবিহীন গাড়িগুলির মতো আরও অনেক উত্তেজনাপূর্ণ জিনিস দেখার প্রত্যাশা করুন।