শক্তিবৃদ্ধি শেখা

লেখক: Lewis Jackson
সৃষ্টির তারিখ: 11 মে 2021
আপডেটের তারিখ: 15 মে 2024
Anonim
প্রতিফলন এবং শেখার মাধ্যমে ব্যক্তিগত ক্ষমতায়ন | ডঃ ক্রেগ মের্টলার | TEDx লেকল্যান্ড ইউনিভার্সিটি
ভিডিও: প্রতিফলন এবং শেখার মাধ্যমে ব্যক্তিগত ক্ষমতায়ন | ডঃ ক্রেগ মের্টলার | TEDx লেকল্যান্ড ইউনিভার্সিটি

কন্টেন্ট

সংজ্ঞা - সংযুক্তি শিক্ষার অর্থ কী?

কৃত্রিম বুদ্ধিমত্তার অনুচ্ছেদে শক্তিবৃদ্ধি শেখা, এক ধরণের গতিশীল প্রোগ্রামিং যা পুরষ্কার এবং শাস্তির ব্যবস্থা ব্যবহার করে অ্যালগরিদমকে প্রশিক্ষণ দেয়।


একটি শক্তিবৃদ্ধি শেখার অ্যালগরিদম বা এজেন্ট তার পরিবেশের সাথে ইন্টারঅ্যাক্ট করে শেখে। এজেন্ট সঠিকভাবে সম্পাদন করে এবং ভুলভাবে সম্পাদনের জন্য জরিমানা প্রাপ্ত করে। এজেন্ট কোনও মানুষের হস্তক্ষেপ ছাড়াই তার পুরষ্কার সর্বাধিক করে এবং তার জরিমানা হ্রাস করে শিখায়।

মাইক্রোসফ্ট আজুর এবং মাইক্রোসফ্ট মেঘের একটি পরিচিতি | এই গাইড জুড়ে, আপনি ক্লাউড কম্পিউটিং সম্পর্কে কী শিখবেন এবং মাইক্রোসফ্ট অ্যাজুরে কীভাবে আপনাকে মেঘ থেকে আপনার ব্যবসা স্থানান্তর করতে এবং পরিচালনা করতে সহায়তা করতে পারে তা শিখতে পারবেন।

টেকোপিডিয়া রিইনফোর্সমেন্ট লার্নিংয়ের ব্যাখ্যা দেয়

শক্তিবৃদ্ধি শেখা মেশিন লার্নিংয়ের এমন একটি পদ্ধতির যা আচরণবাদী মনোবিজ্ঞান দ্বারা অনুপ্রাণিত হয়। এটি একটি শিশু কীভাবে একটি নতুন কার্য সম্পাদন করতে শেখে তার অনুরূপ। অ্যালগরিদমকে কোনও কার্য সম্পাদন কীভাবে করা যায় তা স্পষ্টভাবে বলা হয়নি, তবে সমস্যাটি নিজে থেকে কাজ করে বলে শক্তিশালীকরণ শিখন অন্যান্য মেশিন লার্নিং পদ্ধতির সাথে বিপরীত হয়।

একজন এজেন্ট হিসাবে, যা একটি স্ব-ড্রাইভিং গাড়ি বা দাবা বাজানো প্রোগ্রাম হতে পারে, তার পরিবেশের সাথে যোগাযোগ করে, কীভাবে এটি সম্পাদন করে তার উপর নির্ভর করে একটি পুরষ্কারের রাজ্য লাভ করে, যেমন নিরাপদে গন্তব্যে গাড়ি চালানো বা কোনও খেলা জিতে। বিপরীতে, এজেন্ট ভুলভাবে কাজ করার জন্য যেমন একটি রাস্তা ছেড়ে যাওয়া বা চেকমাটেড হওয়ার জন্য একটি জরিমানা পায়।


এজেন্ট সময়ের সাথে সাথে তার পুরষ্কারকে সর্বাধিক করে তোলার এবং গতিশীল প্রোগ্রামিং ব্যবহার করে এর জরিমানা হ্রাস করার সিদ্ধান্ত নেয়। কৃত্রিম বুদ্ধিমত্তার কাছে এই পদ্ধতির সুবিধা হ'ল এটি কোনও এআই প্রোগ্রামকে কোনও প্রোগ্রামার বানান ছাড়াই শিখতে দেয় যে কোনও এজেন্ট কীভাবে কাজটি সম্পাদন করবে।