یادگیری ماشین(Machine Learning) زیر مجوعهای از هوش مصنوعی است که متمرکز بر ساخت مدلهای الگوریتمی است که میتوانند الگوها و روابط دادهها را شناسایی کنند.
در کلمه Machine Learning کلمه Machine به معنی کارهای رایانه است و کلمه Learning معادلی برای تکامل الگوریتمها و افزایش دقت آنها با استفاده از دادههای بیشتر است.
این مفهوم چیز جدیدی نیست؛ ولی بکاربردن آن در تجارت تا زمانی که اینترنت، محاسبات ابری و تجزیه و تحلیل دادههای بزرگ به پیشرفت کنونی نمیرسیدند، ممکن نبود، چرا که آموزش الگوریتمهای ML برای اینکه بتوانند الگویی از دادهها بسازند نیاز به مجموعه بسیار بزرگی از دادهها دارد.
امروزه، یادگیری ماشین نقش مهمی در طیف گستردهای از کسب و کارهایی را ایفا میکند که بر تجزیه و تحلیل پیشبینیکننده متکی هستند.
معمولاً چنین پروژههای تحت نظارت مهندسان داده و متخصصان یادگیری ماشین انجام میشود.
کار مهندسان داده در این زمینه ساخت فرضیهها و کدنویسی به نحوی است که فرضیهها را به واقعیت تبدیل کنند.
کار متخصصان یادگیری ماشین
تمرکز متخصصان این عرصه بر روی عملیات گوناگون است. چنین عملیاتی برای مدیریت چرخهعمر یک مدل از یادگیری ماشین بکار میرود، این چرخه نیز شامل آموزش، تنظیم، استفاده روزمره در محیط تولید و در نهایت بازنشستگی است.
به همین دلیل مهندسان ML باید دانش کاری در زمینه مدلسازی داده، مهندسی ویژگیها و برنامهنویسی را داشته باشند.
مدل یادگیری ماشین چیست؟
مدل یادگیری ماشین به طور ساده خروجیای است که پس از اجرای الگوریتمهای ML بر روی دادهها تولید میشود.
برای تولید مدل یادگیری ماشین باید قدمهای زیر را طی کنیم:
- جمعآوری دادههای آموزشی
- آماده کردن دادهها برای آموزش
- انتخاب الگوریتم یادگیری مناسب
- آموزش الگوریتم یادگیری
- ارزیابی خروجیهای الگوریتم یادگیری
- تغییر متغییرهای آموزش در صورت نیاز برای تولید خروجی بهتر
نحوه آموزش در یادگیری ماشین
در تنظیم متداول ML، الگوریتم نیاز به مجموعه دادهای از نمونههایی دارد که که هر کدام از نمونهها دارای یک ورودی و خروجی باشد.
سه مدل اصلی برای الگوریتمهای ML وجود دارد که مهندسان می توانند از آنها استفاده کنند:
یادگیری تحت نظارت: الگوریتم، دادههای آموزشی برچسبگذاری شده را به عنوان ورودی دریافت میکند و پاسخ صحیح را به عنوان خروجی نمایش میدهد.
یادگیری بدون نظارت: ورودیها در این روش دادههایی بدون برچسب هستند و بجای اینکه خروجی صحیحی نمایش داده شود، از این الگوریتم یادگیری برای ایجاد الگوهایی استفاده میشود که بعداً برای شناسایی دادههایی با رفتار یکسان بکار میروند.
در برخی از شرایط نیز ضرورری است تا از مقدار کمی داده برچسبگذاری شده در کنار مقدار زیادی از دادههای بدون برچسب برای آموزش استفاده نمود. این مدل معمولا بین مهندسان ML به عنوان نیمه تحت نظر شناخته میشود.
یادگیری تقویتی: در ورودی این الگوریتم بجای دادههای آموزشی سیگنال پاداش ارسال میشود و به دنبال الگوهایی در دادهها میگردد که پاداش را دریافت میکنند. این مدل اغلب از تعامل الگوریتمهای یادگیری با محیطهای فیزیکی و دیجیتالی ساخته میشود.
چه چیزی در یادگیری ماشین باعث جهتگیری (Bias) میشود؟
تمایل مردم به AI و به ویژه ML به دلیل وضوح و شفافیتی که دارند روزانه در حال افزایش است؛ اما شفافیت الگوریتمی، برای یادگیری ماشین میتواند بسیار پیچیدهتر از به اشتراک گذاشتن الگوریتمی باشد که برای یک پیشبینی خاص استفاده میشود.
بسیاری از افرادی که وارد دنیای ML میشوند با فهمیدن اینکه این الگوریتمهای ریاضی، مخفی نیستند شگفتزده میشوند. در واقع بسیاری از الگوریتمهای محبوبی که امروزه استفاده میشوند برای همه افراد در دسترس است و این دادههای آموزشی هستند که مهمند نه الگوریتمهای مورد استفاده.
متاسفانه به این دلیل که انسان دادههای مورد استفاده برای آموزش الگوریتمهای یادگیری را فراهم میکند این دادهها میتوانند به صورت ناخواسته باعث جهتگیری مدل یادگیری ماشین شوند.
برای مهندسان ML، درک منطقی که پشت یک پیشبینی خاص نهفته است کار دشواری است؛ چرا که الگوریتمهای یادگیری به صورت طبیعی تکرار میشوند.
وقتی یک مهندس داده یا مهندس ML بتواند چگونگی ایجاد یک پیشبینی خاص را شرح دهد، آن مدل یادگیری ماشین را میتوان به عنوان هوش مصنوعی قابل توضیح شناخت.
وقتی نتوان توضیح داد که یک پیشبینی خاص چگونه به وجود آمده است؛ چه به خاطر پیچیدگی ریاضی آن باشد و چه به خاطر استفاده از دادههای آموزشی اختصاصی، آن مدل یادگیری ماشین را هوش مصنوعی جعبه سیاه میگویند.
ML و AI
دو اصطلاح هوش مصنوعی و یادگیری ماشین گاهی اوقات به عنوان مترادف مورد استفاده قرار میگیرند چرا که در حال حاضر، بیشتر ابتکارهای مربوط به هوش مصنوعی محدود هستند و این به آن خاطر است که امروزه هوش مصنوعیای برای انجام یک کار معمولاً بر یادگیری ماشین تحت نظارت متکی است.
در مقابل هدف یک AI قوی این است که بگذارد رایانهها کارهایی را که انسانها انجام میدهند با موفقیت و درست انجام دهند.
بدون دیدگاه