راه ترقی

آخرين مطالب

بینایی ماشین چیست؟ اقتصاد

بینایی ماشین چیست؟
  بزرگنمايي:

راه ترقی - بینایی ماشین همان‌طور که از نامش پیداست قابلیتی است که به‌واسطه‌ی آن، کامپیوتر قادر به تحلیل و پردازش محیط اطراف خود است.

به‌گفته‌ی پاول گراهام دانشمند کامپیوتر، کارآفرین و سرمایه‌گذاری اقتصادی: همان‌طور که حرف می‌زنی، بنویس. با درنظرگرفتن این نقل‌قول می‌توان به تعریف بینایی ماشین پرداخت. در این مقاله فرض می‌شود مخاطب چیزی در این مورد نمی‌داند. TechCrunch باتوجه‌به این مسئله این تعریف را ارائه می‌کند: شخصی در اتاق یک توپ را به سمت شما پرتاب می‌کند و شما آن را می‌گیرید. ساده است، نه؟ اما این فرایند یکی از پیچیده‌ترین فرآیندهایی است که برای درک آن تلاش می‌کنیم. و حالا یک نگاه فوری به ویکیپدیا بیندازید: بینایی ماشین یک زمینه‌ی میان‌رشته‌ای است که با نحوه‌ی ساخت کامپیوترها برای دستیابی به درک سطح‌ بالایی از تصاویر دیجیتالی یا ویدئوها سروکار دارد. بینایی ماشین دقیقا همان‌طور است که به نظر می‌رسد (کامپیوتر یا ماشین اشیا را می‌بینند) و تفاوت‌های اندکی با زمینه‌های مرتبط خود دارد. براساس ویکی‌پدیا، بینایی ماشین عبارت است از: باز کردن اطلاعات سمبلیک داده‌های تصویری با استفاده از مدل‌هایی که به کمک هندسه، فیزیک، آمار و نظریه‌ی یادگیری ساخته شده‌اند. تاریخچه‌ی پرماجرا و طولانی بینایی ماشین
درست در زمان مرگ والت دیزنی و تولد مخترع ویکیپدیا، مردم در تلاش بودند نعمت بینایی را به کامپیوتر هدیه کنند. متن زیر برنامه‌ریزی برای ساخت یک سیستم بصری را نشان می‌دهد. براساس این متن ساخت هر بخش از این سیستم بر عهده‌ی گروه‌های مختلف است و این پروژه به یک نقطه‌ی شاخص در توسعه‌ی تشخیص الگو تبدیل می‌شود.


در این متن اشاره شده است که هدف اصلی این پروژه، ساخت سیستمی برای طبقه‌بندی اشیا و پس‌زمینه در یک تصویر است. پیشرفت‌های قرن بیست‌ویک در زمینه‌ی محاسبات، ریاضی و زمینه‌های مرتبط، زمینه‌ای را برای این پیشرفت‌ها فراهم کرده است. پردازش تصویر دیجیتال
بینایی ماشین به‌شدت به نمودارهای ون در پردازش تصویر دیجیتال وابسته است. وظایف زیر در حوزه‌ی پردازش تصویر دیجیتال قرار می‌گیرند: تشخیص الگو: خودتوصیف. پیدا کردن قوانین. استخراج ویژگی: تجزیه‌ی یک تصویر به ویژگی‌های مجزا طبقه‌بندی : آیا این دسته از یال‌ها یا اشکال مانند یک خودرو به نظر می‌رسند یا سگ؟ تحلیل سیگنال چندمقیاسی: روش‌های دیگر برای دیدن این تصویر چیست؟ نگاشت گرافیکی: چگونه می‌توان یک شیء سه‌بعدی را به‌صورت دوبعدی نمایش داد؟
روش‌هایی برای تجزیه‌ی یک شیء سه‌بعدی به دو بعد: عمل پردازش تصویر تشخیص الگوی وابسته به الگوریتم، امکان یافتن خودکار نقاط کلیدی یک تصویر مانند گوشه‌ها و یال‌ها را فراهم می‌کند. با مقایسه‌ی موقعیت‌ تقریبی نقاط بین فریم‌های ویدئوی برای مثال می‌توانید جابه‌جایی محور X و Y را خنثی کنید و لرزش را از بین ببرید. همچنین می‌توانید این کار را به‌سادگی در پایتون با کد متن‌باز انجام دهید. شاید بتوان گفت، تحلیل سیگنال چندمقیاسی یکی از سنگین‌ترین عملیات پردازش تصویر باشد، اما در سطح بالا، همان‌طور که از نام آن پیداست به‌معنی تحلیل سیگنال روی مقیاس‌های متعدد یا از زاویه‌های مختلف است. فتوشاپ در ابزار shaprening خود از تحلیل چندمقیاسی استفاده می‌کند.
گاهی اوقات برای افزایش شفافیت یک تصویر، در ابتدا آن را بلور می‌کنند تا لبه‌های تصویر آشکار شود یک روش جالب برای تجزیه‌ی یک تصویر به‌دست‌آوردن مشتق آن است. این روش به یافتن لبه‌های تصویر و درنتیجه تفکیک بخش‌های تصویر به اشیای مجزا کمک می‌کند. با این روش می‌توان برچسب‌هایی مثل سگ، انسان، پلنگ، توپ ورزشی و ... را به اشیا تخصیص داد. این فرایند اغلب روی مقیاس‌های مختلف انجام می‌شود.
درخشش در سطح پیکسلی. تصاویر مانند آرایه‌های numpy (افزونه‌ی برنامه‌نویسی پایتون) به نظر می‌رسند. تصویر بالا، تصویر آبراهام لینکلن است. رزولوشن پائین آن به‌اندازه‌‌ای است که بتوان پیکسل‌های مستقل را دید. ازآنجاکه کار در طیف خاکستری یا grayscale هشت بیتی اجرا شده است، اعداد هر واحد، درخشش پیکسلی را روی طیف 0 تا 255 نمایش می‌دهند. با به‌دست‌آوردن مشتق گسسته‌ی هر پیکسل در راستای محور x می‌توان آن پیکسل را با پیکسل‌های چپ و راست خود مقایسه کرد، نتیجه‌ی این مقایسه تخمین نسبت تغییر لحظه‌ای بین مقادیر درخشندگی (brightness) است. می‌توانید مشتق گسسته‌ی همان پیکسل را هم در راستای محور y به دست آورید (ستون آن) و سپس با ترکیب این دو بخش، وجود پیکسل روی لبه‌ها را بررسی کنید.
تصور کنید، x موقعیت پیکسلی را در سطر گسسته‌ای از پیکسل‌ها نمایش می‌دهد و y مقدار درخشندگی آن است. نمی‌توانید مشتق آن را از گراف میله‌ای به دست آورید، بلکه می‌توانید آن را از منحنی بهترین تناسب تخمین بزنید. تغییر نسبت لحظه‌ای لبه‌ها بین مقادیر رنگ و درخشندگی معمولا بیشتر است. برای مثال لبه‌ی ریش آبه کنتراست بالایی دارد. در فیلم ذیل یک پیش‌نمایش از آخرین فناوری آشکارسازی شیء ارائه شده است که بسیاری از این روش‌ها را ترکیب می‌کند.


الگوریتم کشف شیء YOLOv3 ژوزف ردمون و همکاران. بینایی ماشین در مقابل بینایی ماشین
حالا این سؤال مطرح می‌شود که چه عاملی بینایی ماشین را از پردازش تصویر دیجیتالی متمایز می‌کند؟ هم‌پوشانی‌های زیادی بین این دو وجود دارد اما بینایی ماشین معمولا گسترده‌تر است: بینایی ماشین به ورودی‌هایی مثل فرضیه‌ها نیاز دارد و هدف آن دستیابی به یک خروجی از تصمیم‌های قابل ردیابی است. برای درک این تفاوت، این مثال را در نظر بگیرید: فرض کنید یک ربات ساده مجهز به چتر نجات و دوربین را از هواپیما پرتاب کنید. اگر این ربات در حین سقوط تنها عمل پردازش تصویر دیجیتالی را انجام دهد، صرفا می‌تواند ورودی دوربین خود را برای شناسایی سوژه‌های زیر خود مثل زمین و دریا تحلیل کند اما از ماهیت زمین یا دریا آگاه نیست یا نمی‌داند چه وظیفه‌ای را در مورد آن‌ها انجام دهد. با بینایی ماشین، می‌توان پیش‌فرض‌هایی را به ربات داد برای مثال: « آب و گدازه‌های داغ محل بدی برای فرود هستند » یا « آب و گدازه‌ی داغ چه ویژگی‌هایی دارند ». در مرحله‌ی بعد ربات می‌تواند از پردازش تصویر دیجیتالی برای تحلیل ورودی‌های دوربین خود استفاده کند و نواحی اطراف از جمله زمین، دریا یا گدازه‌ی آتش‌فشانی داغ را دسته‌بندی کند و براساس فرضیه‌های قبلی برای محل فرود تصمیم‌گیری کند. این مثال یک نمونه از بینایی ماشین است که یک زیرمجموعه‌ی مهندسی از بینایی ماشین است. یک کاربرد واقع‌گرایانه‌تر از بینایی ماشین می‌تواند خودکارسازی یا تسریع وظایف بصری QC روی خط مونتاژ باشد. بنابراین می‌توان گفت بینایی ماشین بیشتر با عناصر علمی و نظری سروکار دارد (نه کمک به فرود ایمن ربات). از طرفی، بسیاری با این تعاریف مخالف هستند. بعضی می‌گویند هدف پردازش تصویر دیجیتال، صرفا تبدیل تصاویر است و بینایی ماشین هم صرفا کار تشخیص و تحلیل الگو را انجام می‌دهد. هنوز بر سر این تعاریف اختلاف وجود دارد. آینده: خوب یا بد
بینایی ماشین به پیشرفت‌های قابل‌توجهی رسیده است. در آینده سیستم‌هایی توسعه خواهند یافت که امکان درک مشاهدات و پاسخگویی متناسب را به کامپیوترها می‌دهند. سیستم‌های این‌چنینی در آینده به یک ضرورت برای عملکرد ایمن خودروهای اتوماتیک تبدیل می‌شوند. این سیستم‌ها به کاهش هزینه‌ها در پردازش تصویر پزشکی هم کمک می‌کنند. بینایی ماشین در اقدامات بشردوستانه هم خواهد درخشید؛ اما به‌طورکلی باید به یک نکته توجه کرد: افرادی که از استثمار، جنگ و دیگر اقدامات شرورانه سود می‌برند هم از این ابزار استفاده خواهند کرد. به نقل از گیزمودو : در منطقه‌ی مشهور پیکادیلی لندن یک صفحه‌ی نمایش ترسناک و بزرگ قرار دارد که می‌تواند وسایل نقلیه، سن و حتی احساسات افراد نزدیک به خود را شناسایی کند و با تبلیغات هدفمند به آن‌ها واکنش نشان دهد.
پیشرفت‌های یادگیری ماشین و پردازش تصویر دیجیتال در حال همگرا شدن هستند. شاید روزی برسد که برای مثال آچاری را به سمت یک ربات کارگر پرتاب کنید، آن ربات منظور شما را تشخیص دهد و آچار را بگیرد.

لینک کوتاه:
https://www.rahetaraghi.ir/Fa/News/55005/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

صادرات طلای سرخ به 400 تن می‌رسد

واردات گوشت گرم از آفریقا به کشور

جزئیات از سامانه جدید «خودنویس»

بالا و پایین سرخابی‌ها در بورس

پاسخ معاون وزیر کار در مورد دستمزد کارگران؛ افزایش 119 درصدی حقوق در 3 سال

اثرگذاری مثبت مرد پرتغالی 8 ساله سپاهان

تقلای باشگاه پرهوادار آلمانی برای زنده ماندن

حاضرم به خاطر اینتر هر کار خطرناکی انجام دهم

عراق، قرقیز و افغانستان در انتظار برد ازبک‌ها

مورینیو: به خاطر رم پیشنهاد پرتغال و عربستان را رد کردم

سپاهانی‌ها در انتظار نامه خوزستانی‌ها به سازمان لیگ

قانون امباپه چیست؛ خوش‌خدمتی یا فرصت‌طلبی!‏

عبادی‌پور: تیم ملی جای بچه‌بازی نیست!

شمارش معکوس؛ بهترین فوتبالیست جهان کیست

گل اول ویتنام به ازبکستان در جام ملت‌های 2024 فوتسال آسیا

سفارت ایران در فرانسه از پیگیری قضایی فرد حمله‌کننده چشم‌پوشی کرد

لیست 16 نفره انتخاباتی «شانا» منتشر می‌شود

سخنگوی وزارت خارجه: اتهامات آرژانتین علیه شهروندان ایرانی فاقد اعتبار است

دیدار دبیر شورای عالی امنیت ملی با دبیر کمیته سیاسی و حقوقی دفتر مرکزی حزب کمونیست چین

تصویری جدید از موشک‌های ایرانی بر فراز دیوار ندبه در قدس اشغالی

خانواده شهدا پرچمداران اصلی ایثار و شهادت هستند/ نسل امروز نیازمند آشنایی با شهدا

بخاطر دوتا کلیه چقدر خودشو برای ما میگیره!

فروش کمدی‌ها چهار برابر بقیه فیلم‌ها!

زنده شدن خاطرات یاسمن برای حامد

چندرغاز که دیگه چانه زدن نداره!

هجوم هواداران محمدرضا گلزار برای سلفی گرفتن با او!

سکانسی خنده دار از سریال «سه در چهار»

علیرضا قربانی و اجرای زیبای ترانه‌ی «عاشقانه نیست»

فرمانده فراجا: هیچ ماموریتی حساس‌تر از اجرای طرح نور وجود ندارد

آموزش هوش مصنوعی به دانش‌آموزان مناطق محروم

آمار مهاجرت به استان‌های شمالی کشور طی دو سال اخیر

تلسکوپ فضایی جیمز وب شواهدی از وجود حیات را کشف کرده است

صحبت های دلنشین دکتر کاکاوند در مورد قدرت

ده نمکی در دو اپیزود

چرا رئیسی به پاکستان سفر کرد؟

روشنگری از دلایل اجرای طرح نور؛ به زودی

عامل تحریم

صنعت خودرو، قربانی زیاده‌خواهی مسئولان و دلالان

تایلند 3 عراق 2، هفتمین صعود متوالی به جام جهانی

العین - یوکوهاما، آماده برای جنگ بر سر جام نقره‌ای

سرپرست استقلال خوزستان؛ فقط تمرکز و دیگر هیچ!

فینالیست آسیا را فغانی تعیین کرد!

مهره کلیدی نساجی با لباس شخصی

راز شادی بلینگامی جوان‌ترین عضو تیم ملی ایران

بازتاب گسترده سفر رئیس‌جمهور ایران به سریلانکا در رسانه‌های جهان

واکنش نماینده ایران به کشف گورهای دسته جمعی در خان‌یونس

به سطح قالتاقی انسان‌ها احترام بزارید

پخش یک سریال خارجی جدید از تلویزیون

شکایت صداوسیما از مهران مدیری به کجا رسید؟

وقتی رفتار بهمن هاشمی به بقیه هم سرایت میکنه!