«انجام یکسری فرآیند بر روی عکس برای استخراج اطلاعات از آن»
این تعریفی است که میتوان از پردازش تصویر داشت گرچه در منابع مختلف تعاریف مختلفی از آن ذکر شده است.
عملا هر پیشامدی که در اطراف خود حس میکنیم، شکلی از عکس یا تصویر را بیان میکند. تحقیقات نشان میدهد 83 درصد از پردازشهای حسی از میان حواس پنجگانه، متعلق به حس بینایی است. پس بیایید پیش از پرداختن به فرایند پردازش تصویر ابتدا در مورد خودِ تصویر بیشتر بدانیم، اینکه در اصل تعریف تصویر چیست؛ چیزی که شاید بسیار ساده به نظر برسد!
تصویر چیست؟
به طور کلی، شکلی از داده برای نمایش یک چیز به صورت بَصَری است که در انسان از طریق حس بینایی و در کامپیوتر از طریق بینایی ماشین قابل دریافت، درک، و پردازش است.
از جنبهی فیزیکی، زمانی که پرتو های نور پس از بازتاب یا شکست، به یک حسگر بینایی مانند چشم یا سنسور برخورد میکنند، اطلاعاتی به صورت سیگنال دو بُعدی یا سه بُعدی دریافت میگردد. این اطلاعاتِ دریافتی در بخش شبکیه چشم انسان به صورت تصویری وارونه و کوچک شده قبضه میشود. طبیعیترین پردازش تصویری که میتوان از آن نام برد، پردازشی است که چشم موجودات زنده بر روی این تصویر اولیه انجام میدهد. چشم انسان با اِعمال مجموعهای از فیلترهای نوری یا عصبی، که فیلترهایی خطی هستند، و سپس عملیات نمونهبرداری، تصویر نهایی را تولید کرده و برای ما این امکان را فراهم میآورد که درک بهتری از پیرامون خود داشته باشیم.
تصاویر نیز مانند سایر سیگنالها میتوانند آنالوگ یا دیجیتال باشند. دیجیتال بودن به معنای گسسته بودن مقادیر و آنالوگ بودن به معنای پیوسته بودن آنهاست. به عنوان مثال، تصاویری که با چشمهایمان از پیرامون خود دریافت میکنیم، تصاویر آنالوگ و تصاویری که در یک کامپیوتر ذخیره میشوند، تصاویر دیجیتال هستند. امروزه با پیشرفت تکنولوژی، امکان ثبت، پردازش و استخراج اطلاعات به صورت دیجیتال و به گونهای سریع، آسان و مطمئن میسر شده است.
تصاویر دیجیتال دو بُعدی، دارای ارتفاع (h) و عرض (w) هستند که اگر به آنها به مثابهی بردارهای صفحه با مقادیری گسسته نگاه کنیم، میتوان به هر سلول از این صفحه مقدار خاصی نسبت داد. به هر کدام از این واحدهای تشکیل دهنده تصویر، پیکسل (pixel) میگویند.
هر پیکسل بسته به نوع عکس، رنگی یا خاکستری بودن آن و طیف مورد استفاده، میتواند مقادیر خاصی بگیرد. دو نمونه از مدلهای معروف نمایش رنگ را میتوانید در ذیل مشاهده کنید:
سیستم نمایشی Grayscale
در این طیف که طیف خاکستری نامیده میشود، هر پیکسل عدد صحیحی بین 0 تا 255 دارد (28 =256 عدد) که میتوان آنرا با 8 بیت نشان داد. عدد صفر، نشانگر تیرهترین (مشکی) و عدد 255، نشانگر روشنترین (سفید) مقدار است.
سیستم نمایشی RGB
در این طیف، هر پیکسل دارای سه کانال است. کانال R به رنگ قرمز، کانال G به رنگ سبز، و کانال B نیز به رنگ آبی اشاره دارد. هر کانال میتواند عدد صحیحی بین 0 تا 255 بگیرد که میتوان هر کدام را با 8 بیت نمایش داد.
سیستم نمایشی CMYK
این سیستم که بر پایهی طیف CMY کار میکند، یک مدل رنگ کاهشی است که در چاپ رنگی مورد استفاده قرار میگیرد. CMYK مخفف چهار رنگ زیر است:
- C = Cyan رنگ سبز آبی
- M = Magenta ارغوانی تیره
- Y = Yellow زرد
- K = Key (Black) مشکی
تعریف پردازش تصویر به زبان ساده
طبق تعریف سازمان جهانی استانداردسازی (ISO 12087-1:1995)، پردازش تصویر (Image Processing) عبارت است از «تبدیل تصاویر دیجیتال به تصاویر دیجیتال»؛ مثلا تبدیل عکس رنگی به خاکستری، بهبود کُنتراست عکس، تغییر روشنایی عکس، آشکارسازی لبههای عکس، تبدیلات هندسی مانند چرخش، بزرگنمایی و ...
برای روشنتر شدن این مساله، نگاهی به زندگی روزمره خود در فضای مجازی بیندازید؛ زمانی که اینستاگرام خود را باز میکنید، برای شما صدها عکسی بارگذاری میشود که قطعا بر روی صد درصد آنها پردازش تصویر صورت گرفته است. چرا که اینستاگرام، قبل از ذخیرهی هر عکس بر روی سرورهای خود، بر روی آنها فشردهسازی انجام میدهد و این فشردهسازی، جزئی جداییناپذیر از پردازش عکس محسوب میگردد. حال بماند که کاربران این شبکه اجتماعی بر روی چه درصد عظیمی از این تصاویر، تبدیلات یا فیلترهای مختلف اعمال کردهاند!
تفاوت مفهوم پردازش تصویر با بینایی ماشین
به بیان ساده، بینایی کامپیوتر قابلیت یک سیستم کامپیوتری برای درک اطرافش از طریق یک یا چند چشم دیجیتالی است. در ارتباط با فرق بین پردازش تصویر با بینایی کامپیوتربینایی کامپیوتر و کاربردهای آن چیست و چگونه کار میکند؟کامپیوتر ویژن یا بینائی کامپیوتر، در ارتباط با مدلسازی و تقلید از حس بینایی انسانی از طریق استفاده از نرمافزار یا سختافزار دیجیتالی میباشد. در این صفحه بینایی ماشین را بصورت کامل بررسی شده است. (computer vision)، نظرات متفاوتی را میتوان در مقالات متعدد جستجو کرد. عدهی اول بر آن هستند که بینایی کامپیوتر، زیرمجموعهای از پردازش تصویر و حاصل اشتراک آن با حوزه هوش مصنوعی و یادگیری ماشین است.
عدهی دوم بر این عقیدهاند که پردازش تصویر، زیرمجموعهی بینایی کامپیوتر است و از الگوریتمهای آن بهره میبرد تا مسائل مربوط به بینائی را در حد مقیاس انسانی شبیهسازی کند.
اما در اصل هیچ کدام از این عقاید درست نیست چرا که هیچ یک از این دو، زیر مجموعهی سَرهای از یکدیگر نیستند و باید از زاویهی دیگری به آنها نگاه کرد. تفاوت اساسی این دو، در اهداف آنهاست نه در متد و رویهای که استفاده میکنند. اگر هدف، بهبود کیفیت عکس برای استفادههای آتی باشد، این پروسه را میتوان پردازش تصویر نامید. از طرفی دیگر اگر هدف، شبیهسازی قابلیتهای بصیرت انسانی باشد میتوان آن را بینایی ماشین نامید؛ مانند شناسایی اشیاء، شناسایی عیب و ایراد در سیستمهای مهندسی، شناسایی بدخیم/خوشخیم بودن بیماریهایی مانند سرطان در تصاویر پزشکی، رانندهی اتوماتیک و یا ...
به این کاربردها در ادامه اشاره خواهد شد.
انواع مختلف پردازش تصویر
از سه منظر میتوان انواع پردازش تصویر را بررسی کرد:
1 | پردازش دیجیتال | پردازش آنالوگ | |||
2 | پردازش کم عمق | پردازش میان عمق | پردازش پر عمق | ||
3 | تصویرنمایی | تشخیص | ترمیم | شناسایی الگو | بازیابی |
از نگاه پردازش دیجیتال یا آنالوگ
پردازش تصاویر دیجیتال به صورت پردازش دیجیتال و پردازش تصاویر آنالوگ به صورت پردازش آنالوگ صورت میگیرد. پردازش آنالوگ از طریق سیگنالهای الکتریکی دستکاری میشوند. تصاویر پزشکی مانند تصاویر حاصل از عکسبرداری با دستگاه رادیولوژی آنالوگ، به صورت آنالوگ پردازش میشوند.
بیشتر مسائل در حوزه پردازش تصویر، مرتبط با پردازش تصویر دیجیتال است چرا که الگوریتمهای تصاویر دیجیتالی، بسیار متنوعتر، سریعتر، و آسانتر هستند.
از نگاه سطحبندی
- پردازش کم عمق: پردازشهای ابتدایی مانند فیلتر تصویر، تغییر میزان روشنایی، حذف نویز و ...
- پردازش میان عمق: پردازش تصویر برای تشخیص اطلاعاتی مانند لبهها، اشیا، و ...
- پردازش پُر عمق: پردازش تصویر برای تشخیص اطلاعات پیشرفتهتر مانند تشخیص رابطه بین اشیا و ...
از نگاه تکنیک های پردازشی
فنون پردازش تصاویر دیجیتال به طور عمده در پنج دسته جای میگیرند:
- تصویرنمایی (visualization): آشکارسازی اشیایی که در عکس قابل رؤیت نیستند
- تشخیص (recognition): تشخیص و شناسایی اشیاء داخل تصویر
- ترمیم (sharpening and restoration): بهبود کیفیت عکس اصلی
- شناسایی الگو (pattern recognition): سنجش الگوهای مختلف در پیرامون اشیای داخل تصویر
- بازیابی (retrieval): جستجوی عکسهای شبیه به عکس اصلی از میان پایگاه اطلاعاتی تصاویر
مراحل بنیادی پردازش تصویر دیجیتال
مراحل بنیادین پردازش تصویر، قدمهایی هستند که لزوما تمام آنها شامل پردازشمان نمیشود و بسته به کاربرد، برخی از آنها مورد بهره وری قرار میگیرد:
1- دستیابی به عکس
این مرحله شامل دریافت عکس از یک منبع نرمافزاری یا سختافزاری است. در این مرحله، پیشپردازشی مانند تغییر مقیاس (سایز) عکس نیز صورت میگیرد.
2- بهبود عکس
در این مرحله، تصویر طوری تنظیم میگردد تا برای نمایش یا آنالیز بیشتر در مراحل بعدی با کیفیت مناسبتری حاضر گردد. این مرحله معمولا شامل تیز کردن (sharpening) یا تلطیف (smoothing)، افزایش یا کاهش تضاد رنگ (contrast) و روشنایی (brightness)، حذف نویز و ... میشود.
3- بازیابی عکس
این مرحله شامل ریکاوری کردن تصویر اوریجینال از تصویری است که به آن نویز یا خط و خش اضافه شده و کیفیت آن تنزل یافته است. در این مرحله بر خلاف مرحلهی بهبود عکس، از مدلهای ریاضیاتی و احتمالاتی برای رفع نویزهای طبیعی استفاده میکنیم.
4- پردازش رنگ عکس
این مرحله تنها شامل تصاویری میشود که در طیف رنگی تعریف شده است.
5- موجک ها و رزلوشن های چند گانه
موجکها (wavelets)، موجهای کوچک با مدت زمان محدودی هستند که برای محاسبهی موجهای تبدیل استفاده میگردند که خود، اطلاعات زمان-فرکانس را در اختیار ما میگذارد.
تصاویر به موجکها یا نواحی کوچکتری برای فشردهسازی اطلاعات و نیز بازنمایی هرمی تقسیم میگردند.
6- فشرده سازی
فشردهسازی یا کامپرشن، فرایندی است که در آن، فضای لازم برای ذخیرهسازی یا پهنای باند مورد نیاز برای انتقال تصویر، کاهش یابد.
7- فرآیند مورفولوژیکی یا ریختشناسانه
این مرحله شامل استخراج مؤلفههایی از عکس است که در بازنمایی و توصیف شکل آن موثر باشد. در این مرحله، عملیات پایهای مانند سایش (erosion) و فراخِش (dilation) میباشد که هر یک در تصویر زیر توصیف شدهاند:
8- قطعه بندی
این مرحلهی دشوار شامل تقسیمبندی تصویر به چندین بخش/قطعه میباشد که برای یافتن اشیا و مرز بین آنها مورد استفاده قرار میگیرد.
9- بازنمایی و تشریح
عملیات بازنمایی، با تبدیل داده به شکلی که مناسب برای پردازش کامپیوتری است سر و کار دارد:
- بازنمایی کرانهای: وقتی استفاده میشود که تمرکز بر روی ویژگیهای خارجی اشکال مانند گوشههای شیء (corners) باشد.
- بازنمایی منطقهای: وقتی استفاده میشود که تمرکز بر روی ویژگیهای داخلی اشکال مانند بافت شکل (texture) باشد.
عملیات تشریح، با استخراج ویژگیها و خصوصیات اشیا سر و کار دارد:
- باعث تولید برخی اطلاعات کمیّ مورد نیاز میگردد
- برای تمیز دادن یک کلاس از اشیا نسبت به بقیه کلاسها استفاده میگردد
10- تشخیص
در این فرایند، با توجه به اطلاعات تشریح، یک برچسب (label) به اشیای داخل تصویر اختصاص داده میشود. مثلا برچسب «ماشین»، «انسان»، و ...
کاربرد های پردازش تصویر
پردازش تصویر کاربردهای متنوع و زیادی دارد که از صنعت و مسائل پزشکی گرفته تا کاربردهای روزمره در زندگی همهی ما که به مهمترین آنها اشاره خواهیم کرد:
- کاربرد در پردازش ویدیو
- کاربرد در کنترل ترافیک
- کاربرد در حوزههای پزشکی
- کاربرد در حوزه هواشناسی
- کاربرد در حوزه صنعت
- کاربرد در حوزه کشاورزی
- کاربرد در حوزه شهرسازی
- کاربرد در حوزه علوم نظامی
- کاربرد در کدگذاری و فشردهسازی پیش از انتقال داده
- کاربرد در پردازش تصاویر سه بعدی در واقعیت مجازی/افزوده
- کاربرد در ویرایش تصاویر از طریق نرمافزارهای ادیت عکس مانند فوتوشاپ
پردازش تصویر در پزشکی
پردازش تصویر پزشکی (medical image processing) شامل استفاده و کاوش در تصاویر پزشکی و مجموعه دادههای سه بعدی از اجزای بدن انسان، چه بافتهای قابل مشاهده و چه اعضای درونی بدن میباشد. این تصاویر عمدتا از اسکنرهای معروف در علم پزشکی مانند Computed Tomography یا همان سیتی اسکن، Magnetic Resonance Imaging یا همان امآرآی و ... به دست میآید. این پردازشها میتواند در پاتولوژی یا آسیبشناسی، هدایت پزشکان و تکنسینها در عمل جراحی و غیره مورد اثر واقع شود.
به عنوان مثال، دکتر علی بشاشتی، استادیار دانشگاه بریتیش کلمبیا (UBC) و محقق در حوزهی بیوانفرماتیک است که تمرکز اصلی وی و تیم پژوهشگری ایشان بر روی ساخت مدلها و الگوریتمهای مبتنی بر یادگیری ماشین، پردازش سیگنالهای دیجیتال و پردازش تصویر برای اکتشاف اطلاعات موثر و کاربردی برای درمان بیماریهای مختلف میباشد. یکی از تازهترین پروژههای تحقیقاتی ایشان مرتبط با تصاویر پزشکی از دهانهی رحم و تخمدان برای تشخیص و دستهبندی سرطان تخمدان و ارتباط آن با زیستنشانگر ژنتیکی میباشد.
مزایای بهره گیری از پردازش تصویر
پُر واضح است که پردازش تصویر مزایای بسیاری دارد که به برخی از آنها اشاره میکنیم:
- تهیهی تصاویر دیجیتال در طیف وسیعی از فرمتها، مدلها و سیستمهای رنگبندی
- پردازش و استخراج اطلاعات مفید به طوری که بدون چشم مسلح نمایان نباشند
- ذخیره و بازیابی سادهتر و سریعتر تصاویر
- دستکاری و ویرایش تصاویر به صورتی دلخواه
برنامه نویسی در حوزه پردازش تصویر
کتابخانههای متعددی برای زبانهای برنامهنویسی مختلف وجود دارد که الگوریتمهای پردازش دیجیتال تصویر را ساپورت میکنند. از جمله کتابخانههای محبوب و بهینه، Opencv میباشد که هم برای زبان ++C و هم برای پایتون نوشته شده است و مزیت آن در این است که کاملا متنباز بوده و با خیال راحت میتوانید از آن در پروژههای مختلف و حتی تجاری خود استفاده کنید.
متلب نیز نرمافزار و زبانی محبوب برای برخی از برنامهنویسهاست که فانکشنهای متعددی برای الگوریتمهای پردازش تصویر در آن پیادهسازی شده است.
برای آشنایی اولیه در مورد نحوه کدنویسی برای پردازش تصویر، به کدهای زیر توجه کنید. کدها مربوط به MATLAB میباشد ولی چون این برنامه دارای لایسنس است شما میتوانید از GNU Octave استفاده کنید که دستورات آن دقیقا مشابه با متلب بوده و متنباز است.
فرض کنید عکسی با نام in.png در محل فعلی برنامه قرار دارد. برای خواندن عکس از فایل، دستور زیر را بنویسید:
;
I = imread('in.png')
سپس دستور زیر را برای نمایش عکس که به صورت گرافیکی است را اجرا کنید:
imshow(I)
حال برای فهمیدن اطلاعات مرتبط با عکس اعم از سایز، حجم و نحوه نگهداری عکس به صورت متغیر در متلب، دستور زیر را اجرا کنید:
whos I
حال بیاید کنتراست عکس را تغییر دهیم. برای این کار ابتدا اجازه دهید کمی در مورد هیستوگرام توضیح دهیم.
همان طور که میدانید، عکس از تعدادی از پیکسلها تشکیل شده است. در یک روش توصیف عکس به صورت خاکستری، هر پیکسل میتواند عددی بین 0 تا 255 را بگیرد؛ یعنی 256 حالت دارد. هر چه قدر به عدد 0 نزدیکتر باشد، آن پیکسل سیاه تر و هر چه قدر به 255 نزدیکتر باشد، آن پیکسل سفیدتر است.
حال هیستوگرام (Histogram) چیست؟ هیستوگرام، نموداری است آماری، و نشاندهندهی تعداد پیکسلها در هر محدودهی مقادیر پیکسلی؛ بدان معنا که محور افقی آن از 0 تا 255 نشانه گذاری شده که نشان دهندهی مقادیر مجاز برای هر پیکسل است و محور عمودی نیز، تعداد پیکسلهایی را نشان میدهد که آن مقدار خاص را گرفته است.
به عنوان مثال عکس زیر را مشاهده کنید:
اگر دقت کنید، مثلا حدود 600 تا از پیکسلهای عکس مورد نظر، دارای مقدار 150 هستند.
این هیستوگرام، مربوط به عکسی است که در مرحلهی قبل در متغیر "I" قرار داده و نمایش دادیم.
این هیستوگرام نشاندهندهی آن است که بیشتر پیکسلهای عکس در محدودهی 75 تا 150 هستند که باعث ناواضح بودن عکس و کنتراست نامناسب تصویر میشود چرا که کران پایین و بالای مقادیر وجود ندارد. یعنی رنج 0 تا 75 و همچنین 150 تا 255!
در متلب تابعی به نام histeq وجود دارد که مقادیر پیکسلها را طوری متناسب میکند که تراکم خطوط در هیستوگرام آن پخش گردد. دستورات زیر را اجرا کنید:
;
I2 = histeq(I)
figure
imshow(I2)
دو عکس زیر، قبل و بعد از یکسانسازی هیستوگرام است (عکس سمت راست، قبل از تغییر و سمت راست بعد از تغییر است)؛
هیستوگرام جدید نیز بدین شکل خواهد بود:
این تنها یک نمونهی کوچک از کارکرد پردازش تصویر به صورت برنامه نویسی بود که در مثال ما، کنتراست تصویر را بهبود بخشیدیم.
توجه کنید که برای پردازش تصویر در پایتون نیز، کتابخانههای متعدد و بسیار کارآمد وجود دارد که توابع آن نیز از نظر اسمی شبیه به توابع متلب است.
لیست موضوعات مهم در پردازش تصویر برای شروع قدم به قدم
- نمایش عکس، نمونهبرداری، طیف نوری، رنگ
- عملیات پیکسلی، روشنایی، کانتراست، هیستوگرام
- نویز، نویز گاوسی، انواع دیگر نویز
- فیلتر خطی، کانولوشن، بلور کردن
- تبدیل فوریه دو بعدی، تبدیل فوریه دیجیتال
- کورِلیشن یا همبستگی نرمالشده، فیلتر میانهای، فیلتر دوجانبه
- گرادیان تصویر، آشکارسازی لبه، عملگرهای لبهای دو بعدی
- لاپلاسینِ گوُسی، لبهیاب Canny
برای یافتن ادامهی سرفصلها به انگلیسی، میتوانید به سایت درس مبانی بینایی کامپیوتر دکتر نصیحتکن (استادیار دانشگاه صنعتی خواجه نصیرالدین طوسی) مراجعه کنید.
نقشه راه یادگیری پردازش تصویر
اگر مهندسی یا علوم کامپیوتر خواندهاید و مسائل ریاضی مطرح شده را بلد هستید، از مرحله 1 عبور کنید!
1- پیش نیازهای ریاضیاتی
همانطور که در ابتدای مقاله اشاره کردیم، پردازش تصویر زیرمجموعهای از پردازش سیگنال است و به همین دلیل پیشزمینهی قویای در ریاضی را میطلبد. مطالبی همچون:
- جبر خطی و ماتریسها
- سیگنالها و سیستمها—تبدیل فوریه
- سیگنالها و سیستمها—نمونهبرداری و فیلترها
- آمار و احتمال مهندسی—احتمالات و قوانین بیزین
- الگوریتمهای تصادفی و بهینهسازی
- تجزیه مقدار تکینی (SVD)
- آنالیز مولفههای اصلی (PCA)
ریاضی جزئی جداناپذیر از پردازش تصویر و مبانی بینایی کامپیوتر است!
2- برنامهنویسی
در صورتی که برای پردازش تصویر، میخواهید برنامهسازی کنید، بدین معنی که هدف شما استفاده از نرمافزارهای آماده یا پردازش گرافیکی مانند فوتوشاپ، اَدوبی پریمیر و ... نیست، باید حداقل یک زبان برنامهنویسی بلد باشید. همانطور که گفتیم، کتابخانههای متعددی برای این کار وجود دارد که Opencv محبوبترین آنها در زبان پایتون یا سی پلاس-پلاس است. MATLAB نیز در این زمینه قوی است ولی احتمالا نیازمند خرید لایسنس آن خواهید بود که هزینه چندان کمی هم ندارد!
اگر شما از آن دسته افراد هستید که فقط نام برنامهنویسی به گوشتان خورده است و هیچ ایدهای ندارید دقیقا چه چیزی است و باید از کجا شروع کنید، مقالهی مربوط به «برنامهنویسی چیست» را مطالعه کنید. به هر حال تسلط بر روی مباحث ریاضی قاعدتا امری لازم اما ناکافی است. برای پردازش تصویر و به سر انجام رساندن امور و اهداف مدنظر در این مقوله، حتما بایستی برنامهنویس خوبی هم باشید!
3- مفاهیم پردازش تصویر
در قسمتهای قبلی به صورت لیستوار موضوعات مهم در این زمینه را نام بردیم. حال در این بخش چندین منبع خوب و کاربردی را برای یادگیری عمیق مفاهیم پردازش تصویر معرفی خواهیم کرد:
- Computer Vision: Algorithms and Applications - Richard Szeliski
- Digital Image Processing - Rafael C. Gonzalez
- Principles of Digital Image Processing - Wilhelm Burger and Mark J. Burge
دانلود کتاب های مرجع درس پردازش تصویر
پردازش تصویر چیست؟
طبق تعریف سازمان جهانی استانداردسازی، پردازش تصویر دیجیتال یا Image Processing عبارت است از «تبدیل تصاویر دیجیتال به تصاویر دیجیتال»؛ مثلا تبدیل عکس رنگی به خاکستری، بهبود کُنتراست عکس، تغییر روشنایی عکس، آشکارسازی لبههای عکس، تبدیلات هندسی مانند چرخش، بزرگنمایی، فلیپ و غیره. توصیه میکنیم برای آشنایی بیشتر با پردازش تصویر حتما به این صفحه مراجعه کنید.
کاربرد یادگیری عمیق در پردازش تصویر
برای تسکهایی مانند حذف نویز از تصویر، حذف بکگراند از تصویر، انجام تبدیل و ترجمهی عکس به عکس، از یادگیری عمیق یا همان دیپ لرنینگ استفاده میگردد. این یادگیری معمولا از طریق شبکههای عصبی مصنوعی با داشتن تعداد زیادی لایههای میانی صورت میگیرد.
زمینههای کاری پردازش تصویر
- تصاویر پزشکی: در پردازش تصاویر پزشکی، دانشمندان بر روی ساختار درونی و بافتهای ارگانهای حیاتی بدن تحقیق کرده تا بتوانند ناهنجاریهای مرتبط با آن را سریعتر پیدا کنند.
- امنیت: متخصصان با استفاده از پردازش تصاویری که از دوربینهای امنیتی خروجی مییابد، میتوانند به تولید جزئیات مهم کمک کنند.
- صنایع نظامی و دفاعی: یکی از موارد استفاده از پردازش تصویر میتواند steganography باشد. بدان معنا که متخصصان پیامهای محرمانهی خود در تصاویر به صورت رمز پنهان میکنند.
- زمینههای عمومی: بهبود تصاویر برای کاربردهای عمومی با استفاده از ابزارهای ویرایش عکس مانند فوتوشاپ. گرافیستها روزانه با استفاده چنین ابزاری، در واقع پردازش تصویر انجام میدهند.