میزان زیادی از اطلاعات تصویری امروزه در کاربردهای مصرفی و سرمایه گذاری وجود دارند . ولی مقابله با تصاوبر ذخیره شده در بانک های اطلاعاتی حجیم نیازمند ابزارهای کار آمد تر برای توصیف ، طبقه بندی و مدیریت این اطلاعات تصویری می باشد . به همین علت شرکت های خصوصی و موسسه های تحقیقاتی به منظور یافتن راه های ممکن برای توصیف و طبقه بندی خودکار محتوای چند رسانه ای و به خصوص تصویری ، تمرکز خود را بر روی پروژه های تحقیقاتی گذاشته اند . توصیف محتوای تصویری به صورت دستی کار بسیار وقت گیری است . و مستلزم یافتن روش های اتوماتیک می باشد . هدف تهیه چکیده ای از تصاویر به صورت خودکار به عنوان ساختار رسانه ای می باشد . که برای جست و جو و بازیابی بسیار مناسب تر است .
تصور کنید که ممکن بود تمامی ویدئوهای یوتیوب به صورت خودکار توسط یک برنامه نرم افزاری توصیف شوند . بنابر این جست و جو در آرشیو تصاویر دیگر با استفاده از برچسب هایی که هر شخص به صورت دستی برای توصیف تصاویر هنگام آپلود استفاده می کند انجام نمی شد . با این حال این نوع نرم افزارها از نظر اقتصادی همچنان مقرون به صرفه نیستند .
میزان زیادی از تصاویر ، در تاسیسات حفاظتی شامل دوربین ها نیز وجود دارند . علاقه مندی به تکنولوژی VCA در سال های اخیر بیشتر شده است و تمرکز این مقاله نیز بر همین موضوع است . در حفاظت ، VCA اغلب برای تجزیه و تحلیل تصاویر در زمان واقعی استفاده می شود . با این حال این نوع نرم افزارها از نظر اقتصادی همچنان مقرون به صرفه نیستند . میزان زیادی از تصاویر ، در تاسیسات حفاظتی شامل دوربین ها نیز وجود دارند . علاقه مندی به تکنولوژی VCA در سالهای اخیر بیشتر شده است و تمرکز این مقاله نیز بر همین موضوع است . در حفاظت ، VCA اغلب برای تجزیه تحلیل تصاویر در زمان واقعی استفاده می شود . با این حال می توان از آن برای اسکن تصاویر ضبط شده با استفاده از تخصیص پارامتر های مشخص برای نرم افزار استفاده کرد که موجب صرفه جویی در زمان و افزایش ارزش تاسیسات VCA می شود .
برای روشن کردن این قضیه که چه چیزهایی یک تاسیسات تصویری را تشکیل می دهد و اینکه چرا نمی توان آن را به عنوان هوشمند و یا تحلیلی طبقه بندی کرد ، ما یک مثال از یک مرکز خرید آورده ایم . اساسا" تعداد دوربین ها به طور مستقیم کم و بیش به تعداد نمایشگر ها بستگی دارد . که در بعضی مواقع توسط اپراتورها مشاهده و یا تصاویر آنها ضبط می شود . معمولا" فرآیند تصویر برای گسترش و بهبود تصویر در مقاصد نمایشی انجام می شود . هرگونه تجزیه و تحلیل و دریافت اینکه چه اتفاقاتی در مناطق تحت نظر در جریان است . بخشی از وظایف اپراتورهاست . خوشبختانه در اکثر مواقع هیچ اتفاق به خصوص و یا خطر آفرینی به وقوع نمی پیوندد اما متاسفانه تحقیقات نشان می دهند . که حتی اپراتورهای آموزش دیده نیز نزدیک به 90% از تمرکز و توجه خود را تنها در طول 22 دقیقه از دست می دهند . در موارد رویدادهای غیر قانونی ، سیستم نظارتی به شخصه هیچ گونه پشتیبانی، به جز فیلم های ضبط شده در اختیار نمی گذارد . اگر آمار ارائه شده درباره محدوده توجه و تمرکز اپراتورها که دربالا به آن اشاره شد را در نظر بگیریم در اکثر مواقع احتمال اینکه از یک اتفاق بحرانی جلوگیری شود و یا توسط دوربین مدار بسته مدیریت شود خیلی کمتر از حد مورد انتظار است و رضایت بخش نمی باشد . بررسی اتفاقاتی که قبل . در حین و بعد از حادثه یه وقوع پیوسته اند باید توسط اسکن دستی فیلم های ضبط شده انجام شود . که در واقع وظیفه ای بس سخت و وقت گیر است . تا زمانی که هیچ گونه پشتیبانی توسط سیستم چه در زمان واقعی چه به صورت آفلاین ارائه نمی شود . نمی توان آن را به عنوان سیستم تحلیلی و یا هوشمند طبقه بندی کرد .