ردیابی چشم: بررسی فناوری و روشها
ردیابی چشم به ابزاری ارزشمند برای درک توجه، رفتار بصری و رفتار انسانی در زمینههای متنوعی از جمله روانشناسی، نوروفیزیولوژی، تجربه کاربری، تحقیقات بازار/عصبی بازاریابی و غیره تبدیل شده است. این فناوری همچنین میتواند برای تحلیل و غربالگری پزشکی استفاده شود و روش جدیدی از تعامل را فراهم میآورد.
تاریخچه و پیشرفتها
درگذشته، سیستمهای ردیابی چشم تهاجمی و ثابت بودند و بنابراین تنها در آزمایشهای بسیار محدود مفید بودند. با وجود محدودیتهای موجود، پیشرفتهای اخیر در فناوری این امکان را فراهم کرده است که راهاندازی سیستمها سادهتر و کاربردهای آنها گستردهتر شود.
در این مقاله، به معرفی فناوری ردیابی چشم و بررسی روشهایی که اکثر سیستمها برای ردیابی چشمها استفاده میکنند خواهیم پرداخت. در مقالات بعدی، به بررسی انواع مختلف سیستمهای ردیابی چشم، نحوه تحلیل دادهها و برخی از ویژگیها و کاربردهای این فناوری خواهیم پرداخت.
ردیابی چشم چیست؟
ردیابی چشم فرایند اندازهگیری حرکت یا موقعیت چشمها است. شبکیه چشم ناحیهای از عصبهای متراکم و دقت بصری بالا به نام “فُوِئا” دارد. عدسی چشم نور را بر روی فُوِئا متمرکز میکند و فرد با حرکتدادن چشمها، عدسی و فُوِئا را به جایی که میخواهد نگاه کند، هدایت میکند.
به طور خلاصه، یک سیستم ردیابی چشم اندازهگیری میکند که فرد به چه چیزی نگاه میکند یا چگونه چشمها به محرکها واکنش نشان میدهند. با ردیابی و تحلیل این حرکات چشم، محققان میتوانند با استفاده از فناوری ردیابی چشم به بینشهای ارزشمندی در مورد رفتار انسانی، فیزیولوژی، روانشناسی، ادراک و توجه بصری دست یابند. بهعلاوه، حرکات چشم میتواند روش جایگزینی برای تعامل با محیط، رابط کاربری کامپیوتر، هدست واقعیت مجازی و غیره ارائه دهد.
روشهای ردیابی چشم
۱. روشهای سنتی پژوهشهای ردیابی چشم ابتدا از طریق مشاهده مستقیم انجام میشد. محقق به تماشای حرکات چشم شرکتکننده میپرداخت. اولین سیستمهای خودکار نیاز به تماس مکانیکی با عدسی چشم داشتند و به طور قابلتوجهی تهاجمی و ناراحتکننده بودند.
یکی از اولین سیستمهای الکترونیکی، “کوئل جستجوگر اسکلرال الکترومغناطیسی” (SSC) بود. این سیستمها در یک لنز تماسی سیلیکونی با سیمی متصل به دستگاه ضبط تعبیه شدهاند. سیستمهای SSC دقت و سرعت بالایی را ارائه میدهند، اما همچنان تهاجمی هستند و معمولاً در یک قفس فارادی استفاده میشوند.
بعدتر، دستگاههای ردیابی چشممانند سیستم تصویربرداری دوال پرکینج (DPI) به چشم تماس فیزیکی نداشتند، اما همچنان به میله گاز برای تثبیت سر نیاز داشتند و میدان دید بسیار کوچکی داشتند (اما دقت و وضوح بسیار بالا). سیستمهای SSC و DPI هنوز هم در شرایط بسیار کنترلشده، معمولاً برای تحقیقات نوروفیزیولوژی، بینایی و چشمپزشکی فوقالعاده دقیق، استفاده میشوند.
یکی دیگر از تکنیکهای نیمه تهاجمی، سیستمهای “الکتروآکولوگرافی” (EOG) هستند که از الکترودهای متصل بهصورت برای اندازهگیری پتانسیل الکتریکی کوچک بین جلو و عقب چشم استفاده میکنند. این روش دقت بالایی ندارد، اما همچنان برای حذف نویز حرکات چشم از EEG استفاده میشود.
۲. ردیابی مبتنی بر ویدئو پژوهشگران از اوایل قرن بیستم به آزمایش روشهای ردیابی چشم مبتنی بر دوربین پرداختند. پیشرفتهای اخیر در فناوری دوربینهای کامپیوتری امکان ایجاد یک کلاس جدید از سیستمهای ردیابی چشم مبتنی بر ویدئو را فراهم کرده است که به طور فزایندهای غیرتهاجمی و کاربردی در سناریوهای مختلف از جمله محیطهای واقعی و در زمان واقعی است. این اکنون استاندارد در اکثر کاربردهای ردیابی چشم انسانی است و تنها سیستمهایی که در بخشهای بعدی این مستند بررسی خواهند شد.
اکثر سیستمهای ردیابی چشم مبتنی بر ویدئو شامل یک دوربین حساس به مادونقرمز، نور مادونقرمز (IR) و الگوریتمی پیچیده برای تشخیص مرکز مردمک و رد آثار هستند. پردازش تصویر و جمعآوری دادهها توسط سختافزار اختصاصی یا از طریق نرمافزار بر روی کامپیوتر یا دستگاههای همراه انجام میشود. نورپردازی مبتنی بر مادونقرمز مزایای زیادی دارد: نورپردازی به طور عمده برای شرکتکننده نامرئی است و آثار نور مصنوعی بهراحتی میتوانند توسط طولموج فیلتر شوند.
ویژگیهای منحصربهفرد مردمک و قرنیه تحت نور مادونقرمز تشخیص چشم و رد “چشمهای جعلی” از نمای دوربین را آسان میکند.
- روشهای ردیابی مردمک سیستمهای مردمک روشن از منبع مادونقرمز در همان محور دوربین استفاده میکنند و انعکاس درخشان از شبکیه را از طریق مردمک ردیابی میکنند، مشابه اثر “چشم قرمز” که در عکاسی دیده میشود. این فناوری ردیابی شبکیه میتواند به جبران دوربینهای باکیفیت پایینتر کمک کند و معمولاً در اتاقی با نور کم و نورپردازی ثابت بهتر عمل میکند. همچنین ممکن است در مورد شرکتکنندههایی با چشمهای آبی بسیار روشن یا نوزادانی که هنوز رنگدانه در عنبیه خود توسعه نیافتهاند بهتر عمل کند.
در مقابل، سیستمهای ردیابی مردمک تیره از منبع مادونقرمز خارج از محور دوربین استفاده میکنند که همه چیز در نمای دوربین به جز مردمک را روشن میکند. سیستم پردازش تصویر تاریکترین و گردترین شیء در میدان دید را ردیابی میکند. سیستمهای مردمک تیره در شرایط نوری مختلف و با شرکتکنندگان با چشمهای تیره و مردمکهای کوچک مقاومتر هستند. این سیستمها معمولاً بزرگتر هستند؛ زیرا منابع مادونقرمز باید از دوربین جدا باشند که به شکل مستطیلهای کشیده در بسیاری از سیستمهای تجاری ردیابی چشم میانجامد.
ردیابی انعکاس قرنیه در هر دو مورد، این سیستمها همچنین انعکاس قرنیه یا “رفلکس” (CR) را ردیابی میکنند که درخشش روشن از نورپردازی بر روی سطح کروی قرنیه است. این مکانیزم برای تمایز بین حرکات چشم و حرکات سر استفاده میشود. سیستم بینایی انسان از هر دوی اینها برای کسب و ردیابی هدف بصری استفاده میکند، اما سیستم ردیابی چشم که فقط چشم را میبیند باید تفاوت را درک کند. هنگامی که چشم میچرخد، مردمک حرکت میکند اما CR در جای خود باقی میماند (مانند نورافکن در حال تابش بر روی یک توپ در حال چرخش). اما هنگامی که سر حرکت میکند، هم مردمک و هم CR با هم حرکت میکنند. موقعیت نگاه، شاخص اصلی توجه انسانی و مبنای متریکهای تحلیلی بعدی (زمان حضور، نگاه، منطقه موردنظر و غیره) است. قبل از کالیبراسیون، موقعیت نگاه را میتوان بهصورت ساده بهصورت زیر محاسبه کرد: (موقعیت نگاه) – (موقعیت مردمک) – موقعیت (CR)
برای سیستمهای سر mounted، از جمله عینکهای ردیابی چشم و دستگاههای یکپارچه با VR، ردیابی CR نمیتواند برای تعیین موقعیت سر استفاده شود چرا که منبع IR با سر حرکت میکند. با اینحال، همچنان برای جبران لغزش استفاده میشود. این فرایند برای حذف حرکات کوچک بین تجهیزات ردیابی چشم و چشم از دادهها استفاده میشود.
۳. انواع دیگر سیستمهای مبتنی بر ویدئو
سیستمهای دوربین وب با نور مرئی در سالهای اخیر مورداستفاده قرار گرفتهاند. ایده این است که آزمایشهای ردیابی چشم میتوانند با استفاده از وبکمهای معمولی در خانههای مردم و با تعداد زیادی شرکتکننده اجرا شوند. بااینحال، این سیستمها برخی معایب عمده از نظر دقت و کیفیت دادهها دارند. این میتواند تا حدودی با افزایش تعداد کل شرکتکنندگان قابلجبران باشد. بهعنوانمثال، اگر به ۱۰۰ شرکتکننده نیاز دارید؛ اما فقط میتوانید ۱۰٪ از آنها را به طور قابلاطمینان ردیابی کنید، میتوانید ۱۰۰۰ نفر را جذب کنید.
مشکل این رویکرد این است که دشواری ردیابی به طور یکنواخت بین شرکتکنندگان توزیع نمیشود. این سیستمها اغلب در ردیابی چشمهای شرکتکنندگان مسنتر، کسانی که مژههای بلند یا آرایش چشم دارند، افراد با عینک و غیره دچار مشکل میشوند که منجر به یک مشکل انتخابی قابلتوجه در دادههای حاصل میشود.
روشها و محدودیتهای تنظیم، کالیبراسیون و اعتبارسنجی
بیشتر سیستمهای ردیابی چشم مدرن به تنظیم نسبتاً کمی نیاز دارند. آستانههای تشخیص مردمک و CR و حذف آثار اکنون بهصورت خودکار و به طور مداوم تنظیم میشوند. سیستمهای ردیابی چشم کار نسبتاً خوبی در تطبیق با رنگ چشم، اندازه، شکل و فاصله بین مردمکها انجام میدهند.
شرکتکننده باید در مقابل دوربین قرار گیرد (یا در مورد عینکهای ردیابی چشم، دستگاههای AR/VR، یا هدبند، دوربین باید روی شرکتکننده قرار گیرد). آزمایش باید بهگونهای طراحی شود که شرکتکننده در طول آزمایش در نمای دوربین باقی بماند و بتواند برخی از منابع دشواری ردیابی را از بین ببرد.
سیستمهای ردیابی چشم نیاز به کالیبراسیون دارند که روشی برای ارتباط الگوریتمی موقعیت فیزیکی چشم با نقطهای در فضا که شرکتکننده به آن نگاه میکند (نگاه) است. این به دلیل وجود برخی تغییرات در اندازه چشم، موقعیت فُوِئا و فیزیولوژی عمومی است که باید برای هر فرد سازگار شود. تا حدی، موقعیت نگاه تابعی از ادراک شرکتکننده است. یک کالیبراسیون معمولاً شامل نگاهکردن شرکتکننده به نقاط ثابت و شناخته شده در میدان بصری است. این نقاط میتوانند بر روی صفحهنمایش کامپیوتر برای سیستمهای ردیابی چشم مبتنی بر صفحهنمایش، یا در دنیای واقعی برای عینکهای ردیابی چشم نمایش داده شوند.
کالیبراسیون میتواند بهاندازه یک هدف متمرکز باشد، اما معمولاً شامل ۵، ۹ یا حتی ۱۳ نقطه است. الگوریتم یک ترجمه ریاضی بین موقعیت چشم منهای CR و موقعیت نگاه برای هر هدف ایجاد میکند، سپس یک ماتریس برای پوشش کل منطقه کالیبراسیون با درونیابی بین هر نقطه ایجاد میکند. هر چه تعداد اهداف بیشتر باشد، دقت و یکنواختی بیشتری در کل میدان بصری به دست خواهد آمد. منطقه کالیبراسیون، بخش با بالاترین دقت از دامنه سیستم ردیابی چشم را تعریف میکند، با کاهش دقت اگر چشم تحت زاویهای بزرگتر از نقاط استفاده شده حرکت کند.
توالی کالیبراسیون ۹ نقطهای معمولی. شرکتکننده بر روی هر هدف تمرکز میکند بهمحض اینکه ظاهر میشود.
ازآنجاییکه کالیبراسیون نیاز به همکاری و توانایی دارد، در بسیاری از موارد لازم است که اعتبارسنجی انجام شود تا موفقیت کالیبراسیون اندازهگیری شود. برخی سیستمها این کار را با نمایش اهداف جدید و اندازهگیری دقت نگاه محاسبه شده انجام میدهند. تحمل دقت کالیبراسیون به کاربرد بستگی دارد، اما بهطورکلی، خطای بین ۰.۲۵ تا ۰.۵ درجه از زاویه بصری قابلقبول است و بهخوبی در حدود تحملهای مورد انتظار سیستمهای ردیابی چشم تجاری خوب (۰.۳ درجه برای بیشتر محصولات Tobii، بهعنوانمثال) قرار دارد. برای بسیاری از کاربردها، بیش از ۱ درجه بهعنوان یک کالیبراسیون ناموفق در نظر گرفته میشود و نیاز به تلاش دوباره دارد. بسیاری از شرکتکنندگان در تلاش دوم یا سوم بهبود مییابند. شرکتکنندگانی که به طور مداوم خطای اعتبارسنجی بالایی دارند ممکن است مشکلی در بینایی یا فیزیولوژیکی داشته باشند که مانع از مشارکت آنها در یک آزمایش میشود.
توجه داشته باشید که برخی سیستمهای بسیار پیشرفته قادر به خود کالیبراسیون با ایجاد مدلهای پیچیده از چشم و اندازهگیری خصوصیات هر فرد بهصورت غیرفعال هستند. کالیبراسیون همچنین گاهی اوقات بدون همکاری فعال شرکتکننده با فرضیات درباره موقعیت نگاه بر اساس محتوا انجام میشود، به طور مؤثری “پنهانکردن” اهداف کالیبراسیون در اطلاعات بصری دیگر.
با برخی از گروههای شرکتکنندگان (مانند افراد مبتلا به تخریب ماکولا یا کسانی که قادر به تمرکز بر روی اهداف نیستند)، ممکن است در نهایت دقت بالاتری با عدم کالیبراسیون یا استفاده از کالیبراسیون عمومی حاصل شود.
برخی دستگاهها نیاز به کالیبراسیون ندارند اگر دادههای مفیدی از موقعیت خام مردمک گرفته شود (مانند تجهیزات VOR پزشکی، سیستمهای نظارت بر خستگی و غیره).
محدودیتهای روششناسی
سیستمهای ردیابی چشم مدرن هنوز برخی محدودیتهای عملکردی دارند که باید هنگام طراحی یک آزمایش ردیابی چشم یا یک کاربرد در دنیای واقعی در نظر گرفته شوند.
۱. انسداد مردمک: یکی از مشکلات عمده این است که یک سیستم ردیابی چشم مبتنی بر ویدئو باید نمای (عمدتاً) بدون مانع از مردمک داشته باشد. پلکها و مژهها میتوانند به فضای مردمک وارد شوند و نمای دوربین ردیابی چشم را مسدود کنند. الگوریتمهای تشخیص مردمک مدرن میتوانند مرکز مردمک را حتی اگر بخشی از آن مسدود شده باشد، تعیین کنند، اما در برخی مواقع اگر نمای کافی مسدود شود، ردیابی متوقف میشود، حتی اگر شرکتکننده هنوز بتواند ببیند.
۲. آرایش چشم: این مشکل با سیستمهای بهتر نسبت به گذشته کمتر است، اما آرایش چشم (خط چشم و ریمل) گاهی اوقات میتواند نور IR را جذب کرده و بسیار شبیه مردمک به نظر برسد. برخی محققان بر این باورند که باید آرایش چشم قبل از آزمایشهای ردیابی چشم برداشته شود.
۳. عدسیهای اصلاحی: هر نوع عینک نمای دوربین از چشم را تحریف میکند و مقدار کمی از نور IR که به عقب بازتابیده میشود را کاهش میدهد. اکثر سیستمهای ردیابی چشم مدرن میتوانند عینکهای معمولی را سازگار کنند، اما عینکهای دو کانونی به دلیل تحریف غیرخطی که در نقطه انتقال بین نسخهها ایجاد میکنند، گاهی اوقات اجتناب میشوند. لنزهای تماسی معمولاً مشکلات دقت ایجاد نمیکنند و بهاندازه کافی خوب عمل میکنند، هرچند آزمایشهای ردیابی چشم پیشرفته (مانند تحقیقات خواندن) ممکن است آنها را به دلیل شناور بودن بر روی چشم و تحریف موقعیتهای مردمک و CR در طول حرکات سریع چشم اجتناب کنند.
۴ . همکاری: اکثر سیستمهای ردیابی چشم که موقعیت نگاه را ضبط یا استفاده میکنند، نیاز به کالیبراسیون دارند و این فرایند نیاز به همکاری از طرف شرکتکننده دارد. گروههای جمعیتی که به طور قابلاعتماد به اهداف دستورالعملی نگاه نمیکنند (نوزادان، نخستیهای غیرانسانی و غیره) باید به نحوی ترغیب (آموزش) شوند تا به اهداف کالیبراسیون نگاه کنند. افراد با نابینایی جزئی یا نقصهای حرکتی چشم (مانند دژنراسیون ماکولا، کاتاراکت، ناستاگموس خود به خودی و غیره) معمولاً شرکتکنندگان آزمون دشواری هستند (زمانی که نگاه لازم است) مگر آنکه محقق حاضر به پذیرش دادههای نادرست باشد یا راه جدیدی برای کالیبراسیون داشته باشد که نیاز به تمرکز بر روی اهداف نداشته باشد.
۵. نور خورشید: سیستمهای مدرن ردیابی چشم در فیلترکردن و تنظیم نور مصنوعی بسیار خوب عمل میکنند، اما نور خورشید دارای ترکیب گستردهای از نور مادونقرمز است که میتواند مردمک را مخفی کرده و دوربین ردیابی چشم را کور کند. تنها چند سیستم تجاری در دسترس قادر به مدیریت نور خورشید هستند و معمولاً این سیستمها هنوز نیاز به سایه زدن بر روی چشمها دارند. حتی اگر شرکتکننده در سایه باشد، اگر مجبور شود به دلیل نور شدید خورشید چشمهایش را ریز کند، سیستم ردیابی چشم احتمالاً قادر به شناسایی مردمک نخواهد بود و نمیتواند بهدرستی ردیابی کند. اگر در محیطی ثابت که برخی نور خورشید اجتنابناپذیر است (مثلاً یک پنجره روشن) باشد، معمولاً بهتر است شرکتکننده را طوری قرار دهید که خورشید پشت سر او باشد، نه اینکه در چشمانش انعکاس یابد.
نتیجهگیری
ردیابی چشم یک روش بیش از ۱۰۰ساله است که در ابتدا برای تحقیقات پایهای در مورد بینایی و نوروفیزیولوژی استفاده میشد. در بیست سال گذشته، این حوزه پیشرفتهای زیادی داشته است که انعطافپذیری و تطبیقپذیری تکنولوژی را افزایش داده و بنابراین این حوزه را به کاربردهای جدیدی فراتر از تحقیقات بینایی و نوروفیزیولوژی بازکرده است.
ردیابی چشم به همراه سایر تکنولوژیها و دستگاههای پایش و تکنیکهای تحقیقاتی مانند EEG، MEG، fMRI، GSR، BVP، EMG، HRV، سیستمهای موقعیتیابی داخلی، آزمونهای سوگیری ضمنی IAT و Priming و غیره به محققان دانش بیشتری در مورد رفتار انسانی و روشهای جایگزین تعامل با انسان ارائه میدهد.
در بخشهای بعدی، اطلاعات بیشتری در مورد ردیابی چشم، از جمله انواع مختلف دستگاههای موجود امروزی، دادههای ردیابی چشم، ویژگیهایی مانند نرخ نمونهبرداری، دقت و صحت، و برخی از مطالعات و کاربردهای رایج ردیابی چشم ارائه خواهیم کرد.