هوش مصنوعی جهان را چگونه می بیند
نگاهي اجمالي به اينكه هوش مصنوعي جهان را چگونه خواهد ديد
عكس ها از نمايشگاه آقاي Trevor Paglen با عنوان “A study of invisible images”
نوشته Alexander Strecker منتشر شده در سایت لنزکالچر
مترجم: زینب امیری خامکانی – ترجمه اختصاصی مدرسه هنر های معاصر
“زمان من در استنفورد روي پيشرفت و گسترش تصويرسازي متمركز شده است كه به نظرم از اختراع عكاسي مهم تر است… ”
فريم هاي عكاسي از زمان ظهورشان به ما اين امكان را داده اند كه ديدگاه ديگران نسبت به جهان را ببينيم. زمانيكه ما به قديمي ترين عكس باقيمانده- Veiw from the Window at Le Gras از Nicephore Niepce كه در اندازه يك كارت پستال است -نگاه مي كنيم،در واقع مي بينيم كه وقتيكه آقای نییپس از پنجره بالاي خانه ي خود بيرون و اطراف ملك خود را نگاه كرد،دنيا را چگونه ديد. در حاليكه مدت زمان زيادي نوشتن(بخصوص رمان)قادر به قرار دادن خوانندگان در ذهن يك شخص ديگر بود،اين اختراع جديد درجه ي بي نظيري از صحت و دقت را ارائه داد.
“View from the Window at Le Gras” ،سال ١٨٢٦ يا ٢٧ (نسخه به سازي شده بصورت دستي) از Nicephore Niepce
اين عكس در مجموعه Gernsheim در مركز Harry Ransom شهر آستين ايالت تگزاس به نمايش گذاشته شده است.
در سال هاي في ما بين شگفتي اين اختراع بسيار كمرنگ شد و حتي امروزه بسيار معمولي و پيش پا افتاده به نظر مي رسد. امروزه همانطور كه خبرها و داده هاي رسانه هاي اجتماعي را بررسی ميكنيم،به اين نكته توجه نمي كنيم كه بسياري از اطلاعات به اشتراك گذاشته شده، ما را به فضاي پشت چشم يك نفر ديگر مي برد، ما اطلاعاتي دريافت مي كنيم كه تنوعشان به اندازه تعداد تصاوير پخش شده در گستره ي ديجيتال است؛از ناهار دوستمان گرفته تا عكس خبري از يك عكاس خبري، هر فريم يك قاب است كه از برداشت شخص ديگري از واقعيت گرفته شده است. اگر مكث مي كنيد تا درباره ي آن فكر كنيد، يك امتياز بزرگ است. در حاليكه تقريباً همه چيز درباره ي عكاسي از زمان ظهور و پيدايش آن تغيير كرده (ابزار توليد،انتشار و مصرف)، بدون شك اين واقعيت اساسي درباره آن يعني به اشتراك گذاشتن ديدگاه شخصي ديگر به قوت خود باقي مانده است.
درست است كه روش هاي عكاسي بدون دخالت انسان نيز وجود دارد(اگر نخواهيم نمونه هاي معاصر و مدرن تصاوير ماهواره اي،عكاسي هواپيماهاي بي سرنشين و غيره را عنوان كنيم،حتي تكنيك عكاسي توسط كبوتر هم به ذهن مي رسد)،اما حقيقت اين است كه عكس هايي كه ما اغلب نگاه ميكنيم و به آنها فكر مي كنيم ،حامل نشاني از منظور و پيام انسان است؛آنها ديد يا ديدگاه هاي ما نسبت به جهان را با قادر كردن ما به ديدن آن از نقطه نظر فردي ديگر گسترش مي دهند.
اين چيزي است كه كار تريوور پاگلن (Trevor Paglen) را مهم مي كند. پاگلن به عنوان يك هنرمند با آثار به نمايش گذاشته ي بسيار ،يك دكتراي علم جغرافيا و نيز يك برنده ي اخير جايزه ي MacArthur Fellowship همه جانبه اين حق را دارد كه ديدگاه ما نسبت به جهان را به چالش بكشد. ممكن است اين گفته كمي متظاهرانه به نظر برسد،اما زماني كه او صرف كارش كرد تمام ادعاهايش را ثابت مي كند. براي نزديك به دو قرن ما به عكاسي به عنوان كاري توسط انسان ها براي انسان ها فكر كرده ايم. حال چه اتفاقي مي افتد اگر ماشين ها شروع به عكاسي كنند؟چه اتفاقي مي افتد اگر ماشين ها شروع به ديدن عكس ها كنند؟
****
براي سال ها مأموريت پاگلن ساده بوده است : بياموزد كه چگونه جهان را ببيند،مخصوصا قسمت هاي نامرئي اش را. او در مورد ماهواره هاي جاسوسي و دستگاه هاي وسيع ديده نشده پشت نظارت دولتي تحقيق كرده است. او درباره كابل هاي زير آب كه از اقيانوس عبور كرده و ٩٨ درصد از داده هاي جهان را انتقال مي دهند تحقيق كرده است. به تعبير پاگلن جهان به برد مادري ازشبكه هاي ارتباطي تبديل شده و هدف وي يافتن ابزاري براي كمك به او ( و ما) در ديدن هرچه واضح تر اين واقعيت است. با توجه به اينكه اين عناصر ديده نشده (نظارت،داده ها) چگونگي تعامل با جهان را تعريف مي كنند،اين كار بسيار مهم است.
هدف اخير او بررسي تكنولوژي هاي نامرئي و به سرعت در حال رشد از ديدن توسط كامپيوتر مي باشد. پاگلن مي نويسد :”در طي ده سال گذشته الگوريتم هاي قدرتمند و شبكه هاي هوش مصنوعي ،كامپيوترها را قادر به ديدن بصورت خودكار كرده اند. معني اينكه ديگر ‘ديدن’ نيازمند ‘بيننده ي ‘انساني نيست چيست؟ اين موضوع نمايشگاه اخير پاگلن در گالري Metro Pictures در نيويورك با عنوان “بررسي تصاوير نامرئي” است.
چهار ابر؛ مقياس ثابت، مناطق با حداكثر پايداري، نمودار / ٬Skimage ٬Watershed ٢٠١٧
چهار نماي آسمان نشان داده شده در اينجا با خطوطي پوشانده شده اند كه نشان مي دهند كه چهار الگوريتم مختلف ديدن كامپيوتر، چه چيزي در تصاوير مي بينند. اين الگوريتم ها به دنبال نقاط كليدي و منحصر به فردي هستند و تلاش مي كنند تا عكس پايه را به يك سري از بخش ها ساده كنند
الگوريتم هاي نشان داده شده در اينجا در متون ساده شده شناسايي شيء و نيز در تكنولوژي هايي همانند موشك هاي هدايت شده،سيستم هاي نظارت خودكار و مدل سازي سه بعدي مورد استفاده قرار مي گيرند.
تحقيقات پاگلن درباره ي ديدن كامپيوترها كمتر از مباحث نظارت دولتي،سياسي به نظر مي رسد. با اين حال با توجه به اينكه كار او ساخت اين نظريه حكم فرما و در حال رشد را بررسي ميكند،ما به مفاهيم مهم و ضروري براي زندگي روزمره ي خود پي مي بريم. اين تصاوير ساخته شده توسط ماشين روز به روز بيشتر و بيشتر بسياري از عناصر اساسي زندگي ما را تعريف ميكنند. ما چگونه حركت مي كنيم( ماشين هاي خودران)،چه چيزي مصرف مي كنيم (خطوط مونتاژ اتوماتيك و مراكز انجام و اجرا) و حتي اينكه چگونه با يكديگر تعامل مي كنيم(تشخيص چهره به عنوان وسيله اي براي كنترل اجتماعي). و نكته ناخوشايند اينجاست كه اين تصاوير توسط ماشين ها توليد و تنها توسط ماشين هاي ديگر ديده مي شوند. ما تصاويري ناراحت كننده از اپراتورهاي هواپيماهاي بي سرنشين كه صحنه هاي جنگي معاصر را به بازي كامپيوتري تبديل مي كنند (مانتد مصورسازي هاي ديجيتالي) را ديده ايم،اما ماشين ها جهان و ما انسان هاي درون آن را چگونه مي بينند؟
همانطور كه پاگلن مي نويسد :”يك اتفاق شگرف براي دنياي تصاوير افتاده است: آنها از چشم انسان ها جدا شده اند. ماشين هاي ما ياد گرفته اند كه بدون ما ببينند… من نام اين دنياي تصويرسازي ماشين به ماشين را ‘تصاوير نامرئي ‘ مي گذارم زيرا يك شكل از ديدن است كه بصورت ذاتي غير قابل دسترس به چشم انسان هاست. اين نمايشگاه به بررسي انواع مختلفي از اين تصاوير نامرئي مي پردازد”.
اين نمايشگاه كه از تعداد زيادي عكس (همراه با يك فيلم)تشكيل شده،طيف وسيعي از مباحث عملي و نيز مجازي را پوشش مي دهد. مباحث عملي همانند آناليز چهره ي يك انسان و يا شناسايي خودكار اشياء و به عنوان يك نمونه از مباحث مجازي يك هوش مصنوعي كه آموزش ديده است كه به دنبال اشخاصی بگردد كه از نظر تاريخي به عنوان نماد نظام سرمايه داري مورد توجه قرار گرفته اند
هريك از اين قطعات منحصر به فرد بسته به عقايد و حساسيت هاي هنري شما برايتان كم و بيش جالب خواهد بود. هوش مصنوعي مورد علاقه ي من در اين نمايشگاه آموزش ديده بود كه تنها اشيايي را ببيند كه در طول تاريخ با نشانه های بد یمنی تلقی می شدند .ماشيني كه طراحي شده بود تا يك ديد منفي و خرافی از جهان توليد كند:يك كامپيوتر بدبين. اما اين نمايشگاه جدا از هر يك از اين تصاوير منحصر به فرد،همانطور كه از فضاي آن عبور مي كنيد،اهميت بيشتري برايتان پيدا مي كند:اين وضوح آزاردهنده پاگلن و اصرار آرام اوست كه به آرامي قطعه به قطعه،متن به متن انباشته شده و ما را مجبور مي كند تا جايي را نگاه كنيم كه نمي توانيم ببينيم.
از فيلم “Behind These Glorious Times” از Trevor Paglen با عنوان “A Study of Invisible Images” گالري Metro Pictures نيويورك.
“Behind These Glorious Times” فيلمي است كه از تصاويري از دو منبع تشكيل شده است. تصاوير عكاسي موجود در اين فيلم قسمت هايي از كتابخانه هاي آموزشي هستند كه براي آموزش چگونگي تشخيص اشياء،چهره ها،حركات،روابط،احساسات و غيره به شبكه هاي هوش مصنوعي مورد استفاده قرار مي گيرند. آنها در واقع تصاويري هستند كه براي آموزش چگونه ديدن به ماشين ها طراحي شده اند.
“A Study of Invisible Images’،Metro PicturesMetro Pictures نيويورك
به اين ترتيب به استثناي تأثيرگذارترين اثر نمايشگاه با عنوان “Behold These Glorious Times” ،اين فيلم صدها هزار عكس را گرداوري كرده و آنها را با سرعت گيج كننده و هيپنوتيزم آور در طي ١٢ دقيقه پشت سر هم روي صفحه ي نمايش نشان مي دهد. ما شاهد چي چيزي هستيم؟اين شستشوي مغزي چيست؟بعد متوجه مي شويم كه اين تصاوير عكاسي از كتابخانه هاي آموزشي اي گرفته شده كه براي آموزش شبكه هاي هوش مصنوعي مورد استفاده قرار مي گيرند. بطور خلاصه اين تصاوير براي آموزش چگونه ديدن به ماشين ها مورد استفاده قرار مي گيرند. هرچه فيلم جلوتر مي رود مي بينيم كه تصاوير مرتب به شكل هاي ساده تري تجزيه مي شوند : شبكه هاي سياه و سفيد،آرايه هاي ظريفي از سايه ها. به هوش مصنوعي آموزش داده شده تا براي تشخيص تصاوير ابتدا هر تصوير را تجزيه،پايه اي ترين قسمت هاي آن را تحليل و سپس كل آن را درك كند. اين فرآيند بي نظير در اين فيلم با يك موسيقي همراه شده است كه خود محصول چندين الگوريتم است: صداها قسمت هايي از يك كتابخانه ي آموزشي شنيداري مي باشند كه به ماشين ها چگونگي تشخيص گفتار انساني را آموزش مي دهند. بنابراين آنجا كه هستيم،مغزمان شستشو نمي شود بلكه كامپيوتري مي شود. ديديم كه ٢٠٠ سال پيش جهان در نظر Niepce چگونه بود،اين فيلم جهان از سمع و نظر شاهدان آينده ي آن است.
من در گالري فيلم را از اول تا آخر تماشا كردم و قبل از اينكه به سراغ بقيه ي كارها بروم تصميم گرفتم يك بار ديگر آن را تماشا كنم. اما آنچه كه پاگلن بدست مي آورد بيشتر از تاثيرگذاري هنري است بلكه يك پيام بي ثبات كننده ي مربوط به هستي است. ابتدا ما شاهد تولد يك عامل مهم جديد در ديدگاه هاي متداولمان نسبت به جهان هستيم( خود،ديگري و حال ديگري مصنوعي؟). اين يك شكل كاملاً بيگانه از ديدن است كه ما بايد آن را بياموزيم ( حتي اگر همچنان به معناي ديد مستند يعني انسان پايبند بمانيم). طبق گفته ي پاگلن اين تنها يك تمرين عملي يا فكري نيست،دستورالعمل هايي كه اين ديد ماشيني را برنامه ريزي مي كنند به دليل پيامدهاي عميق و واقعي اي كه روي جهان دارند نبايد نامرئي بمانند. قوانين و ساختار ديدن رايانه اي كه به سرعت در حال رشد است،هم اكنون در حال بحث و گفتگو است و حالا زمان شركت در اين بحث هاست.
همانطور كه پاگلن توضيح مي دهد،براي آموزش چگونه ديدن به هوش مصنوعي ،آن را با بسته هايي از هزاران تصوير كه در گروه هاي مختلفي با عنوان “مجموعه هاي آموزشي”طبقه بندي شده اند ،تغذيه مي كنند. انسان ها به اين شكل هستند( توجه كنيد كه گاه سياه پوست ها به اشتباه گوريل تشخيص داده شده اند)؛دكترها و پرستارها به اين شكل هستند(توجه كنيد كه كامپيوترها بر اساس داده اي كه به آنها داده شده است به راحتي مي توانند نتيجه گيري كنند كه دكترها هميشه مرد و پرستارها هميشه زن هستند)؛زني كه برقع پوشيده به اين شكل است(ظاهراً انسان ها هم ممكن است در اين مورد اشتباه كنند،پس كسي چه مي داند).
در حاليكه در تصاويري كه در سرتاسر جهان مشاهده مي كنيم تعصب بسياري وجود دارد،ما به عنوان انسان توانايي نقد ديدگاه هاي خود را داريم و تلاش مي كنيم تا “مجموعه هاي آموزشي” خود را براي غلبه بر كليشه هاي بينايي مان گسترش دهيم. درحاليكه هوش مصنوعي اين قدرت را در مورد خود نخواهد داشت،سؤال اصلي اينجاست كه آيا برنامه نويسان و سازندگان آنها جايي براي اين بحث ها ايجاد خواهند كرد يا نه. چالش هاي اساسي كه ديد هوش مصنوعي با آنها مواجه خواهد بود،پيامدهاي گسترده اي خواهند داشت. به عنوان مثال تصور كنيد كه براي نخستين بار يك ماشين خودران بايد بين دو كودك كه وسط خيابان پريده اند انتخاب كند،يكي سفيد و ديگري سياه. اگر كامپيوتر كودك سياه را به عنوان يك حيوان كوچك ‘ببيند’ ،به علت تعصب بر “مجموعه هاي آموزشي” داده شده به آن،انتخابش واضح خواهد بود.
از فيلم “Behind These Glorious Times” از Trevor Paglen با عنوان “A Study of Invisible Images” گالري Metro Pictures نيويورك.
عكاسي تنها يك زمينه در ميان زمينه هاي بسياري است كه در سال هاي آينده عميقاً تكان خواهند خورد. در واقع نگراني زيادي درباره ي برخي از تلاش هاي انسان در جايي كه هوش مصنوعي به سرعت در حال نوآوري است وجود دارد. از مسائل جزئي گرفته (مانند بردن در شطرنج يا بازي Go،تلاش براي آشپزي،بازنويسي برنامه هاي ورزشي) تا مسائل بي قاعده و بي سامان (مانند نوشتن شعر و رمان،ترجمه با حداكثر كارايي، ايجاد صداهاي جديد موسيقي يا توليد فيلمنامه با اطلاعات بدست آمده از آمارگيري، كارهاي خوشايند جمعيت) و حتي درگير شدن با مرز نهايي يعني عشق، واضح است كه آينده ي هوش مصنوعي هم اكنون فرا رسيده است.
اين تغييرات بر ابزار عكاسي تأثير گذاشته و به نظر من اين تأثير شديد و گسترده خواهد بود. يك تاريخ از ابزار عكاسي زماني كه توسط پيشگاماني چون “نیپس” و “دراگر” در مسير حركت گذاشته مي شود، تا زماني استفاده از آنها ادامه خواهد يافت كه انسان ها عكس ها را توليد و تماشا كنند. اما يك قلمرو جديد براي تصويرسازي و مصرف آن در حال باز شدن است و كار پاگلن اصرار دارد كه ما به روش ديدن كامپيوترها عميقاً توجه كنيم و در حاليكه هنوز جا براي بحث و گفتگو در اين زمينه وجود دارد،اين ديد كامپيوتري را از دايره ي نا مرئي بودن بيرون بياوريم. اين موضوع تنها بطور انحصاري براي عكاسان و متخصصان تصويرسازي نيست؛هركدام از ما بسته به اندازه اي كه به ديدگاه هاي ماشين هايمان نسبت به جهان فردا وابسته هستيم بايد به نداي پاگلن توجه كنيم و امروز نگاه دقيق تري داشته باشيم.
براي كساني كه علاقه مند هستند،سايت گوگل يك ابزار متن باز (Open-Source) ارائه كرده كه به همه اجازه ي بازرسي كردن مجموعه داده هاي مورد استفاده براي آموزش هوش مصنوعي را مي دهد. دانشگاه هاي هاروارد و MIT با همكاري يكديگر روي بحث اخلاق و مديريت هوش مصنوعي كار مي كنند. مشاركت كنيد تا تلاش هاي بيشتري در اين زمينه انجام شود.
“It Began as a Military Experiment”، ٢٠١٧
تحقيقات معاصر در زمينه ي تكنولوژي تشخيص چهره از اواسط دهه ي ١٩٩٠ بطور جدي آغاز شد. ارتش ایالات متحده نيازمند تشخيص چهره بود و بنابراين محققاني را در زمينه ي علوم رايانه اي و ديد كامپيوتري به كار گماشت تا روي مسأله كار كنند. آنها متوجه شد كه براي انجام تشخيص چهره محققان نيازمند دسترسي به هزاران تصوير از چهره هاي افراد هستند. بنابراين در اوايل ده ي ١٩٩٠ روي توليد پايگاه داده اي به نام FERET سرمايه گذاري كرد كه اين پايگاه داده شامل ده ها هزار عكس از هزاران نفر بود كه بيشتر آنها در پايگاه نظامي MaryLand كار مي كردند. اين كار در طول چند ماه با جستجو در پايگاه داده ي FERET و انتخاب نمونه هايي از پرتره براي رتوش و تصحيح رنگ و اجراي الگوريتمي روي آنها براي تشخيص نقاط كليدي چهره شان ساخته شد. يكي از روش هايي كه من در مورد اين پرتره ها مي انديشم اين است كه اين تصاوير براي چشم انسان ها ساخته نشده اند،بلكه براي چشم ماشين ها ساخته شده اند. اين عكس ها برخي از چهره هاي اصلي تشخيص چهره را نشان مي دهند،عكس هايي كه تقريباً تمام تحقيقات مربوط به تشخيص چهره بر پايه ي آنها انجام شده است.
Fanon’ (Even the Dead Are Not Safe) Eigenface’٬ ۲۰۱۷
يك تكنيك استاندارد در نرم افزارهاي تشخيص چهره استفاده از يك الگوريتم براي ايجاد يك “اثر-چهره” (مانند اثر-انگشت) از يك فرد خاص و استفاده از آن براي تطابق چهره ي فرد با عكس هاي درون پايگاه داده هاست. براي روشن كردن موضوع ،اگر شما بخواهيد به يك الگوريتم بياموزيد كه چگونه يك فرد بخصوص (مثلاً فيلسوف Frantz Fanon) را از يك مجموعه از ساير افراد تشخيص دهد،بايد يك مجموعه ي بزرگ از عكس هاي چهره هاي افراد را كه چهره ي همه ي آنها نامگذاري شده داشته باشيد. سپس همه ي چهره هاي Fanon را گردآوري كنيد،آنها را طوري در كنار هم قرار دهيد كه چشم ها و دهانشان در يك جا قرار بگيرند و ميانگين آنها را بگيريد. سپس ميانگين تمام چهره هاي ديگر مجموعه را بگيريد. اگر ميانگين چهره ي Fanon را از تصوير ميانگين ساير افراد مجموعه كم كنيد،يك اثر-چهره براي Fanon بدست مي آوريد كه نشان مي دهد چه چيزي او را از ساير افراد مجموعه متمايز مي كند. حال مي توانيد از اين اثر-چهره براي شناسايي هر يك ازتصاوير آينده ي صورت Fanon كه ممكن است با آن مواجه شويد استفاده كنيد. اين پرتره آن اثر-چهره را (كه در اصل يك انتزاع رياضي است) به تصويري كه چشم هاي انسان مي تواند به عنوان يك چهره تشخيص دهد ترجمه مي كند.
(Highway of Death (Corpus: The Aftermath of the First Smart War از مجموعه ی Adversarially Evolved Hallucination ٬ ۲۰۱۷
مجموعه ي The Aftermath of the first Smart War شامل عكس هايي است كه پيامدهاي جنگ خليج فارس را نشان مي دهند. هوش مصنوعي يك چشم انداز توصيف شده با ميادين نفت در حال سوخت،بيابان زدگي،اورانيوم تهي شده،نقص هاي مادرزادي و ساير اثرات جنگ را مي بيند.
(Venus Flytrap (Corpus: American Predators از مجموعه ی Adversarially Evolved Hallucination ٬ ۲۰۱۷
هوش مصنوعي سازنده ي اين تصوير آموزش ديده است كه “شكارچيان آمريكايي” شامل همه ي انواع حيوانات و گياهان گوشت خوار بومي شمال آمريكا را ببيند.
(A Man (Corpus: The Humans از مجموعه ی Adversarially Evolved Hallucination ٬ ۲۰۱۷
هوش مصنوعي سازنده ي اين تصوير آموزش ديده است تا تحت مجموعه ي “انسان ها” چيزهايي مانند زني كه يك تفنگ در دست دارد، ليس زدن بستني، چشم هاي انسان، يك مرد و غيره را تشخيص دهد.
يكي از اولين وظايفي كه شبكه هاي عصبي و هوش مصنوعي مي توانند بطور قابل اعتماد انجام دهند،شناسايي اعداد نوشته شده بود. اين نوع سيستم هاي شناسايي عدد همه جا هستند،همانطور كه هركسي كه تا بحال با يك دستگاه خودپرداز اعداد دستنويس يك چك سپرده را بصورت خودكار خوانده،مي داند. Megalith از نزديك به ٧٠٠٠٠ عدد دستنويس ساخته شده كه نشان دهنده ي يكي از مجموعه هاي اصلي تصاويري است كه سيستم هاي شناسايي عدد بر پايه ي آنها ساخته شده است. يك رابط بين دو زبان:اعداد نوشته شده توسط انسان و اعداد نوشته شده توسط هوش مصنوعي. در اين قطعه،ترجمه يك تفسير نامرئي از اين اعداد است و توسط حس هاي انساني ما قابل دسترس نيست.
Machine Readable Hito، ٢٠١٧
اين قطعه از صدها پرتره از هنرمند Hito Steyerl ساخته شده كه توسط الگوريتم هاي مختلف تشخيص چهره آناليز شده اند. زير هر عكس خروجي هر الگوريتم كه سعي در تشخيص سن،جنسيت و حالت احساسي او داشته قرار گرفته است. الگوريتم هاي ديگر تلاش كرده اند تا تشخيص دهند كه مثلاً او عينك زده است يا نه،مي خندد يا نه،ريش دارد يا نه.
Trevor Paglen “A Study Of Invisible Images” Metro Pictures ،٢٠١٧
با تشكر از هنرمند و گالري Metro Pictures نيويورك. عكس از Genevieve Hanson