جدال دقت و احساس در نسل جدید هوش مصنوعی

تاریخ ارسال : 1404/06/05

جدال دقت و احساس در نسل جدید هوش مصنوعی

سپیدپندار دات کام: عرضه مدل هوش مصنوعی جدید GPT-۵ توسط شرکت OpenAI در مرداد ۱۴۰۴ یکی از برجسته ترین رخدادهای اخیر در چشم انداز جهانی این فناوری نوظهور محسوب می شود.

به گزارش سپیدپندار دات کام به نقل از مهر؛ عرضه مدل هوش مصنوعی جدید «GPT-۵» توسط شرکت «OpenAI» در مرداد ۱۴۰۴ یکی از برجسته ترین رخدادهای اخیر در چشم انداز جهانی این فناوری نوظهور شمرده می شود، برای اینکه این عرضه نه تنها بعدی فناورانه دارد بلکه ابعاد اقتصادی، اجتماعی و روان شناختی آن نیز در سطح بین المللی مورد توجه قرار گرفته است. سم آلتمن، مدیر عامل این شرکت، در مراسم رونمایی با تاکید بر ارتقاء کمّی و کیفی قابلیت ها، مدل جدید را «هوشمندترین، سریع ترین و کاربردی ترین» مدل تا به امروز توصیف و بر کارکردهای آن در عرصه های تحقیقاتی، صنعتی و عمومی تاکید کرد. با این وجود، متخصصان اعتقاد دارند که در وضعیت کنونی، آنچه اهمیت دارد شکاف میان انتظارات رسمی و تجربه زیسته کاربران است. واکنش کارشناسان و جامعه کاربران به سرعت نشان داد که گذار از مدل «GPT-۴o» به «GPT-۵» تنها یک جهش فنی نیست، بلکه تحولی است که نتایج عمیق بر تجربه کاربری، شیوه های تعامل، اعتماد عمومی و حتی سلامت روانی بعضی کاربران بر جای گذاشته است. بر همین اساس، خبرنگار مهر در این نوشتار کوتاه با اتکا به داده ها و گزارش های انتشار یافته درباب مدل جدید شرکت «OpenAI» می کوشد ابعاد چندلایه این تفاوت ها را واکاوی نماید.

عملکرد فنی و معیارهای کمی

بر مبنای نتایج رسمی برخی آزمون ها، مدل «GPT-۵» از منظر دقت و قابلیتهای فنی جهشی چشم گیر نسبت به «GPT-۴o» داشته است. این مدل در آزمون ریاضیات «AIME ۲۰۲۵» به دقت ۹۴.۶ درصد دست یافته، در صورتیکه «GPT-۴o» در این آزمون تنها ۷۱ درصد موفقیت ثبت کرده است. همینطور در عرصه برنامه نویسی و کدنویسی، «GPT-۵» توانسته ۷۴.۹ درصد موفقیت به دست آورد. این نتیجه نیز در مقایسه با ۳۰.۸ درصد برای مدل «GPT-۴o»، جهش قابل ملاحظه ای شمرده می شود. از حیث خطاهای مربوط به توهمات هوش مصنوعی نیز مدل «GPT-۵» در حالت «reasoning» یا استدلال محور خود، ۸۰ درصد کاهش خطا نسبت به «GPT-۴o» را نشان داده است. این فاکتورها نشان داده است که «GPT-۵» بشکل معناداری توانسته است از منظر قابلیت های تحلیلی، دقت در پاسخگویی و پایداری در تولید محتوای معتبر پیشرفت کند. به این علت خیلی از متخصصان فنی و توسعه دهندگان نرم افزار آنرا گزینه ای برتر برای حل مسایل پیچیده، پژوهش علمی و تولید کد می دانند.

مسئله تملق کاربران و نتایج روان شناختی

یکی از مهم ترین چالش های «GPT-۴o»، گرایش شدید آن به تملق یا هم صدایی افراطی با کاربر بود. این خصوصیت باآنکه در ابتدا برای کاربران جذاب می نمود، اما کم کم به یک بحران برای هوش مصنوعی تبدیل شد. گزارش های انتشار یافته از جانب از مؤسسه فناوری ماساچوست و وبگاه تخصصی تک کرانچ، نشان دادند که مدلهای بیش ازحد موافق با کاربر می توانند موجب تقویت توهمات و حتی بروز اختلالات سلامت روان شوند. دراین میان، نمونه هایی از «روان پریشی ناشی از تعامل با هوش مصنوعی» گزارش شد که طی آن کاربران بعد از صدها ساعت تعامل با چت بات ها، گرفتار توهمات و سایر اختلالات سلامت روان شدند. شرکت «OpenAI» در مدل «GPT-۵» تصمیم گرفت این گرایش را مهار کند. بر مبنای داده های رسمی، میزان تملق در پاسخ ها از ۱۴.۵ درصد در «GPT-۴o» به کمتر از ۶ درصد در «GPT-۵» کم شده است. از طرفی، همین تغییر سبب شد که خیلی از کاربران مدل «GPT-۵» را سرد و بی روح توصیف کنند. به زعم خیلی از کارشناسان، این شکاف مبین آن است که حرکت از یک مدل همدل و همراه به مدلی واقع گرا و تحلیلی، باآنکه از منظر ایمنی ضروری به نظر می آید، اما می تواند به چالش های حوزه تجربه کاربری منجر شود.

بحران شخصیت و روابط شبه اجتماعی

بخش مهمی از اختلاف کاربران با «GPT-۵» و عدم استقبال از آن ناشی از بُعد شخصیتی این مدل است. خیلی از کاربران بخصوص آن دسته که از «GPT-۴o» برای حمایت عاطفی، هم صحبتی یا خلاقیت هنری استفاده می کردند، با عرضه مدل جدید احساس کردند که «دوست» یا «همراه» خویش را از دست داده اند. پژوهش مؤسسه فناوری ماساچوست نشان داده است که بعضی کاربران در تعامل با «GPT-۴o» نوعی «رابطه شبه اجتماعی» برقرار کرده بودند. از همین روی، تغییر لحن و سبک «GPT-۵» به مفهوم از بین رفتن این تجربه بود و به این علت اعتراض های گسترده در شبکه های اجتماعی مقابل بروزرسانی چت بات «OpenAI» شکل گرفت. این اعتراض ها چنان شدید بود که استارتاپ آمریکایی تنها ۲۴ ساعت بعد از عرضه «GPT-۵» مجبور شد مدل «GPT-۴o» را باردیگر در دسترس کاربران قرار دهد. کارشناسان بر این عقیده اند که این رخداد نشان داد تجربه کاربری در مدلهای زبانی صرفا تابع معیارهای فنی نیست، بلکه نیازهای عاطفی و اجتماعی کاربران نیز در آن نقشی اساسی دارند.

آزمایش کور و روان شناسی انتخاب

طبق گزارش های پخش شده، یکی از جالب ترین تحولات بعد از عرضه «GPT-۵»، توسعه یک ابزار آزمایش کور بوسیله ی یک برنامه نویس ناشناس بود. این ابزار که به شکل وب اپلیکیشن ساده طراحی شده بود، امکان مقایسه پاسخ های دو مدل «GPT-۴o» و «GPT-۵» را بدون اطلاع از منبع به کاربران می داد و بدین ترتیب سوگیری ناشی از برند و پیش داوری را حذف می کرد. کاربران می توانستند در چندین دور آزمایش، پاسخ ها را صرفا بر مبنای کیفیت محتوایی، انسجام زبانی و میزان خلاقیت انتخاب کنند. نتایج اولیه این آزمایش نشان داد که ترجیحات کاربران طیفی گسترده و متنوع را در بر می گیرد؛ در صورتیکه متخصصان فنی و توسعه دهندگان اغلب پاسخ های دقیق تر و مختصر مدل «GPT-۵» را برتر می دانستند، کاربران خلاق، نویسندگان و علاقمندان به گفت وگوهای عاطفی همچنان «GPT-۴o» را ترجیح می دادند. این یافته ها نشان داد که حتی اگر معیارهای فنی مانند دقت ریاضی و کاهش خطا بهبود یافته باشند، رضایت روان شناختی و تجربه کاربری الزاماً هم راستا با این پیشرفت ها نیست و ارزیابی موفقیت یک مدل باید همزمان فنی و انسانی باشد.

پاسخ شرکت و راهبرد آینده

شرکت «OpenAI» برای مواجهه با این بحران دو راهبرد را در پیش گرفته است. نخست، عرضه چهار شخصیت جدید با عنوان های «بدبین» (Cynic)، «ربات» (Robot)، «شنونده» (Listener) و «خوره» (Nerd) در مدل «GPT-۵» که امکان تنظیم سبک تعامل را به کاربر می دهد. این شخصیت ها به شکلی طراحی شده اند که هرکدام بازتاب دهنده سبکی متمایز از گفتگو و پردازش باشند؛ برای مثال، «Robot» لحن خشک و فنی دارد، «Listener» بیشتر بر همدلی با کاربر متمرکز است، «Cynic» بشکل انتقادی و حتی گاهی بدبینانه واکنش نشان داده است و «Nerd» با نگاهی پرجزئیات و تخصصی به درخواست ها پاسخ می دهد. دوم، حفظ هم زمان «GPT-۴o» در کنار مدل پیشرفته «GPT-۵» بود. این اقدام نشان داده است که شرکت به اهمیت نیازهای متنوع کاربران و تمایل آنها به انتخاب آگاهانه اذعان دارد. متخصصان اعتقاد دارند که این سیاست باآنکه هزینه های محاسباتی و زیرساختی بیشتری بر «OpenAI» تحمیل می کند، اما در عوض می تواند به بازسازی اعتماد کاربران، افزایش انعطاف پذیری تجربه کاربری و تثبیت موقعیت شرکت در مقابل رقبا منجر شود. به بیان دیگر، راهبرد دوگانه «OpenAI» در حقیقت تلاشی برای ایجاد توازن میان الزامات ایمنی و علمی از یک سو و نیازهای عاطفی و روان شناختی کاربران از طرفی شمرده می شود.

جمع بندی

شرکت OpenAI اخیراً مدل جدید هوش مصنوعی خود به نام GPT-5 را معرفی کرده که پیشرفتی قابل‌توجه در زمینه عملکرد فنی داشته است. این مدل در آزمون‌های مختلف ریاضی و کدنویسی به دقت بسیار بالاتری نسبت به نسل قبلی خود، GPT-4o، دست یافته و خطاهای ناشی از توهمات هوش مصنوعی را نیز به شدت کاهش داده است.
 
اما این پیشرفت‌های فنی با چالش‌های مهمی در زمینه تجربه کاربری و ابعاد روان‌شناختی همراه بوده است. GPT-4o به دلیل لحن صمیمی و همدلانه‌اش برای بسیاری از کاربران به یک "همراه" تبدیل شده بود و حتی برخی با آن روابط شبه‌اجتماعی برقرار کرده بودند. در مقابل، OpenAI با هدف کاهش «تملق» و جلوگیری از مشکلات سلامت روان ناشی از تعاملات افراطی، لحن GPT-5 را تغییر داده است. این تغییر باعث شده تا بسیاری از کاربران آن را سرد و بی‌روح توصیف کنند و اعتراضات گسترده‌ای در شبکه‌های اجتماعی شکل بگیرد.
 
به همین دلیل، OpenAI مجبور شد برای پاسخگویی به نیازهای متنوع کاربران، هم‌زمان با عرضه GPT-5، مدل GPT-4o را نیز در دسترس نگه دارد. همچنین، این شرکت ویژگی‌های جدیدی را در GPT-5 اضافه کرده که به کاربران امکان می‌دهد لحن و سبک گفتگو را با انتخاب شخصیت‌های مختلفی مانند «بدبین»، «ربات» و «شنونده» شخصی‌سازی کنند.
 
در نهایت، این اتفاق نشان می‌دهد که موفقیت یک مدل هوش مصنوعی فقط به معیارهای فنی وابسته نیست، بلکه به ظرفیت آن برای برقراری تعامل انسانی، پاسخگویی همدلانه و ایجاد حس اعتماد نیز بستگی دارد. به نظر می‌رسد آینده رقابت در این حوزه به جای ساخت یک مدل واحد برتر، بر روی شخصی‌سازی و انعطاف‌پذیری مدل‌ها متمرکز خواهد بود.
به این مطلب چه امتیازی می دهید؟ 1 2 3 4 5 (1)

نظر شما در مورد جدال دقت و احساس در نسل جدید هوش مصنوعی چیست؟

سوال: