اگر در ایران راننده تاکسی کرایه را پس بزند و با لبخند بگوید: «این بار مهمان من باشید»، پذیرفتن این حرف خطای بزرگی است. همه میدانند باید دستکم دو یا سه بار بر پرداخت اصرار کنید تا در نهایت پول را بگیرد. این رفتوآمد کلامی که «تعارف» نام دارد، بخشی جدانشدنی از فرهنگ اجتماعی ماست. اما مدلهای هوش مصنوعی در فهم آن ناتواناند.
پژوهشی تازه نشان داده است که سامانههای هوش مصنوعی رایج تنها در حدود یکسوم موقعیتهای تعارف، رفتار درست را انتخاب میکنند، در حالی که خود فارسیزبانان بیش از ۸۰ درصد مواقع بهدرستی عمل میکنند. این شکاف حتی در پیشرفتهترین مدلها هم دیده میشود و نشان میدهد که این فناوریها با وجود تواناییهای بالا، از درک ظرافتهای فرهنگی ایرانیان بازمیمانند.
این تحقیق با معرفی شاخصی به نام «تعارفبنچ» برای نخستینبار میزان توانایی هوش مصنوعی در بازآفرینی این رسم اجتماعی را سنجیده است. نتایج نشان میدهد که این سامانهها اغلب به شیوه مستقیم و بیپرده غربی واکنش نشان میدهند و از درک رمزهای پنهان در گفتوگوهای ایرانی ناتواناند. پژوهشگران هشدار میدهند که چنین خطاهایی در موقعیتهای مهم میتواند به سوءتفاهم، خدشهدار شدن روابط و حتی تقویت کلیشههای نادرست منجر شود.
تعارف فقط یک رفتار ساده نیست، بلکه نظامی از ادب اجتماعی است که در آن گفتهها و نیتها همواره یکسان نیستند. رد کردن هدیه، اصرار بر پذیرایی، یا کماهمیت جلوه دادن داراییها، همه بخشهایی از این آیین هستند. برخی پژوهشگران آن را «کشتی کج مؤدبانه» توصیف کردهاند؛ جدالی ظریف میان اصرار و انکار که روابط روزمره ایرانیان را شکل میدهد.
اما حتی وقتی پاسخهای هوش مصنوعی مؤدبانه به نظر میرسند، باز هم مطابق انتظار ایرانیان نیستند. مثلاً در یک آزمایش، بیش از ۸۰ درصد پاسخها از نظر نرمافزارهای سنجش ادب «مودبانه» بودند، اما تنها حدود ۴۰ درصد آنها با قواعد تعارف همخوانی داشتند.
رایجترین خطاها شامل پذیرفتن پیشنهاد بدون رد اولیه، پاسخ مستقیم به تعریف («بله، خیلی زحمت کشیدم») به جای کمرنگ جلوه دادن آن («قابل ندارد»)، و یا درخواست مستقیم بدون مقدمه و تعارف بود. چنین پاسخهایی هرچند در نگاه غربی مؤدبانهاند، اما در فرهنگ ایرانی میتوانند نشانه خودستایی یا بیتوجهی به آداب تلقی شوند.
تأثیر زبان بر درک تعارف
یکی از یافتههای مهم این بود که وقتی این سامانهها به زبان فارسی پاسخ میدهند، عملکردشان بسیار بهتر میشود. برای نمونه، دقت یکی از مدلها از حدود ۳۶ درصد در متن انگلیسی به نزدیک ۶۹ درصد در متن فارسی افزایش یافت. همین موضوع نشان میدهد که دادههای فارسی الگوهایی در اختیار مدلها میگذارند که به درک بهتر رمز و راز تعارف کمک میکند.
در آزمایشهای انسانی، فارسیزبانان بومی حدود ۸۲ درصد موفق بودند. ایرانیان مهاجر که فارسی را در خانه شنیدهاند اما تحصیلشان به زبان دیگر بوده، ۶۰ درصد موفق شدند. غیرایرانیها تنها حدود ۴۲ درصد درست عمل کردند؛ تقریباً همسطح مدلهای پایه.
جنسیت در پاسخهای هوش مصنوعی
پژوهش همچنین نشان داد که این سامانهها در پاسخ به زنان نسبت به مردان عملکرد بهتری داشتند. مثلاً در یکی از مدلها دقت در موقعیتهای مربوط به زنان حدود ۴۴ درصد بود، اما برای مردان تنها ۳۱ درصد. علاوه بر این، پاسخها گاهی همراه با کلیشههای جنسیتی بودند؛ مانند این باور که «مرد باید هزینه کند» یا «زن نباید تنها بماند». این موضوع نشان میدهد که دادههای آموزشی غربی و کلیشههای رایج به شکل ناخودآگاه در خروجی مدلها بازتاب پیدا میکند.
آموزش تعارف به هوش مصنوعی
خبر امیدوارکننده آن است که پژوهشگران توانستند با آموزش هدفمند، عملکرد این سامانهها را به شکل چشمگیری ارتقا دهند. یکی از روشها باعث شد دقت یک مدل تقریباً دو برابر شود و از ۳۷ درصد به نزدیک ۸۰ درصد برسد. حتی آموزش ساده با نمونههای محدود یا روشهای تحت نظارت نیز تا ۲۰ درصد بهبود ایجاد کردند.
این دستاورد نشان میدهد که میتوان نه تنها تعارف، بلکه ظرافتهای فرهنگی دیگر جوامع را هم به این فناوری آموخت؛ بهویژه فرهنگهایی که در دادههای آموزشی غالب جهان کمتر بازنمایی شدهاند.
جمعبندی
این پژوهش فقط درباره تعارف نیست؛ بلکه نشان میدهد هوش مصنوعی بدون شناخت بافت فرهنگی نمیتواند معنای واقعی گفتوگوها را درک کند. همانطور که یک غیرایرانی ممکن است «اصرار مؤدبانه» را تهدید تلقی کند، یک مدل هوش مصنوعی هم ممکن است معنای «نه» و «بله» را در تعارف بهدرستی تشخیص ندهد.
آینده جهانی این فناوری زمانی تحقق مییابد که بتواند تنوع فرهنگی را درک کرده و بازنمایی کند؛ نه آنکه تنها به الگوهای ارتباطی غربی تکیه داشته باشد.