مقدمه
سوشال لیسنینگ چیست؟ چرا یادگیری آن اهمیت دارد.
شاید ۱۰۰ سال قبل، اگر کسی به شما میگفت که مردمان آینده، بیش از ۷۰ درصد زمان خود را صرف استفاده از یک قطعهی ۲۳ سانتیمتری در ۱۵ سانتی متری، به اسم موبایل میکنند. شما را هم همانند گالیله، برای محاکمه به کلیسا میبردند تا توبه کنید. اما امروزه این واقعیت بر هیچکس پوشیده نیست
بدون گوشیهای هوشمند، اینترنت همراه و البته سوشالمدیا، تصور زندگی در این عصر برای انسان، بی معنی و حوصله سربر است.
ما روزانه اکثر وقت خود را درشبکههای اجتماعی مثل فیسبوک، اینستاگرام، ایکس (توییتر)، لینکدین و.. میگذرانیم و میلیونها حرف نهفته را به وسیله داده، در قالب لایک، کامنت، پست، شیرکردن و استوری و… منتقل میکنیم. سوال اصلی اینجا مطرح میشود که چگونه میتوانیم به مفهوم واقعی و پیامهای اصلی این کارها پی ببریم؟ از کجا بفهمیم که لایک کردن پستی در اینستاگرام بهخاط این است که محتوا مفید و آموزنده بوده یا این محتوا کلیپی خندهدار از طنزپردازان معروف ایرانی است؟
سوشال لیسنینگ، با هدف تحلیل و پایش داده در شبکههای اجتماعی، به ما کمک میکند تا به مفاهیم، اهداف و حرفای واقعی که در پس محتواهای شبکههای اجتماعی تولید میشود پی ببریم. اما اینکار چگونه انجام میشود؟
مهتا برای نجام سوشال لیسنینگ، به کمک توسعهی بیش از ۲۰ ماژول هوش مصنوعی اینکار را برای ما راحت کرده است. در این مقاله میخواهیم بدانیم که این ماژولها چگونه به ما کمک میکنند و چه کاربردی دارند.
لیست تمامی ماژولهای هوش مصنوعی مهتا که در حال حاضر در پنل مهتا استفاده میشود در اینجا آورده شده است. در بخش اول این مقاله به معرفی ۵ مورد اول ازین ماژولها میپردازیم.
- وضعیت اخلاقی (Offensive)
- احساسات Sentiment
- هیجان Emotion
- موجودیت نامدار (Named Entity)
- قطبیت (Polarity)
- موضوع گیری Stance
- رخداد Event-
- کنش گفتاری – Speech act
- رویکرد -Approach
- نوع جمله- Question
- یکپارچگی
- تشخیص هرزنامه -Advertisement Detection
- تشخیص کنایه – Irony Detection
- تشخیص ربات – Bot Detection
- تشخیص سن- Age Classification
- تشخیص وضعیت تاهل- Marital Detection
- تشخیص مذهب – Religion Detection
- تشخیص جنسیت- Gender Detection
- تشخیص شخصیت- Personality Detection
- علاقمندی کاربر- User Interests
- زبان کاربر- User Language
- مشارکت – Engagement
- تاثیرگذاری- Impression
- امتیاز تاثیرگذاری- Influence Score
- رشد هشتگ یا موجودیت نامدار – Growth of Hashtags/ Named Entity
برای آموزش و یادگیری در مورد ۵ ماژول اول هوش مصنوعی مهتا، بخش اول این مقاله آموزشی را بخوانید.
۱- وضعیت اخلاقیOffensive
با کمک هوش مصنوعی مشخص میشود لحن نویسنده در بیان متن اخلاقی است یا خیر.
به عنوان مثال جمله «احمق من گریه نمیکنم عینک آفتابی یادم رفته چشامم به آفتاب حساسه»، یک جمله غیر اخلاقی است.
۲- احساسات Sentiment
بیانگر احساس نویسنده به کلیت متن است. هوش مصنوعی این احساس را در قالب دستههای مثبت، منفی و یا خنثی تحلیل میکند. در زیر برای درک بهتر هر یک از این احساسات مثالهایی ذکر شده است:
متنهایی مثبت هستند که نویسنده احساس مثبت را در آن بیان کرده است.
برای مثال:
جمله «حالا همشونم که اینجوری نیستن. من خودم از نصف اسنپ و تپسیهایی که گرفتم راضی بودم.» دارای احساسات مثبت است.
متنهایی منفی هستند که نویسنده احساس منفی را در آن بیان کرده است.
برای مثال:
جمله «این ایرانیای خارج نشین رو میبینم، میلم به مهاجرت کم میشه.» دارای احساسات منفی است.
متنهایی خنثی هستند که نویسنده هیچ احساسی در بیان آنان اظهار نکرده است و غالباً خبری یا سوالی است و نمیتوان از متن احساسی را درک کرد.
برای مثال:
جمله «من مسابقهی فوتبال دیشب رو دیدم.» دارای احساسات خنثی است.
نکتهی مهم در این قسمت، اینست که احتمال دارد احساس نویسنده در متن مثبت باشد اما نسبت به یک موجودیت ابراز احساس منفی کرده باشد. این مورد در ماژول NER، مورد بررسی قرار میگیرد.
۳- هیجان Emotion
هر متنی میتواند بدون هیجان و یا حداکثر شامل دو نوع هیجان از انواع زیر باشد:
“تنفر و انزجار”، “خشم و عصبانیت”، “ترس و وحشت”، “غم و ناراحتی”، “شگفتی و حیرت”، “تایید و تحسین”، “احتیاط و توجه”، “عشق و دوست داشتن”، “خنده و شادی” و یا “بدون هیجان” باشد.
و ما با کمک هوش مصنوعی به دنبال شناخت این واکنشهای عاطفی موجود در متن هستیم که نویسنده میخواهد آنها را بیان کند.
در زیر برای درک بهتر هر یک از هیجانها مثالهایی ذکر شده است:
مثال ۱: شما از معدود کسایی هستی که هم حافظهی خوبی داری هم خیلی بامعرفتی.
در این متن گوینده شخصی را تحسین میکند. پس این متن دارای هیجان تایید و تحسین است.
مثال ۲: ولی من میترسم که باقیماندهی زندگیام را در خاموش سپری کنم و نتوانم به اهداف خود دست یابم.
در این متن نویسنده هم نسبت به زندگی خود ترسی دارد و هم غمگین است که نمیتواند به اهدافش دست یابد، پس هیجان این متن غم و ناراحتی و ترس و حشت است.
مثال ۳: هر وقت یکی ازم میپرسه خوبی نمیتونم ریسک کنم بگم نه نیستم چون حتما میپرسه چرا و من واقعا تعریفی برای حال بدم ندارم حتی خودمم نمیدونم چمه نمیدونم چرا بدم فقط میدونم خوب نیستم.
نویسنده در این متن از غم و ناراحتی سخن میگوید و عواطف این متن غم و ناراحتی است.
مثال ۴: مواظب خودتم باش ایشالا همیشه سلامت باشی.
این متن دارای هیجان احتیاط و توجه است. نویسنده علاقه خود را به شنونده این متن بیان کرد است. از طرفی برای فرد مقابل آرزوی (امید) سلامتی دارد.
پس هیجان «خنده و شادی» را در کنار «احتیاط و توجه» در نظر میگیریم.
مثال ۵: با همین کارهاست که همه رو از خودشون روندن
این متن انزجار نویسنده رو نشان میدهد. پس هیجان این متن «تنفر و انزجار» است.
مثال ۶: هیچی نگو. نمیخوام هیچی دیگه بشنوم. حتی یک کلمه!
«خشم و عصبانیت» نویسنده در متن به خوبی مشهود است.
مثال ۷: نمیدونم چرا یه سری با عجله میخونن و کامل نه!
نویسنده در این متن تعجب خود را بروز میدهد. پس برچسب «شگفتی و حیرت» را برای این متن در نظر میگیریم.
مثال۸: علیرضا رئیسی معاون وزارت بهداشت امروز گفت تا دو هفته آینده واکسیناسیون افراد بالای ۱۸سال تمام خواهد شد.
در این متن هیچ کدام از عواطف به روشنی و به اندازه ای مطرح نشده که بتوان برچسبی در نظر گرفت. بنابراین هیجان این متن «بدون هیجان» میباشد.
۴- موجودیت نامدار (Named Entity)
تعیین موجودیتهای نامدار (NER)، یک رویکرد در پردازش زبان طبیعی (NLP) است که گاهی اوقات از آن بهعنوان «شناسایی موجودیت» یا «استخراج موجودیت» یاد میشود. ما در مهتا بهطور خودکار / از طریق هوش مصنوعی موجودیتهای نامگذاری شده در یک متن را شناسایی میکنیم و آنها را در دستههای از پیش تعیینشده گروهبندی میکنیم. موجودیتها شامل:
«اسامی اشخاص»، «شهر کشور استان»، «سازمان»، «تاریخ»، «سمت»، «امکانات»، «مکان»، «گروههای ملی مذهبی سیاسی»، «محصولات»، «رخداد»، «زمان»، «واحد پول» و «تاریخ» میباشد.
با شناسایی موجودیت نامگذاری شده، میتوان از آن برای جمعآوری دادههای مهم برای پایگاه داده یا استخراج اطلاعات حیاتی برای درک اینکه یک سند در مورد چیست استفاده کرد. NER سنگ بنایی است که یک سیستم هوش مصنوعی برای تجزیهوتحلیل متن از نظر معنایی و احساسات نسبی به آن وابسته است. هر موجودیت نامدار، خروجی تجزیهوتحلیل عبارتهای موجود در متن است. در زیر برای هر یک از موجودیتها مثالهایی ذکر شده است:
شخص (Person)
اسم شخص حقیقی مانند: «ایلان ماسک» یا تخیلی مانند: «جناب خان» یا «بَتمن» لازم به ذکر است که فقط اسمهای خاص با توجه به جمله موجودیت محسوب میشوند به دو مثال زیر توجه کنید:
آقای پارسا آمدند.
آن مرد پارسا آمد.
در جمله اول پارسا موجودیت است ولی در جمله دوم موجودیتی وجود ندارد.
سازمان (Organization)
تمامی سازمانها، آژانسها، موسسات، حکومتها و دولتها جزو این دسته هستند. انواع سازمانها به شرح زیر است:
- سازمانهایدولتی مانند سفارت خانهها
- سازمانهای تجاری مانند شرکت ال جی
- سازمانهای تحصیلاتی، مانند داشنگاه تهران و مدرسه شهید بهشتی
- رسانهها مانند پرس تی وی یا VOA
- سازمانهای مذهبی مانند واتیکان
- سازمانهای علمی یا پزشکی مانند سازمان تحقیقات هستهای
- سازمانهای ورزشی مانندفدراسیون فوتبال ایران
- سازمانهای غیردولتی و سایر سازمانها مانند یونیسف، صلیب سرخ و…
برای مثال جمله «دیجیکالا جنس شکسته آورده بود و تلفنی گفتیم و پولمون رو برگردوند.» دارای موجودیت «دیجیکالا» میباشد که از نوع سازمان است.
گروههای ملی مذهبی و سیاسی (GSE)
گروهی ملی، مذهبی یا سیاسی (مسلمان، کاتولیک، ایرانی، تهرانی، طالب یا طالبان، اصلاح طلب، اصول گرا و…) به موجودیتها نسبت داده میشود. در ادامه مثالهایی ذکر شده است:
- هنر نزد ایرانیان است و بس
- خبر خوش برای تهرانیها … تخفیف در راه است.
- طالب و پشتون باید بتوانند با هم سازش کنند.
- مردم اسکاندیناوی خیلی کم از نور خورشید بهره میبرند.
- ملت ایران همیشه پیروز است.
- دهه شصتیها خیلی تلاش میکنند.
ساعت (TIME)
تمامی ساعات و بازههای زمانی کمتر از یک روز جزو این دسته هستند. برای مثال:
مواردی چون «امشب، دیشب، صبح امروز، امروز ۵ عصر، ۱۲ بامداد ۱۳ فروردین و…» زمان هستند.
پول (Money)
- ایران یک میلیون به عراق کمک کرد.
با این که ارز مالی در جمله دیده نمیشود اما از مفهموم آن برداشت میشود که که میلیون تومان / دلار. پس «یک ملیون» در اینجا پول است.
- ارزش بیتکوین در حال افزایش است.
تاریخ (DATE):
تمامی تاریخها یا بازههای زمانی بلند مدت جزو این دسته هستند. مانند:
شنبه ۲۱ اردیبهشت، فروردین ۱۴۰۰، دهه شصت، امروز، دیروز و… تاریخ هستند.
مواردی چون «هر روز»، «۲۰ سال» که دقیقا مشخص نیستند چه تاریخی هستند، موجودیت نیست.
امکانات (FACILITY):
تمامی امکانات همچون ساختمانها، مساجد، زیارتگاهها، اماکن گردشگری و تفریحی ورزشی، پلها، تونلها و… که ساخته دست انساناند جزو این دسته هستند. برای مثال:
- نمایشگاه کتاب در مصلای بزرگ تهران دایر است.
- از وقتی آزادراه تهران-قزوین راه افتاده خیلی رفت و آمد راحت شده.
- موزه دفاع مقدس در ساعات اداری آمده پذیرایی از مهمانان داخلی و خارجی است.
محصولات (PRODUCT):
تمامی ماشینها، کتابها، سورههای قرآن، خوراکها، وسایل خانه، صنایع دستی، اسلحه و… جزو این دسته هستند. در مورد کالاها باید در نظر داشت که برند محصول باید مشخص باشد. در ادامه مثالهایی ذکر شده است:
- برای انتشار میتونید در توییتر، توییت یا ریتوییت کنید.
- همون سمند که میگی رو بعنوان خودروی ملی تولید کردن.
- آدم واکسن بزنه بمیره بهتر از اینه کرونا بگیره.
شهر کشور استان (GPE):
تمامی قارهها، کشورها، استانها، شهرها، ایالتها، روستاها، و… جزو این دسته هستند. در ادامه مثالهایی ذکر شده است:
- شهر برلین در آلمان به شدت زیباست.
- تهران امروز جزو پیشرفتهترین شهرهای دنیاست.
موقعیت/مکان (Location):
تمامی موقعیتهای جغرافیایی همچون کوهها، دریاها، جنگل، خیابانها، کوچهها و… جزو این دسته هستند. تمامی راههای ارتباطی همچون بزرگراه، جاده، خیابان، اتوبان، کوچه، بن بست، و میدان و… به جز تونل و پل موقعیتاند. تونل و پل جزو امکانات محسوب میشوند. در ادامه مثالهایی ذکر شده است:
- خیابان آزادی بسیار زیباست.
- کوه دماوند در شمال تهران
- خیابان مطهری همیشه ترافیک داره.
رخداد (Event):
تمامی جنگها، حوادث طبیعی همچون زلزله و طوفان، وقایع تاریخی، مسابقات ورزشی و… جزو این دسته هستند. مواردی که ذکر شد باید دارای تاریخ مشخص باشند. بهعبارت دیگر اتفاقی که در گذشته اتفاق افتاده و یکتا است. در ادامه مثال¬هایی ذکر شده است:
- ایران در جام جهانی ۲۰۱۸ درخشید.
- لیگ جهانی والیبال بسیار هیجانانگیز است.
- واقعه کربلا همواره دل عاشقان را به درد میآورد.
۵- قطبیت (Polarity)
هر متن نسبت به موجودیتهایش قطبیت دارد که این قطبیت بیانگر جهتگیری نویسنده راجع به آنهاست. هوش مصنوعی این جهتگیری را در قالب دستههای مثبت، منفی و یا خنثی نسبت به هر موجودیت تحلیل میکند. قطبیت متن با تحلیل احساسات تفاوتهایی دارد. در تحلیل احساسات کلیات یک جمله مورد بررسی قرار میگیرد، اما در قطبیت، نظر نسبت به یک موجودیت مورد بررسی قرار میگیرد. به عنوان مثال:
- “احمد صالح: نباید بار تنشهای منطقهای و بینالمللی بر دوش عراقیها تحمیل شود”
- “محمود عباس: هرگز نمیپذیریم حماس گروه تروریستی خوانده شود”
در این دو جمله نظرات مثبتی نسبت به عراقیها و حماس بیان شده است ولی نسبت به احمد صالح یا محمود عباس نظر خاصی وجود ندارد. در این حالت، قطبیت احمد صالح و محمود عباس خنثی و قطبیت عراقیها و حماس مثبت خواهدشد.
در ادامه نکات و مثالهایی از این دست برای فهم بهتر آورده شده است:
- قطبیت یک متن میبایست به صراحت ذکر شده باشد و نیازی به استنتاج متن و استخراج ذهنیت نگارنده متن نیست. در صورتی که در یک متن شواهد واضحی از مثبت یا منفی بودن آن از منظر موجودیت یافت نشد، قطبیت آن خنثی در نظر گرفته میشود. در متن ممکن است موجودیتهای متفاوت وجود داشته باشند، لذا قطبیت هر موجودیت میبایست با توجه به وضعیت همان موجودیت در متن بررسی میگردد. برای راحتی کار میتوان خود را بجای آن موجودیت قرار داده و بررسی شود که آیا این متن به نفع موجودیت، به ضرر موجودیت و یا خنثی نسبت به موجودیت است
برای مثال:
“وای، دوباره سایپا پراید را گران کرد”: قطبیت منفی نسبت به سایپا «سازمان» و قطبیت منفی نسبت به پراید “محصول”
“نماد سایپا به زودی بازگشایی خواهد شد”: قطبیت مثبت نسبت به سایپا “سازمان”
- چنانچه در متن کلماتی همچون اولین بار، رونمایی، افتتاحیه، بهرهبرداری و یا کلماتی از این دست نسبت به موجودیت اعلام شده و یا زیرمجموعهای از آن بیان شد، متن دارای قطبیت مثبت خواهد بود.
برای مثال:
“ایران خودرو برای اولین بار در بورس ایران اپلیکیشن سهام معرفی کرد” قطبیت مثبت نسبت به موجودیت “ایران خودرو”
- ارقام ذکر شده و بزرگی و کوچکی آن ارقام را در تعیین قطبیت دخالت داده نمیشوند.
برای مثال:
“گمرک جمهوری اسلامی: حقوق و عوارض گمرکی تلفن همراه مسافری ۱۶ درصد است”: قطبیت خنثی نسبت به موجودیت “عوارض گمرکی تلفن همراه مسافری”
- اعلام سود یک شرکت که به عنوان موجودیت، مشخص شده است، دارای بار مثبت است.
برای مثال:
«اختصاص ۴۸ ریال سود به ازای هر سهم گروه صنعتی سپاهان طی ۹ ماه»: قطبیت مثبت نسبت به موجودیت “سهم گروه صنعتی سپاهان”
- اگر در متن، موجودیت مشخص شده تکذیبهای نسبت به یک خبر دروغ منشر کرد، قطبیت متن نسبت به آن موجودیت مثبت خواهد بود.
برای مثال:
«گمرک صراحتا قاچاق خودرو را تکذیب کرد + توضیحات»: قطبیت مثبت نسبت به موجودیت گمرک
- عقد تفاهمنامه، ادغام، و یا موضوعاتی از این دست میان موجودیت مشخص شده با سایر موجودیتها دارای بار مثبت نسبت به موجودیت مشخص شده است.
برای مثال:
“از امروز اجرایی شد؛ آغاز ادغام موسسه ثامن با بانک انصار”: قطبیت مثبت نسبت به موجودیت بانک انصار و موسسه ثامن
۶- این ماژولها به کسبوکارهای کوچک و بزرگ، چگونه کمک میکند؟
بدیهیست که این ماژولها به تنهایی کار ساز نیستند و برای انجام سوشال لیسنیگ شما باید به روش درست و صحیح انجام اینکار مسلط باشید. برای نمونه و آشنایی بیشتر با این تحلیلها میتوانید مقالات نمونهموردی تحلیل برندها را ازینجا مطالعه کنید. اما از مهمترین نتایج این استفاده ازین ماژولها میتوان به موارد زیر به طور خلاصه اشاره کرد.
- میتوانیم احساسات کاربران سوشال مدیا را نسبت به محتواهای خود بفهمیم.
- میتوانیم هیجانات کاربران و مخاطبان خود را نسبت به برند خود رصد کنیم و برای بهبود وضعیت آن، استراتژیهای متنوعی طراحی کنیم.
- میتوانیم بفهمیم که جهتگیری کاربران نسبت به رقبا یا محصولات مشابه چیست؟
- و……