معرفی ماژول‌های هوش مصنوعی  و سوشال لیسنینگ مهتا – بخش اول

زمان مطالعه: ۸ دقیقه

مقدمه

سوشال لیسنینگ چیست؟ چرا یادگیری آن اهمیت دارد.

شاید ۱۰۰ سال قبل، اگر کسی به شما می‌گفت که مردمان آینده، بیش از ۷۰ درصد زمان خود را صرف استفاده از یک قطعه‌ی ۲۳ سانتی‌متری در ۱۵ سانتی متری، به اسم موبایل می‌کنند. شما را هم همانند گالیله، برای محاکمه به کلیسا میبردند تا توبه کنید. اما امروزه این واقعیت بر هیچکس پوشیده نیست

بدون گوشی‌های هوشمند، اینترنت همراه و البته سوشال‌مدیا، تصور زندگی در این عصر برای انسان، بی معنی و حوصله سربر است.

ما روزانه اکثر وقت خود را درشبکه‌های اجتماعی مثل فیسبوک، اینستاگرام، ایکس (توییتر)، لینکدین و.. میگذرانیم و میلیون‌ها حرف نهفته را به وسیله‌ داده، در قالب لایک، کامنت، پست، شیرکردن و استوری و… منتقل می‌کنیم. سوال اصلی اینجا مطرح می‌شود که چگونه می‌توانیم به مفهوم واقعی و پیام‌های اصلی این کارها پی ببریم؟ از کجا بفهمیم که لایک کردن پستی در اینستاگرام به‌خاط این است که محتوا مفید و آموزنده بوده یا این محتوا کلیپی خنده‌دار از طنزپردازان معروف ایرانی است؟

سوشال لیسنینگ، با هدف تحلیل و پایش داده در شبکه‌های اجتماعی، به ما کمک می‌کند تا به مفاهیم، اهداف و حرفای واقعی که در پس محتواهای شبکه‌های اجتماعی تولید می‌شود پی ببریم. اما اینکار چگونه انجام می‌شود؟

مهتا برای نجام سوشال لیسنینگ، به کمک توسعه‌ی بیش از ۲۰ ماژول هوش مصنوعی اینکار را برای ما راحت کرده است. در این مقاله می‌خواهیم بدانیم که این ماژول‌ها چگونه به ما کمک می‌کنند و چه کاربردی دارند.

لیست تمامی ماژول‌های هوش مصنوعی مهتا که در حال حاضر در پنل مهتا استفاده می‌شود در اینجا آورده شده است. در بخش اول این مقاله به معرفی ۵ مورد اول ازین ماژول‌ها می‌پردازیم.

  • وضعیت اخلاقی (Offensive)
  • احساسات Sentiment
  • هیجان Emotion
  • موجودیت نامدار (Named Entity)
  • قطبیت (Polarity)
  • موضوع گیری Stance
  • رخداد Event-
  • کنش گفتاری – Speech act
  • رویکرد -Approach
  • نوع جمله- Question
  • یکپارچگی
  • تشخیص هرزنامه -Advertisement Detection
  • تشخیص کنایه – Irony Detection
  • تشخیص ربات – Bot Detection
  • تشخیص سن- Age Classification
  • تشخیص وضعیت تاهل- Marital Detection
  • تشخیص مذهب – Religion Detection
  • تشخیص جنسیت- Gender Detection
  • تشخیص شخصیت- Personality Detection
  • علاقمندی کاربر- User Interests
  • زبان کاربر- User Language
  • مشارکت – Engagement
  • تاثیرگذاری- Impression
  • امتیاز تاثیرگذاری- Influence Score
  • رشد هشتگ یا موجودیت نامدار – Growth of Hashtags/ Named Entity

برای آموزش و یادگیری در مورد ۵ ماژول اول هوش مصنوعی مهتا، بخش اول این مقاله آموزشی را بخوانید.

۱- وضعیت اخلاقیOffensive

با کمک هوش مصنوعی مشخص می‌شود لحن نویسنده در بیان متن اخلاقی است یا خیر.

به عنوان مثال جمله «احمق من گریه نمی‌کنم عینک آفتابی یادم رفته چشامم به آفتاب حساسه»، یک جمله غیر اخلاقی است.

۲- احساسات Sentiment

بیانگر احساس نویسنده به کلیت متن است. هوش مصنوعی این احساس را در قالب دسته‌های مثبت، منفی و یا خنثی تحلیل می‌کند. در زیر برای درک بهتر هر یک از این احساسات مثال‌هایی ذکر شده است:

متن‌هایی مثبت هستند که نویسنده احساس مثبت را در آن بیان کرده است.

برای مثال:

جمله «حالا همشونم که اینجوری نیستن. من خودم از نصف اسنپ و تپسی‌هایی که گرفتم راضی بودم.» دارای احساسات مثبت است.

 

متن‌هایی منفی هستند که نویسنده احساس منفی را در آن بیان کرده است.

برای مثال:

جمله «این ایرانیای خارج نشین رو میبینم، میلم به مهاجرت کم میشه.» دارای احساسات منفی است.

 

متن‌هایی خنثی هستند که نویسنده هیچ احساسی در بیان آنان اظهار نکرده است و غالباً خبری یا سوالی است و نمی‌توان از متن احساسی را درک کرد.

برای مثال:

جمله «من مسابقه‌ی فوتبال دیشب رو دیدم.» دارای احساسات خنثی است.

نکته‌ی مهم در این قسمت، اینست که احتمال دارد احساس نویسنده در متن مثبت باشد اما نسبت به یک موجودیت ابراز احساس منفی کرده باشد. این مورد در ماژول NER، مورد بررسی قرار می‌گیرد.

 ۳- هیجان Emotion

هر متنی می‌تواند بدون هیجان و یا حداکثر شامل دو نوع هیجان از انواع زیر باشد:

“تنفر و انزجار”، “خشم و عصبانیت”، “ترس و وحشت”، “غم و ناراحتی”، “شگفتی و حیرت”، “تایید و تحسین”، “احتیاط و توجه”، “عشق و دوست داشتن”، “خنده و شادی” و یا “بدون هیجان” باشد.

و ما با کمک هوش مصنوعی به دنبال شناخت این واکنش‌های عاطفی موجود در متن هستیم که نویسنده می‌خواهد آن‌ها را بیان کند.

در زیر برای درک بهتر هر یک از هیجان‌ها مثال‌هایی ذکر شده است:

 

مثال ۱: شما از معدود کسایی هستی که هم حافظهی خوبی داری هم خیلی بامعرفتی.

در این متن گوینده شخصی را تحسین می‌کند. پس این متن دارای هیجان تایید و تحسین است.

 

مثال ۲: ولی من می‌ترسم که باقیماندهی زندگی‌ام را در خاموش سپری کنم و نتوانم به اهداف خود دست یابم.

در این متن نویسنده هم نسبت به زندگی خود ترسی دارد و هم غمگین است که نمی‌تواند به اهدافش دست یابد، پس هیجان این متن غم و ناراحتی و ترس و حشت است.

 

مثال ۳: هر وقت یکی ازم میپرسه خوبی نمیتونم ریسک کنم بگم نه نیستم چون حتما میپرسه چرا و من واقعا تعریفی برای حال بدم ندارم حتی خودمم نمیدونم چمه نمیدونم چرا بدم فقط میدونم خوب نیستم.

نویسنده در این متن از غم و ناراحتی سخن می‌گوید و عواطف این متن غم و ناراحتی است.

 

مثال ۴: مواظب خودتم باش ایشالا همیشه سلامت باشی.

این متن دارای هیجان احتیاط و توجه است. نویسنده علاقه خود را به شنونده این متن بیان کرد است. از طرفی برای فرد مقابل آرزوی (امید) سلامتی دارد.

پس هیجان «خنده و شادی» را در کنار «احتیاط و توجه» در نظر می‌گیریم.

 

مثال ۵: با همین کارهاست که همه رو از خودشون روندن

این متن انزجار نویسنده رو نشان میدهد. پس هیجان این متن «تنفر و انزجار» است.

 

مثال ۶: هیچی نگو. نمیخوام هیچی دیگه بشنوم. حتی یک کلمه!

«خشم و عصبانیت» نویسنده در متن به خوبی مشهود است.

 

مثال ۷: نمیدونم چرا یه سری با عجله میخونن و کامل نه!

نویسنده در این متن تعجب خود را بروز می‌دهد. پس برچسب «شگفتی و حیرت» را برای این متن در نظر می‌گیریم.

 

مثال۸: علیرضا رئیسی معاون وزارت بهداشت امروز گفت تا دو هفته آینده واکسیناسیون افراد بالای ۱۸سال تمام خواهد شد.

در این متن هیچ کدام از عواطف به روشنی و به اندازه ای مطرح نشده که بتوان برچسبی در نظر گرفت. بنابراین هیجان این متن «بدون هیجان» می‌باشد.

۴- موجودیت نامدار (Named Entity)

تعیین موجودیت‌های نامدار (NER)، یک رویکرد در پردازش زبان طبیعی (NLP) است که گاهی اوقات از آن به‌عنوان «شناسایی موجودیت» یا «استخراج موجودیت» یاد می‌شود. ما در مهتا به‌طور خودکار / از طریق هوش مصنوعی موجودیت‌های نام‌گذاری شده در یک متن را شناسایی می‌کنیم و آن‌ها را در دسته‌های از پیش تعیین‌شده گروه‌بندی می‌کنیم. موجودیت‌ها شامل:
«اسامی اشخاص»، «شهر کشور استان»، «سازمان»، «تاریخ»، «سمت»، «امکانات»، «مکان»، «گروه‌های ملی مذهبی سیاسی»، «محصولات»، «رخداد»، «زمان»، «واحد پول» و «تاریخ» می‌باشد.
با شناسایی موجودیت نام‌گذاری شده، می‌توان از آن برای جمع‌آوری داده‌های مهم برای پایگاه داده یا استخراج اطلاعات حیاتی برای درک اینکه یک سند در مورد چیست استفاده کرد. NER سنگ بنایی است که یک سیستم هوش مصنوعی برای تجزیه‌وتحلیل متن از نظر معنایی و احساسات نسبی به آن وابسته است. هر موجودیت نامدار، خروجی تجزیه‌وتحلیل عبارت‌های موجود در متن است. در زیر برای هر یک از موجودیت‌ها مثال‌هایی ذکر شده است:

شخص (Person)
اسم شخص حقیقی مانند: «ایلان ماسک» یا تخیلی مانند: «جناب خان» یا «بَتمن» لازم به ذکر است که فقط اسم‌های خاص با توجه به جمله موجودیت محسوب می‌شوند به دو مثال زیر توجه کنید:
آقای پارسا آمدند.
آن مرد پارسا آمد.
در جمله اول پارسا موجودیت است ولی در جمله دوم موجودیتی وجود ندارد.

سازمان (Organization)
تمامی سازمان‌ها، آژانس‌ها، موسسات، حکومت‌ها و دولت‌ها جزو این دسته هستند. انواع سازمان‌ها به شرح زیر است:

  • سازمان‌های‌دولتی مانند سفارت خانه‌ها
  • سازمان‌های تجاری مانند شرکت ال جی
  • سازمان‌های تحصیلاتی، مانند داشنگاه تهران و مدرسه شهید بهشتی
  • رسانه‌ها مانند پرس تی وی یا VOA
  • سازمان‌های مذهبی مانند واتیکان
  • سازمان‌های علمی یا پزشکی مانند سازمان تحقیقات هسته‌ای
  • سازمان‌های ورزشی مانندفدراسیون فوتبال ایران
  • سازمان‌های غیردولتی و سایر سازمان‌ها مانند یونیسف، صلیب سرخ و…

برای مثال جمله «دیجیکالا جنس شکسته آورده بود و تلفنی گفتیم و پولمون رو برگردوند.» دارای موجودیت «دیجیکالا» می‌باشد که از نوع سازمان است.

گروه‌های ملی مذهبی و سیاسی (GSE)
گروهی ملی، مذهبی یا سیاسی (مسلمان، کاتولیک، ایرانی، تهرانی، طالب یا طالبان، اصلاح طلب، اصول گرا و…) به موجودیت‌ها نسبت داده می‌شود. در ادامه مثال‌هایی ذکر شده است:

  • هنر نزد ایرانیان است و بس
  • خبر خوش برای تهرانی‌ها … تخفیف در راه است.
  • طالب و پشتون باید بتوانند با هم سازش کنند.
  • مردم اسکاندیناوی خیلی کم از نور خورشید بهره می‌برند.
  • ملت ایران همیشه پیروز است.
  • دهه شصتی‌ها خیلی تلاش می‌کنند.

ساعت (TIME)
تمامی ساعات و بازه‌های زمانی کمتر از یک روز جزو این دسته هستند. برای مثال:
مواردی چون «امشب، دیشب، صبح امروز، امروز ۵ عصر، ۱۲ بامداد ۱۳ فروردین و…» زمان هستند.

پول (Money)

  • ایران یک میلیون به عراق کمک کرد.

با این که ارز مالی در جمله دیده نمی‌شود اما از مفهموم آن برداشت می‌شود که که میلیون تومان / دلار. پس «یک ملیون» در اینجا پول است.

  • ارزش بیتکوین در حال افزایش است.

تاریخ (DATE):
تمامی تاریخ‌ها یا بازه‌های زمانی بلند مدت جزو این دسته هستند. مانند:
شنبه ۲۱ اردیبهشت، فروردین ۱۴۰۰، دهه شصت، امروز، دیروز و… تاریخ هستند.
مواردی چون «هر روز»، «۲۰ سال» که دقیقا مشخص نیستند چه تاریخی هستند، موجودیت نیست.

امکانات (FACILITY):
تمامی امکانات همچون ساختمان‌ها، مساجد، زیارتگاه‌ها، اماکن گردشگری و تفریحی ورزشی، پل‌ها، تونل‌ها و… که ساخته دست انسان‌اند جزو این دسته هستند. برای مثال:

  • نمایشگاه کتاب در مصلای بزرگ تهران دایر است.
  • از وقتی آزادراه تهران-قزوین راه افتاده خیلی رفت و آمد راحت شده.
  • موزه دفاع مقدس در ساعات اداری آمده پذیرایی از مهمانان داخلی و خارجی است.

محصولات (PRODUCT):
تمامی ماشین‌ها، کتاب‌ها، سوره‌های قرآن، خوراک‌ها، وسایل خانه، صنایع دستی، اسلحه و… جزو این دسته هستند. در مورد کالاها باید در نظر داشت که برند محصول باید مشخص باشد. در ادامه مثال‌هایی ذکر شده است:

  • برای انتشار میتونید در توییتر، توییت یا ریتوییت کنید.
  • همون سمند که میگی رو بعنوان خودروی ملی تولید کردن.
  • آدم واکسن بزنه بمیره بهتر از اینه کرونا بگیره.

شهر کشور استان (GPE):
تمامی قاره‌ها، کشورها، استان‌ها، شهرها، ایالت‌ها، روستاها، و… جزو این دسته هستند. در ادامه مثال‌هایی ذکر شده است:

  • شهر برلین در آلمان به شدت زیباست.
  • تهران امروز جزو پیشرفته‌ترین شهرهای دنیاست.

موقعیت/مکان (Location):
تمامی موقعیت‌های جغرافیایی همچون کوه‌ها، دریاها، جنگل، خیابان‌ها، کوچه‌ها و… جزو این دسته هستند. تمامی راه‌های ارتباطی همچون بزرگراه، جاده، خیابان، اتوبان، کوچه، بن بست، و میدان و… به جز تونل و پل موقعیت‌اند. تونل و پل جزو امکانات محسوب می‌شوند. در ادامه مثال‌هایی ذکر شده است:

  • خیابان آزادی بسیار زیباست.
  • کوه دماوند در شمال تهران
  • خیابان مطهری همیشه ترافیک داره.

رخداد (Event):
تمامی جنگ‌ها، حوادث طبیعی همچون زلزله و طوفان، وقایع تاریخی، مسابقات ورزشی و… جزو این دسته هستند. مواردی که ذکر شد باید دارای تاریخ مشخص باشند. به‌عبارت دیگر اتفاقی که در گذشته اتفاق افتاده و یکتا است. در ادامه مثال¬هایی ذکر شده است:

  • ایران در جام جهانی ۲۰۱۸ درخشید.
  • لیگ جهانی والیبال بسیار هیجان‌انگیز است.
  • واقعه کربلا همواره دل عاشقان را به درد می‌آورد.

۵- قطبیت (Polarity)

هر متن نسبت به موجودیت‌هایش قطبیت دارد که این قطبیت بیانگر جهت‌گیری نویسنده راجع به آن‌هاست. هوش مصنوعی این جهت‌گیری را در قالب دسته‌های مثبت، منفی و یا خنثی نسبت به هر موجودیت تحلیل می‌کند. قطبیت متن با تحلیل احساسات تفاوت‌هایی دارد. در تحلیل احساسات کلیات یک جمله مورد بررسی قرار می‌گیرد، اما در قطبیت، نظر نسبت به یک موجودیت مورد بررسی قرار میگیرد. به عنوان مثال:

  • “احمد صالح: نباید بار تنش‌های منطقه‌ای و بین‌المللی بر دوش عراقی‌ها تحمیل شود”
  • “محمود عباس: هرگز نمی‌پذیریم حماس گروه تروریستی خوانده شود”

در این دو جمله نظرات مثبتی نسبت به عراقی‌ها و حماس بیان شده است ولی نسبت به احمد صالح یا محمود عباس نظر خاصی وجود ندارد. در این حالت، قطبیت احمد صالح و محمود عباس خنثی و قطبیت عراقیها و حماس مثبت خواهدشد.
در ادامه نکات و مثال‌هایی از این دست برای فهم بهتر آورده شده است:

  • قطبیت یک متن می‌بایست به صراحت ذکر شده باشد و نیازی به استنتاج متن و استخراج ذهنیت نگارنده متن نیست. در صورتی که در یک متن شواهد واضحی از مثبت یا منفی بودن آن از منظر موجودیت یافت نشد، قطبیت آن خنثی در نظر گرفته می‌شود. در متن ممکن است موجودیت‌های متفاوت وجود داشته باشند، لذا قطبیت هر موجودیت می‌بایست با توجه به وضعیت همان موجودیت در متن بررسی می‌گردد. برای راحتی کار می‌توان خود را بجای آن موجودیت قرار داده و بررسی شود که آیا این متن به نفع موجودیت، به ضرر موجودیت و یا خنثی نسبت به موجودیت است

برای مثال:
“وای، دوباره سایپا پراید را گران کرد”: قطبیت منفی نسبت به سایپا «سازمان» و قطبیت منفی نسبت به پراید “محصول”
“نماد سایپا به زودی بازگشایی خواهد شد”: قطبیت مثبت نسبت به سایپا “سازمان”

  • چنانچه در متن کلماتی همچون اولین بار، رونمایی، افتتاحیه، بهره‌برداری و یا کلماتی از این دست نسبت به موجودیت اعلام شده و یا زیرمجموعه‌ای از آن بیان شد، متن دارای قطبیت مثبت خواهد بود.

برای مثال:
“ایران خودرو برای اولین بار در بورس ایران اپلیکیشن سهام معرفی کرد” قطبیت مثبت نسبت به موجودیت “ایران خودرو”

  • ارقام ذکر شده و بزرگی و کوچکی آن ارقام را در تعیین قطبیت دخالت داده نمی‌شوند.

برای مثال:
“گمرک جمهوری اسلامی: حقوق و عوارض گمرکی تلفن همراه مسافری ۱۶ درصد است”: قطبیت خنثی نسبت به موجودیت “عوارض گمرکی تلفن همراه مسافری”

  • اعلام سود یک شرکت که به عنوان موجودیت، مشخص شده است، دارای بار مثبت است.

برای مثال:
«اختصاص ۴۸ ریال سود به ازای هر سهم گروه صنعتی سپاهان طی ۹ ماه»: قطبیت مثبت نسبت به موجودیت “سهم گروه صنعتی سپاهان”

  • اگر در متن، موجودیت مشخص شده تکذیبه‌ای نسبت به یک خبر دروغ منشر کرد، قطبیت متن نسبت به آن موجودیت مثبت خواهد بود.

برای مثال:
«گمرک صراحتا قاچاق خودرو را تکذیب کرد + توضیحات»: قطبیت مثبت نسبت به موجودیت گمرک

  • عقد تفاهم‌نامه، ادغام، و یا موضوعاتی از این دست میان موجودیت مشخص شده با سایر موجودیت‌ها دارای بار مثبت نسبت به موجودیت مشخص شده است.

برای مثال:
“از امروز اجرایی شد؛ آغاز ادغام موسسه ثامن با بانک انصار”: قطبیت مثبت نسبت به موجودیت بانک انصار و موسسه ثامن

۶- این ماژول‌ها به کسب‌وکارهای کوچک و بزرگ، چگونه کمک می‌کند؟

بدیهی‌ست که این ماژول‌ها به تنهایی کار ساز نیستند و برای انجام سوشال لیسنیگ شما باید به روش درست و صحیح انجام اینکار مسلط باشید. برای نمونه و آشنایی بیشتر با این تحلیل‌ها می‌توانید مقالات نمونه‌موردی تحلیل برندها را ازینجا مطالعه کنید. اما از مهمترین نتایج این استفاده ازین ماژول‌ها میتوان به موارد زیر به طور خلاصه اشاره کرد.

  • میتوانیم احساسات کاربران سوشال مدیا را نسبت به محتواهای خود بفهمیم.
  • میتوانیم هیجانات کاربران و مخاطبان خود را نسبت به برند خود رصد کنیم و برای بهبود وضعیت آن، استراتژی‌های متنوعی طراحی کنیم.
  • می‌توانیم بفهمیم که جهت‌گیری کاربران نسبت به رقبا یا محصولات مشابه چیست؟
  • و……

 

دیدگاه خود را بنویسید:

آدرس ایمیل شما نمایش داده نخواهد شد.

فوتر سایت