نکته: جهت حفظ حریم شخصی کاربران هیچ اطلاعاتی در مورد آن ها نگهداری نشده و تنها يك عدد به عنوان نام كاربرى در سیستم بولتن به هر کاربر اختصاص داده شد.
در پست قبلی ما اقدام به انتشار یک نمونه از اطلاعات آماری که میتوان از شبکه های اجتماعی جمع آوری کرد نمودیم در این پست قصد داریم اهمیت نظرات مردم در مورد برند، محصول، کمپین تبلیغاتی و … شما را متذکر شویم و به نحوه به دست آوردن و جمع آوری کردن این اطلاعات که در حال حاضر یکی از سرویس های مجموعه بولتن میباشد بپردازیم.
تجزیه و تحلیل احساسات در رسانه های اجتماعی، یکی از منابع مهم اطلاعاتی به شمار میرود چرا که قادر خواهد بود در زمینه کسب و کارتان بینشی به شما بدهد که :
و بطور کلی اگر تحلیل احساسات بدرستی انجام شود میتواند سود و زیان شما را در سطح عالی بهبود ببخشد.
بررسی قطبیت نظرات مردم در شبکه های اجتماعی و سایتهای خبری مختلف راجع به وزرای احتمالی دولت دوازدهم چگونه انجام شد؟
بخش اول:
خوشبختانه به علت داشتن زیر ساخت حال حاضر پروژه بولتن ما در مرحله جمع آوری نظرات، مشکل و چالشی نداشتیم. تنها نیاز بود کلید واژه های صحیح برای جمع آوری تمام نظرات و مطالب مرتبط با دولت را تعریف نماییم.
بخش دوم :
ما توسط الگوریتم های خاص کاربران منحصر بفرد و تاثیرگذار در شبکه های اجتماعی را پیدا کرده و نظرات مرتبطی که راجع به آن وزیر پیشنهادی یا موضوع خاص داده اند را جمع آوری میکنیم .در اینجا برای حفظ حریم خصوصی، نام کاربری کاربران با یک عدد تعریف شده است و اطلاعات کاربران نگهداری نشده است.
بخش سوم:
تفکیک نظر کاربران در شبکه های اجتماعی مختلف نسبت به یک موضوع به سه گروه مثبت،منفی و ممتنع.
چالش هایی که در این مورد با آن روبرو بوده ایم عدم رعایت قواعد معمول زبان شبکه های اجتماعی،تفاوت ادبیات رایج در شبکه های اجتماعی مختلف، تشخیص کنایه ها، کوتاهی متن و .. میباشد. در این بخش پس از جمع آوری داده ها از شبکه های اجتماعی و وب سایت های خبری مختلف، برای هریک از داده ها مدل جداگانه ایی ساخته شد. سپس داده ها باید وارد مرحله پیش پردازش شوند پيش پردازش داده ها به گونه ایی بود که به ساختار زبان نوشتار نزدیک تر شوند، برای این کار از چندین مدل استفاده کردیم که اشتباهات املایی،تکراری نویسی، ریشه کلمات شکسته شده، نیم فاصله ها و … را اصلاح می کند.داده های پردازش شده به عنوان ورودی مدل استفاده می شود.
پس از انجام پیش پردازش، داده ها وارد مرحله مدلسازی میشوند. ابتدا بر اساس مدل یادگیری عمیقی که قبلا ساخته بودیم هر نظر را به یک بردار ویژگی عددی تبدیل می کنیم و در نهایت با استفاده از چند مدل مختلف و تجمیع نظرات آنها مدل نهایی ساخته می شود.
بخش چهارم:
نظر کاربر در طول زمان ممکن است نسبت به یک فرد (در اینجا منظور وزرای پیشنهادی) عوض شود و این امر، اعتبار نظر های قبلی او را کم می کند،ولی قطعا از بین نخواهد برد زیرا نظر خود شخص در جامعه پخش شده و تاثیر خود را داشته است.
ما با اضافه کردن تعدادی از آخرین نظرات کاربر و قطبی سنجی هر یک به صورت جداگانه و اضافه کردن تاثیر زمان به آن و اجماع آن ها به عددی میرسیم که قطبیت یک فرد را مشخص می کند.
در نهایت با پردازش عددی بیش از ۵،۵۰۰،۰۰۰ نظر به گزارشی کامل از وزرای پیشنهادی رسیدیم که مردم بیشترین صحبت را درمورد آن ها کردهاند و بیشترین نظر را داشتند، که در لینک زیر میتوانید نمودار بررسی این نظرات را ببینید.
https://t.me/bultanapp/4
نکته: جهت حفظ حریم شخصی کاربران هیچ اطلاعاتی در مورد آن ها نگهداری نشده و تنها يك عدد به عنوان نام كاربرى در سیستم بولتن به هر کاربر اختصاص داده شد.
بازخورد افکار عمومی در شبکههای مجازی با استفاده از کلاندادهها کار آسانی نیست. این نمودار حاصل بررسی ۵.۵ میلیون داده و تحلیل بازخورد عمومی آنها در شبکههای خبری و اجتماعی است.