خلاصه
با وجود دسترسیآنلاینبه داده ها، تجزیه و تحلیل این اطلاعات در تحقیقات دانشگاهی دشوار است. اینمقالهکاربردیادگیری ماشینی تحت نظارت (SML) را جهت غلبه بر چالش های مرتبطبا تجزیه و تحلیل داده های آنلاین بررسی می نماید. طبقه بندیکننده هاییادگیری ماشینی تحت نظارت برای دسته بندی و کد گذاری داده هایدوتاییاستفاده می شوند. این مقاله عملکرد برنامه نویسی سه طبقه بندیکننده:دستگاه بردارپشتیبانی خطی، بیزساده، و رگرسیون لجستیک،را بر اساس نمونه موردی از توییت هایکاری، کارمندان هلندی مقایسه می نماید. عملکرد اینطبقه بندیکننده هابا بررسی صحت، دقت، فراخوان، سطح زیر منحنی دقت- فراخوان،وآلفای کریپندورف ارزیابی می گردد. این شاخص ها با مقایسه تصمیمات برنامه نویسی طبقه بندیکننده با تصمیم گیری های برنامه نویسیدستیبه دست آمده است. اینیافته ها نشان می دهد که طبقه بندیکننده های دستگاه بردار پشتیبانی خطی و بیزسادهبهتر از طبقه بندی کننده رگرسیون لجستیک عمل می نمایند. این مطالعه همچنین عملکرداین طبقه بندی کننده ها را بر اساس نمونه های تصادفیلایه ای و نمونه های تصادفی داده های آموزشیمقایسه نمود. یافته هانشان می دهد که در مجموعه های آموزشی کوچکتر،نمونه هایآموزشیتصادفیلایه ایعملکرد بهتری نسبت بهنمونه هایآموزشیتصادفیدارند، در حالی که در مجموعه های آموزشی بزرگ (تعداد افراد= ۴۰۰۰) نمونه های تصادفی نتایج بهتری را کسب نمودند. در نهایت، طبقه بندی کنندهدستگاهبردارپشتیبانخطی با ۴۰۰۰ توییت آموزش دیده و پس از آن برای دسته بندی۵۷۸۵۸۱ توییت به دست آمده از ۴۳۰ پرسنل استفاده گردید.
واژگان کلیدی: توییتر ، یادگیری ماشینی تحت نظارت ، تحقیقات ارتباطات ، تحلیل محتوا
عنوان اصلی مقاله: Social media research: The application of supervised machine learning in organizational communication research.
ترجمه فارسی عنوان: تحقیقات رسانه های اجتماعی: استفاده از یادگیری ماشینی تحت نظارتدر پژوهش ارتباطات سازمانی
تعداد صفحات انگلیسی: ۱۰ صفحه
تعداد صفحات ترجمه فارسی: ۴۰ صفحه
لیست کامل مقالات را در اینجا ببینید