تحلیل شبکه های اجتماعی چیست؟
تجزیه و تحلیل شبکه های اجتماعی (SNA)، همچنین به عنوان علم شبکه شناخته میشود، حوزهای از تجزیه و تحلیل دادهها است که از شبکهها و نظریه گرافهمه چیز در مورد نظریه گراف (Graph Theory)در این مقاله یک مقدمه جامع در رابطه با نظریه گراف ارائه شده است و سعی شده نشان داده شود که دانستن برخی از مبانی نظریه گراف تا چه میزان میتواند مفید و موثر باشد. برای درک ساختار شبکه های اجتماعی استفاده میکند. تکنیکهای تحلیل شبکههای اجتماعی را میتوان برای شبکههای خارج از حوزه اجتماعی نیز به کار برد.
اهمیت تحلیل شبکه های اجتماعی با داده کاوی
داده کاویداده کاوی چیست؟ بررسی 0 تا 100 دیتا ماینینگ (data mining)این مقاله عالی بررسی کرده که داده کاوی یا دیتا ماینینگ (data mining) چیست و چه کاربردی دارد، سپس انواع روش های داده کاوی و مزایای دیتا ماینینگ را بررسی کرده یکی از شاخه های علم داده است. داده کاوی، ابزار مفیدی است که میتواند به یافتن الگوها و روابط مختلف در دادهها کمک کند. داده کاوی از پایگاه دادههای بزرگ اطلاعات پنهان تولید میکند. تکنیکهای داده کاوی ابزارهایی را برای تجزیه و تحلیل دادههای بزرگ، پیچیده و دائما در حال تغییر در اختیار محققان و متخصصان قرار میدهد. محققان از داده کاوی برای استخراج داده از شبکهی اجتماعی نیز استفاده میکنند. دادههای شبکه های اجتماعی بسیار بزرگ هستند و از تکنیکهای داده کاوی برای تجزیه و تحلیل آنها استفاده میشود.
اهداف و کاربرد تحلیل شبکه های اجتماعی
شبکههای اجتماعی در حال حاضر از افراد گوناگونی تشکیل شده است که با تحلیل دادههای حاصل از افراد، میتوانیم به نتایج فوق العادهای دست پیدا کنیم و از نتایج برای اهداف متفاوتی استفاده نماییم. برخی از اهداف تجزیه و تحلیل شبکهها عبارتند از: جمع آوری و استخراج دادهها، مدل سازی انتشار شبکه، مدل سازی و نمونه گیری شبکه، تجزیه و تحلیل ویژگیها و رفتار کاربر، توسعه سیستمهای توصیهگر و پیشبینی پیوند. در حوزهی کسبوکارها از تجزیه و تحلیل شبکه های اجتماعی برای پشتیبانی از فعالیتهایی مانند تعامل و تجزیه و تحلیل مشتری استفاده میکنند.
برخی از کاربرد های تجزیه و تحلیل شبکه های اجتماعی به صورت زیر میباشد:
کاربرد های امنیتی
از تحلیل شبکههای اجتماعی در فعالیتهای اطلاعاتی، ضد جاسوسی و اجرای قانون نیز استفاده میشود. این تکنیک به تحلیلگران اجازه میدهد تا سازمانهای مخفی مانند یک حلقه جاسوسی، جنایتکاران سازمان یافته یا یک باند خیابانی را ترسیم کنند. آژانس امنیت ملی (NSA) از برنامههای نظارت الکترونیکی خود برای تولید دادههای مورد نیاز برای انجام این نوع تجزیه و تحلیل بر روی هستههای تروریستی و سایر شبکههای مرتبط با امنیت ملی استفاده میکند.
برنامه های کاربردی اینترنتی
تجزیه و تحلیل شبکههای اجتماعی همچنین برای درک رفتار آنلاین توسط افراد، سازمانها و وب سایتها اعمال شده است. تجزیه و تحلیل هایپرلینک میتواند برای تجزیه و تحلیل ارتباطات بین وب سایتها یا صفحات وب مورد استفاده قرار گیرد تا بررسی کند که چگونه اطلاعات در هنگام حرکت افراد در وب جریان مییابد. ارتباطات بین سازمانها از طریق تجزیه و تحلیل هایپرلینک تجزیه و تحلیل میشود تا بررسی شود که کدام سازمانها در یک جامعه موضوعی هستند.
برنامه های کاربردی رسانه های اجتماعی
تجزیه و تحلیل شبکه های اجتماعی برای رسانههای اجتماعی به عنوان ابزاری برای درک رفتار بین افراد یا سازمانها از طریق پیوندهای آنها در وب سایتهای رسانههای اجتماعی مانند توییتر و فیس بوک اعمال شده است.
نمونه ای از تحلیل شبکه اجتماعی
بیت کوینبیت کوین چیست؟ از 0 تا 100 بیت کوین به زبان سادهبراستی بیت کوین چیه؟ افراد زیادی میخواهند با بیت کوین آشنا شوند، اما نمیتوانند در سایتها توضیح ساده ای از بیت کوین بیابند، این مقاله به توضیح بیت کوین به زبان ساده پرداخته است (Bitcoin) یک ارز رمزنگاری شده است که به عنوان واسطهای برای تبادل آنلاین با فناوری رمزنگاری قوی، توسط ساتوشی ناکاموتو، فرد یا گروهی ناشناس، در سال 2009 طراحی شده است. بیت کوین به دلیل امنیت قوی و ناشناس بودن به سرعت به عنوان سرمایه گذاری در بازار محبوب شد. بر اساس تحقیقات انجام شده توسط دانشگاه کمبریج ، تعداد زیادی کاربر منحصر به فرد از کیف پول ارزهای دیجیتال استفاده میکنند که بیشتر آنها از بیت کوین استفاده میکنند. با این حال، برخی تنظیمکنندهها از پیامهای هشداردهندهای در مورد پذیرش این پول نقد الکترونیکی نوآورانه منتشر کردهاند.
یکی از دلایل این امر این است که بیت کوین و به طور کلی ارزهای دیجیتال مستقل از هر مرجع نظارتی متمرکزی هستند. بنابراین هر شخصی میتواند بهطور ناشناس با نصب برنامههای مشتری ارزهای دیجیتال، تراکنشها را انجام دهد. به دلیل ماهیت ناشناس آنها، ارزهای دیجیتال اغلب در معاملات غیرقانونی استفاده می شوند. نوسانات بالای قیمت، مصرف برق و فقدان مقررات اغلب برای انتقاد از استفاده از ارزهای دیجیتال استفاده میشود. بنابراین، تجزیه و تحلیل شبکه اعتماد کاربران بیت کوین برای بهبود مشکلات حریم خصوصی و امنیتی با استفاده از رویکردهای تجزیه و تحلیل شبکههای اجتماعی، انجام میشود.
انواع تحلیل شبکه های اجتماعی
اصولاً دو نوع تجزیه و تحلیل شبکه اجتماعی وجود دارد:
- تجزیه و تحلیل شبکه اگو (Ego Network Analysis)
- تجزیه و تحلیل شبکه جهانی (Complete Network Analysis)
تجزیه و تحلیل شبکه اگو
تجزیه و تحلیل شبکه اگو، تحلیلی است که رابطه بین افراد را پیدا میکند. تجزیه و تحلیل برای نمونه خاصی از افراد انتخاب شده از کل جمعیت انجام میشود. این نمونه گیری به صورت تصادفی برای تجزیه و تحلیل رابطه انجام میشود. این تحلیل توسط نظرسنجیهای سنتی انجام میشود، نظرسنجیها شامل این میباشد که از افراد پرسیده میشود که با چه کسی در ارتباط هستند و نام آنها از رابطه بین آنها برای یافتن رابطه بین همه افراد نمونه متمرکز نیست. تلاشی برای یافتن چگالی شبکه در آن نمونهها است. این فرضیه با استفاده از برخی تکنیکهای آزمون فرضیههای آماری مورد آزمون قرار می گیرد.
تجزیه و تحلیل شبکه جهانی
تحلیل شبکه جهانی، تحلیلی است که در تمامی تحلیلهای شبکه استفاده میشود. این تحلیل رابطه بین همه افراد انتخاب شده از جمعیت بزرگ را تجزیه و تحلیل میکند. این معیار تجزیه و تحلیل به سازمان یا شرکت کمک میکند تا هر تصمیمی را با کمک روابط خود اتخاذ کند.
ابزارهای تحلیل شبکه های اجتماعی
همانند بسیاری از موارد در علم داده، ابزارهای مختلفی وجود دارد که میتوانید برای تجزیه و تحلیل شبکه های اجتماعی از آنها استفاده کنید. این مقاله بر روی مجموعه خاصی از ابزارها تمرکز دارد تا شما را شروع به ساخت نمودارهای شبکه و انجام تجزیه و تحلیل بر روی آنها نماید. به هیچ وجه این موارد تنها یا بهترین ابزارهای موجود نیستند.
گفی (GEPHI)
Gephi، یک نرم افزار رایگان برای رایانه شخصی، مک و لینوکس، به منظور ساخت نمودارهای شبکه و اجرای برخی تجزیه و تحلیلها میباشد. Gephi یک رابط رابط کاربری گرافیکی ارائه میدهد و نیازی به کدنویسی ندارد.
منابع داده
برای تجزیه و تحلیل شبکه های اجتماعی، همچنین به یک منبع داده برای شبکه خود نیاز دارید، دادههای شبکه دو الزام دارند: بازیگران و روابط. هر کدام از نودها نقش Actor (بازیگر) را دارد و هر یال Relationship (ارتباط) است. برخی از دادهها به استخراج این روابط نیاز دارند و برخی دیگر در مجموعه داده واضحتر خواهند بود. توصیه میشود برای شروع بهتر میباشد از مجموعه دادههای Kaggle استفاده کنید.
تعاریف معیارهای مورد نیاز در تحلیل شبکه های اجتماعی
گره ها و لبه ها
تا به حال، هم به بازیگران و هم به روابط اشاره شده است. در علم شبکه، بازیگران به عنوان گره (نقاط روی نمودار) و روابط به عنوان یال (خطوط روی نمودار) شناخته میشوند.
گرهها میتوانند بازیگران مختلفی را نشان دهند. به عنوان مثال، در شبکههای اینترنتی، گرهها میتوانند صفحات وب را نشان دهند، در حالی که در شبکههای اجتماعی، گرهها میتوانند نشان دهنده افراد باشند. لبهها میتوانند نشاندهنده انواع روابط باشند. در شبکههای اینترنتی، لبهها میتوانند پیوندها را نشان دهند و در شبکههای اجتماعی لبهها میتوانند نشاندهنده ارتباطات باشند. گرهها و لبهها یک مفهوم کلیدی در شبکهها هستند، بنابراین قبل از پرداختن به مفاهیم دیگر مطمئن شوید که درک خوبی از آنها دارید.
جهت لبه
دو نوع لبه وجود دارد:
- جهت دار
- غیر جهت دار
هنگام ساخت یک نمودار شبکه، رمزگشایی اینکه دادههای شما حاوی چه نوع لبهای است، ضروری می باشد. لبههای جهتدار از یک گره به گره دیگر با یک گره شروع و یک گره پایانی اعمال میشوند. به عنوان مثال، وقتی یک کاربر توییتر کاربر دیگر توییتر را در یک توییت تگ میکند، آن رابطه جهتدار میشود. کاربری که توییت را نوشت (گره شروع) این رابطه را برای کاربری که برچسب گذاری کرده بود (گره پایانی) اعمال کرد. کاربر تگ شده لزوماً آن رابطه را متقابلاً پاسخ نداده است. نمونه دیگری از لبههای جهت دار، پرداختها هستند. اگر مشتری (گره شروع) به یک کافی شاپ (گره پایانی) برای یک قهوه پول پرداخت کند، این رابطه لزوماً متقابل نیست زیرا کافی شاپ نیز به مشتری پولی پرداخت نکرده است.
لبههای بدون جهت، مخالف لبههای جهتدار هستند. این روابط توسط هر دو طرف بدون یک گره آغازین یا پایانی مشخصی اعمال میشوند. به عنوان مثال، اگر دو نفر در فیس بوک با هم دوست باشند، این رابطه بدون جهت است. این به این دلیل است که شخص A با شخص B دوست است، اما میتوانیم بگوییم شخص B با شخص A دوست است.
وزن لبه
وزن یک یال تعداد دفعاتی است که آن لبه بین دو گره خاص ظاهر میشود. به عنوان مثال، اگر شخص A سه بار یک قهوه از یک کافی شاپ بخرد، لبه اتصال فرد A و کافی شاپ دارای وزن سه خواهد بود. با این حال، اگر شخص B فقط یک بار قهوه از کافی شاپ بخرد، لبه اتصال فرد B و کافی شاپ وزن یک خواهد داشت.
معیارهای مرکزیت
مرکزیت مجموعهای از معیارها است که برای تعیین کمیت اهمیت و تاثیرگذاری یک گره خاص برای کل شبکه استفاده میشود. مهم است که به یاد داشته باشید که معیارهای مرکزیت در گرههای خاص در شبکه استفاده میشود و اطلاعاتی را در سطح شبکه ارائه نمیدهد. چندین معیار مرکزی وجود دارد، که سه مورد از آنها را بحث می نماییم.
درجه
درجه گره تعداد یالهایی است که گره دارد. در یک شبکه بدون جهت، تنها یک معیار برای درجه وجود دارد. به عنوان مثال، اگر گره A دارای لبههایی باشد که آن را به گره B و گره D متصل میکند، آنگاه درجه گره A دو است.
با این حال، در یک شبکه جهتدار، در واقع سه معیار درجه متفاوت وجود دارد. به دلیل آنکه این یالها دارای یک گره شروع و انتهایی هستند، درجه ورودی (تعداد یالهایی که گره یک گره انتهایی است)، درجه خروجی (تعداد یالهای یک گره شروع است) و درجه (تعداد یالهای a) گره را میتوان محاسبه نمود.
نزدیکی (Closeness)
نزدیکی میزان اتصال یک گره به هر گره دیگر در شبکه را اندازهگیری میکند. نزدیکی یک گره میانگین تعداد پرشهای مورد نیاز برای رسیدن به هر گره دیگر در شبکه است. هاپ، مسیر یک یال از یک گره به گره دیگر است. برای مثال، گره A به گره B و گره B به گره C متصل است. برای رسیدن گره A به گره C، دو پرش طول میکشد.
بینابینی (Betweenness)
Betweenness اهمیت اتصالات یک گره را در اجازه دادن به گرهها برای رسیدن به گرههای دیگر (در یک هاپ) میسنجد. بین یک گره تعداد کوتاهترین مسیرهایی است که گره در آن قرار میگیرد تقسیم بر تعداد کل کوتاهترین مسیرها. این درصد کوتاهترین مسیرها را در شبکه گره ارائه میکند.
اندازهگیریهای سطح شبکه
ما همچنین میتوانیم معیارها را در سطح شبکه برای ارزیابی کل شبکه به جای صرفاً یک گره محاسبه کنیم. مانند معیارهای مرکزیت، معیارهای مختلفی در سطح شبکه وجود دارد. ما به اندازه و چگالی نگاه خواهیم کرد.
اندازه شبکه
اندازه شبکه تعداد گرههای شبکه است. اندازه یک شبکه تعداد لبهها را در نظر نمیگیرد. به عنوان مثال، شبکهای با گرههای A، B و C دارای اندازه سه است.
چگالی شبکه
چگالی یا تراکم شبکه تعداد یالها بر مجموع یالهای ممکن تقسیم میشود. به عنوان مثال، شبکهای با گره A متصل به گره B، و گره B متصل به گره C، چگالی شبکه 2/3 است زیرا دو یال از سه یال ممکن وجود دارد.
اندازهگیری های سطح مسیر
معیارهای سطح مسیر اطلاعاتی را برای مسیری بین یک گره و گره دیگر ارائه میدهند. مسیرها لبههای بین گرهها را دنبال میکنند که به عنوان hop شناخته میشوند. همچنین معیارهای مختلفی در سطح مسیر وجود دارد، اما ما به طول و فاصله نگاه خواهیم کرد.
طول
طول تعداد یالهای بین گرههای شروع و پایان است که به عنوان hop شناخته میشود. برای محاسبه طول بین دو گره، باید یک مسیر را از قبل تعیین کنیم.
فاصله
فاصله تعداد یالها یا پرشها بین گرههای شروع و پایانی است که کوتاهترین مسیر را دنبال میکنند. بر خلاف طول، فاصله بین دو گره فقط از کوتاهترین مسیر استفاده میکند - مسیری که به کمترین جهش نیاز دارد.
مولفه های همبند و پل ها
لزوماً همه گرههای یک شبکه به یکدیگر متصل نیستند. مولفه متصل به گروهی از گرهها گفته میشود که به یکدیگر متصل هستند، اما به گروه دیگری از گرهها متصل نیستند. روش دیگر برای این موضوع، گروهی از گرههای متصل است که هیچ مسیری به گره از گروه دیگر ندارند. بسته به شبکه، میتواند بسیاری از اجزای متصل یا حتی تنها یک مورد وجود داشته باشد. نمودار زیر یک شبکه با دو جزء متصل را نشان میدهد.
پل گرهای است که با حذف آن، یک جزء متصل ایجاد میکند. تعریف دیگر این است که پل گرهای میباشد که تنها اتصال گروهی از گرهای متصل به گروه دیگری از گرههای متصل است.
هاب ها و احراز هویت ها
Hub و Authorities دستهبندی گرههایی هستند که در شبکههای جهتدار استفاده میشوند. هاب گرهای است که لبههای زیادی به بیرون دارد. همچنین میتوانید یک هاب را به عنوان یک گره در نظر بگیرید که گره شروع بسیاری از لبهها است. از طرف دیگر، یک Authorities گرهای میباشد که لبههای زیادی به آن اشاره دارد. همچنین میتوانید Authorities را به عنوان یک گره در نظر بگیرید که گره انتهایی بسیاری از لبهها است. تعداد یالهای از پیش تعیین شدهای وجود ندارد که یک گره را به یک هاب یا یک مرجع تبدیل کند. به شبکه بستگی دارد. علاوه بر این، به یاد داشته باشید که همه گرهها در یک شبکه جهتدار یک هاب یا یک مرجع نیستند.
دیاد (جفت) و دسته (خوشه)
دیادها و دستهها جفت گرههایی هستند که توسط لبهها به هم متصل شدهاند. دیاد جفتی از دو گره است، در حالی که یک دسته جفتی از سه یا چند گره است. در حالی که یک دسته ممکن است یک جزء متصل باشد، آنها همچنین میتوانند بخشی از یک جزء متصل بزرگتر باشند.
جمع بندی
تجزیه و تحلیل شبکه های اجتماعی به طور گسترده در پهنه وسیعی از کاربردها و رشتهها از جمله علم داده استفاده میشود. در این مقاله با مفهوم تحلیل شبکه های اجتماعی در علم داده آشنا شدیم و معیارهای مورد نیاز برای پیاده سازی بررسی شد.
چرا باید به تحلیل شبکه های اجتماعی اهمیت بدهیم؟
تکنیکهای تحلیل شبکه های اجتماعی کاربردهای متفاوتی دارد. یکی از کاربردهای رایج تحلیل شبکههای اجتماعی در اینترنت این است که صفحات وب در اینترنت اغلب به صفحات وب دیگر پیوند دارند - چه در وب سایت خودشان یا یک وب سایت دیگر - این پیوندها را میتوان روابط بین بازیگران (صفحات وب) در نظر گرفت. این در واقع یک جزء کلیدی از معماری موتورهای جستجو است.
گراف شبکه اجتماعی چگونه است؟
یک گراف شبکه اجتماعی شامل نقاط و خطوطی است که آن نقاط را به هم متصل میکند شبیه به یک پازل اتصال نقطه میباشد. نقاط نشاندهنده بازیگران و خطوط نشان دهنده روابط هستند. نمونهای از گرافهای تحلیل شبکهی اجتماعی تشخیص حسابهای توییتر داعش میباشد.
انواع تحلیل شبکههای اجتماعی چیست؟
دو نوع تحلیل شبکهی اجتماعی اگو(فردی) و جهانی وجود دارد. در شبکهی اگو تجزیه و تحلیل برای قسمت خاصی از افراد جامعه انجام میشود اما در تحلیل شبکه جهانی سعی بر یافتن همه روابط بین مشارکتکنندگان در شبکه است.
در یک گراف چند نوع لبه یا یال وجود دارد؟
در یک گراف دو نوع لبه جهتدار و غیر جهتدار وجود دارد. لبههای جهتدار از یک گره به گره دیگر با یک گره شروع و یک گره پایانی اعمال میشوند. لبههای بدون جهت این روابط توسط هر دو طرف بدون یک گره آغازین یا پایانی مشخصی اعمال میشوند. زوج مرتب (a,b) با زوج مرتب (b ,a) تفاوتی در گراف معمولی یا بدون جهت ندارد ولی در گراف جهت دار زوج مرتبهای (a,b) با (b,a) تفاوت دارد و نحوهی ارتباط بین این دو راس را نمایش میدهند.