$title
[1] "Saatte atılan tweet sayısı"
attr(,"class")
[1] "labels"
2022 CIDA - Sunum
Sosyal Ağ Analizi ile Kadın Cinayetlerindeki Politik Kutuplaşmayı Keşfetmek: Pınar Gültekin Cinayetinde Kutuplaşmalarda İlişkiler
Sunum içeriğini takip edebileceğiniz web sayfası:
1 Giriş
Pınar Gültekin’in 16 Temmuz 2020 tarihinde kaybolmasının ardından ailesi, arkadaşları, kadın hareketi örgütleri özellikle sosyal medya plaformlarıını kullanarak Pınar Gültekin’i arama çabasına girişmişlerdi. Bu süreçte Twitter çok etkin bir şekilde kullanıldı.
Süreçle ilgili önemli tarihler:
21 Temmuz 2020’de Cemal Metin Avcı adlı bir erkek tarafından öldürüldüğü ortaya çıktı.
Temmuz 2020’de İstanbul Sözleşmesi ile ilgili tartışmalar yoğunlaştı (Abdurrahman Dilipak’ın 27 Temmuz tarihli “AKP’nin papatyaları” adlı yazısına sosyal medyada tepki yağdı)
09 Kasım 2020’de ilk duruşma yapıldı.
Türkiye 20 Mart 2021 tarihinde İstanbul Sözleşmesi’nden yapılan aleyhte kampanyaların sonucunda çekildi.
20 Haziran 2022’de 13. duruşmada, önce ağırlaştırılmış müebbet hapis cezası verildi, ardından haksız tahrik indirimiyle ceza 23 yıla düşürüldü.
1.1 Çalışma Soruları
- 27 Aralık 2020 ve 03 Ocak 2021 tarihleri arasında Pınar Gültekin cinayetiyle ilgili tweet atan kullanıcılar nasıl bir ağ oluşturuyor?
Ağdaki ana karakterler kim?
Ağı kim/kimler domine ediyor? Kümelenmeler kimlerden oluşuyor?
Ana karakterlerin etrafındaki aktörler kim?
Aktörler politik olarak hangi kutupta yer alıyor?
- 27 Aralık 2020 ve 03 Ocak 2021 tarihleri arasında Pınar Gültekin cinayetiyle ilgili atılan tweetlerde sıklıkla neler konuşuluyor?
1.2 Verinin Toplanması
Twitter API v2 Academic Research erişim seviyesiyle, R programlama dili kullanılarak (academictwitteR paketi aracılığıyla) veriye erişim sağlandı.
Academic research seviyesi: Erişim sayısı üst limi ayda 10 milyon (Full archive search, Full archive tweet count). Diğer seviyelerde (Essential, Elevated) sadece son bir haftalık veriye erişim mümkün.
1.2.1 Tweet sayılarının dağılımı (Zaman serisi grafiği)
Tweet biçimine göre dağılım:
1.2.2 Tüm Tweetlere Erişim
Code
get_all_tweets(
query = c("Pınar Gültekin", "#PınarGültekin", "#PınarGültekinİçinAdalet"),
start_tweets = "2020-07-21T10:00:00Z",
end_tweets = "2022-05-05T10:00:00Z",
lang = "tr",
file = "pinargultekin",
data_path = "pg-tweet-data",
n = 632200,
)
Veriyi oluşturan toplam tweet sayısı:
Code
nrow(joined)
[1] 478278
Verinin içeriği:
Code
colnames(joined.clean)
[1] "id" "created_at" "retweet_count"
[4] "like_count" "quote_count" "url"
[7] "hashtag" "mention_username" "mention_id"
[10] "sourcetweet_type" "sourcetweet_id" "sourcetweet_text"
[13] "sourcetweet_author_id" "text" "possibly_sensitive"
[16] "author_id" "user_username" "user_name"
[19] "user_description" "user_profile_image_url" "user_url"
[22] "user_verified" "user_location" "user_followers_count"
[25] "user_following_count" "user_tweet_count" "user_list_count"
[28] "source" "in_reply_to_user_id"
Quoted, Retweet, Unique (replyto dahil) Tweet Sayıları
Code
%>%
joined count(sourcetweet_type, name = "frequency")
sourcetweet_type frequency
1 quoted 7620
2 retweeted 412642
3 <NA> 58016
Elde edilen büyük veri için oluşturulan interaktif veri tablosu
1.3 Sosyal Ağ Analizi
1.3.1 Tanımı
Sosyal aktörler arasındaki etkileşimin incelenmesine dayanan bir yaklaşım.
Matematiğin bir dalı olan çizge teorisine (graph theory) dayanır.
Graph theory, Nesneler ve onlar arasındaki ilişkilerin matematiksel temsili olan çizgeleri inceler. Düğümler (node, unit, vertex) ve Ayrıtlardan (edge, line, tie, link) oluşur.
Çizge en basit haliyle iki sütunda düğümlerin olduğu bir ayrıt listesidir (edge list)
1.3.2 Merkezilik ölçümleri
Sosyal ağdaki aktörler(nodes) sğda farklı yapısa pozisyonlar alabilir ve bilgi akışına farklı biçim ve düzeyde etkileri vardır.
Merkezilik ölçümleri bunları ortaya koyar.
Dereceye dayalı merkezilik ölçümleri | En kısa yola dayalı merkezilik ölçümleri |
---|---|
Derece merkeziliği | Arasındalık merkeziliği |
Özvektör merkeziliği | Yakınlık merkeziliği |
Derece merkeziliği (degree, in-degree, out-degree). Ağın yönlü (directed) ya da yönsüz (undirected) olmasına göre farklı ölçümler. Twitter hem yönlü hem de yönsüz bir ağ. Facebook ise yönsüz bir ağ.
Derece merkezilği ağdakü tüm komşuları eşit sayar. Önemli olan komşuların sayısıdır.
Özvektör (Eigenvector) merkeziliğine göre ise, ağdaki düğüm eğer güçlü düğümlerle bağlantılıysa onun önemi artar.
Arasındalık (betweenness) merkeziliği, ağın akışında hangi düşümlerin önemli olduğunu ortaya koyar. Bunu ağdaki en kısa yolları kullanarak belirler. Bu merkezilik, her bir düğümün kaç tane en kısa yol üzerinde olduğunu sayar
Yakınlık (closeness) merkeziliği de benzer şekilde düşümler arasındaki en kısa yolları dikkate alır ve bir düğümün diğer tüm düğümlere ortalama mesafesini hesaplar. Mesafe ne kadar düşüksedüğüm o kadar merkezdedir.
1.3.3 Analiz için Verinin Hazırlanması
Bir temizlik aşamasının ardından verimizdeki toplam tweet sayısı: 443811
Çizgeler sırasıyla: retweet, quoted, replyto, mentions, whole
IGRAPH da1878f DN-- 182668 412615 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
IGRAPH 762b833 DN-- 7301 7615 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
IGRAPH 476230f DN-- 6416 6962 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
IGRAPH bd55e4e DN-- 14226 16619 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
IGRAPH e607555 DN-- 194261 443811 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
1.3.4 Seçilen zaman aralığı için oluşturan ağdaki node (düğüm)-edge (ayrıt) sayıları:
Retweet-graph:
IGRAPH 0b5c565 DN-- 15719 35851 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
Quoted Graph:
IGRAPH eafd0da DN-- 363 296 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
Reply-to Graph:
IGRAPH 8c39ba7 DN-- 705 758 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
Mentions Graph:
IGRAPH 93b6552 DN-- 1044 1316 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
Whole Graph:
IGRAPH 97730e8 DN-- 16601 38221 --
+ attr: name (v/c), device (e/c), relationship_type (e/c),
| created_at_round (e/n)
1.3.5 Ağın tamamı için (whole_graph) merkezilik ölçümleri
Out-degree: Whole
denizschmosby aktepeyekta gmrrty3 fahri10698828 umitcan25
107 95 85 75 62
battalgaz3 ykilicer arslansabanrt11 hudutsuzmenzil kaangucl
59 59 57 57 51
In-degree: Whole
yenisafak themarginale debuffer2 zekibahce medyaadami
3007 1612 1567 1127 936
ajanshaberresmi asliaydincer hurriyet anadoluajansi malikejder_
903 879 855 853 801
Eigenvector Centrality: Whole
in-degree | Eigenvector | Outdegree | |
---|---|---|---|
yenisafak | 3007.0 | 1.0 | 3.0 |
debuffer2 | 1567.0 | 0.5294414939568258 | 4.0 |
themarginale | 1612.0 | 0.484534292740911 | 0.0 |
malikejder_ | 801.0 | 0.454546744192743 | 23.0 |
ajanshaberresmi | 903.0 | 0.4239984681274763 | 11.0 |
zekibahce | 1127.0 | 0.34175188184066685 | 4.0 |
medyaadami | 936.0 | 0.29958486738959045 | 5.0 |
asliaydincer | 879.0 | 0.26428676830335074 | 0.0 |
anadoluajansi | 853.0 | 0.2591656138502106 | 0.0 |
hurriyet | 855.0 | 0.25872961070801237 | 0.0 |
enveryan | 763.0 | 0.24934838027922762 | 2.0 |
fatmanuraltun | 622.0 | 0.20846019997440765 | 0.0 |
neslihan3029 | 619.0 | 0.2027788949827502 | 6.0 |
slmhktn | 600.0 | 0.2014278125610776 | 4.0 |
fatihtezcan | 655.0 | 0.19705698932603072 | 2.0 |
yazparov | 648.0 | 0.19666719949604478 | 2.0 |
avicenna_razi | 603.0 | 0.18523846428714535 | 0.0 |
umutmurare | 564.0 | 0.1759469537165706 | 6.0 |
eha_medya | 383.0 | 0.16208797670774444 | 7.0 |
ferayicinadale1 | 429.0 | 0.14402642998342383 | 3.0 |
cnnturk | 417.0 | 0.13016569021344046 | 0.0 |
akantalyali | 396.0 | 0.12702158934500543 | 5.0 |
nuhalbayrak | 421.0 | 0.126683476034561 | 2.0 |
cakiciefe1453 | 418.0 | 0.12614186875642203 | 1.0 |
blrcano0o_ | 391.0 | 0.12094855432093157 | 0.0 |
manidar_hayat | 361.0 | 0.11274778908590867 | 0.0 |
yilmazgul35351 | 353.0 | 0.10700030294467901 | 1.0 |
tasdemir_cemile | 351.0 | 0.10583156270356196 | 0.0 |
thelaikyobaz | 348.0 | 0.10460126341451588 | 1.0 |
herkesicinchp | 188.0 | 0.10329376786893778 | 0.0 |
drhuriyet | 327.0 | 0.09980553210814692 | 22.0 |
mediamuhtari | 322.0 | 0.0968945716676449 | 3.0 |
bayanteror | 297.0 | 0.08921523645965673 | 1.0 |
Closeness: Whole
aahmetterdogann ibrahim61966688 dilek__rte mondstern ikiyaka
0.001512859 0.001517451 0.001517451 0.001519757 0.001522070
dilikedi1 diiek__rte_ enimenelegzet ismhndncsy dondu_e
0.001522070 0.001547988 0.001577287 0.001602564 0.001626016
Betweenness: Whole
ferayicinadale1 denizschmosby malikejder_ zekibahce sanli_turk___
24653.522 23747.595 12569.292 9507.165 6389.786
drhuriyet belkibirgun2335 hayriyeberberl1 kampuscadilari umutmurare
5784.300 5271.323 4713.151 3443.000 3264.622
1.3.5.1 En bilgi verici merkezilik ölçümü
Ağ hakkında en bilgilendirici merkezilik ölçüsünü belirlemek için temel bileşenler analizi (principal component analysis - PCA) algoritmasından yararlanılır.
Doğrusal analizde kullanılan bir boyut indirgeme tekniği.
R’de bulunan CINNA paketi ile analiz yapıldı.
1.3.6 Retweet ağı merkezilik ölçümleri
Out-degree: Retweet
aktepeyekta gmrrty3 fahri10698828 umitcan25 battalgaz3
95 85 75 62 59
arslansabanrt11 hudutsuzmenzil ykilicer kaangucl fedaimalkoc
57 57 55 51 49
In-degree: Retweet
yenisafak themarginale debuffer2 zekibahce medyaadami
2988 1608 1549 1116 931
ajanshaberresmi asliaydincer anadoluajansi hurriyet malikejder_
890 873 829 816 786
Closeness: Retweet
borankaplan6 bahgunaydin ahmt_gzel nur26139681 tevfikaliz
0.006024096 0.006493506 0.006535948 0.006622517 0.006896552
urfaliogluihsan meb6307 ilkatman yusra__571 sskartal3
0.006896552 0.006944444 0.006944444 0.006993007 0.006993007
Betweenness: Retweet
1.3.7 Quoted ağı merkezilik ölçümleri
Out-degree: Quoted
politicalinnov2 aahmttprk emtevbrane yildizdilek2009 unsalkartal58
21 5 5 4 4
muradcobanoglu albay_birol dcankocak ahmettozlu29 yunus_arslan_ya
3 3 2 2 2
In-degree: Quoted
sgirgin48tbmm hurriyet devapartisi yenisafak debuffer2
31 19 15 14 9
anadoluajansi ajanshaberresmi enginozkoc unsalkartal58 takvim
9 8 5 4 4
Closeness: Quoted
yildizdilek2009 aahmttprk emtevbrane politicalinnov2 ahmettozlu29
0.1666667 0.2000000 0.2000000 0.2000000 0.2500000
insanvard bozdagbulentt 29ercan aygun_tk yahreynn
0.2500000 0.3333333 0.3333333 0.3333333 0.3333333
Betweenness: Quoted
debuffer2 yankibuyuksezer medyaadami enveryan ersinceliq
9 1 1 1 1
biriktisatci11 gurler_rustu dcankocak yildizdilek2009 connectumkut
1 0 0 0 0
1.3.8 Replyto ağı merkezilik ölçümleri
Out-degree: Reply to
denizschmosby orca34o vatan66sever okan54359803 malikejder_
40 20 19 16 15
tumham11 murat202202 belkibirgun2335 sedatkck3 1071fatihan
14 13 12 12 11
In-degree: Reply to
kilicdarogluk sgirgin48tbmm herkesicinchp eczozgurozel enginozkoc
53 39 29 28 18
malikejder_ gazetesozcu canan_kaftanci cumhuriyetgzt alimahir
15 13 11 8 8
Closeness: Reply to
belkibirgun2335 denizschmosby yunlu1905 orca34o vatan66sever
0.01694915 0.02777778 0.04000000 0.04166667 0.05555556
murat202202 okan54359803 ziyahafizoglu sedatkck3 cerkes_giray
0.08333333 0.08333333 0.10000000 0.11111111 0.11111111
Betweeenness: Reply to
denizschmosby okan54359803 zekibahce belkibirgun2335 yazparov
26.0 12.0 4.5 3.0 3.0
akantalyali medyaadami murat202202 miraataba1 slmhktn
2.0 1.5 0.0 0.0 0.0
1.3.9 Mentions ağı merkezilik ölçümleri
Out-degree: Mentions
denizschmosby bizimtvcomtr vatan66sever kpopabla okan54359803
67 32 26 23 22
orca34o murat202202 belkibirgun2335 1071fatihan executive61
20 18 16 15 15
In-degree: Mentions
herkesicinchp kilicdarogluk sgirgin48tbmm eczozgurozel bizimtvcomtr
157 97 84 34 32
gazetesozcu enginozkoc cumhuriyetgzt hurriyet canan_kaftanci
18 18 17 15 15
Closeness: Mentions
belkibirgun2335 yunlu1905 denizschmosby orca34o vatan66sever
0.01639344 0.03125000 0.03333333 0.04166667 0.05263158
okan54359803 smailen89581578 murat202202 kpopabla cerkes_giray
0.06666667 0.07142857 0.08333333 0.08333333 0.10000000
Betweenness: Mentions
denizschmosby okan54359803 haberturktv zekibahce aydemirbulent
26.0 15.0 9.0 4.5 4.0
yazparov slmhktn akantalyali gultekindavasi medyaadami
4.0 3.0 2.0 2.0 1.5
1.4 Sosyal Ağ Görselleştirmeleri
1.4.1 Doğal görünmeyen ilişkileri anlamaya çalışmak:
Troll ve bot hesaplar arasındaki fark:
Bot: İnsan davranışlarını taklit etmek üzere programlanan otomatik sosyal medya hesapları
- Onur Varol (Sabancı Üniversitesi)’un da dahil olduğu bir grup tarafından Indiana Üniversitesi’nde geliştirilen botometer
Troll: Bu hesaplar ise insanlar tarafından kontrol ediliyor (bireyse olarak hareket edebileceği gibi grup halinde de hareket edebilirler).
Time-based correlation (orijinal tweetin hemen sonrası benzer zamanlarda yapılan retweetler)
Account activity (e.g.: user_tweet_count)
Content similarity (e.g.:Sürekli retweet yapan hesaplar)
Yine benzer şekilde Harvard Üniversitesi’nde Troll hesapları tanımlamayla ilgili güncel bir çalışmada (Detecting Troll, Saving Democracy) :
content (Bu çalışmada yaptığımız kelime analizine benzer tekniklerle sık tekrarlanan kelime gruplarının tespiti)
Followers
Following
retweet sayısı
1.4.2 Şüpheli etkileşimlerin tanımlanmasıan örnek
Tweetlerin hangi cihazlardan gönderildiği bilgisi (-device type- as an edge attribute):
TheMarginale’nin tweetine retweetleyen hesaplar (devicetype Android,iPhone ya da iPad olmayan)
Filtrelenen veri:
Code
<- subset(joined.clean, created_at> "2020-12-27T00:00:18" & created_at < "2021-01-02T00:23:18")
st1.joined.clean
<- st1.joined.clean%>%
st1.joined.clean.filtered filter(st1.joined.clean$source == "Twitter Web App")
<- st1.joined.clean.filtered%>%
st1.joined.clean.filtered filter(st1.joined.clean.filtered$sourcetweet_id == "1343167361466191874")
Filtrelenen veri için zaman serisi analizi:
İlgili Tweeti retweet yapan hesaplarla ilgili ekran görüntüsü:
1.5 Otomatik Metin Analizi
1.5.1 Metin temizliği aşaması
Sırasıyla; |
---|
|
1.5.2 En sık kullanılan kelimeler:
word n
1 pınar 4760
2 gültekinin 2827
3 gültekin 2514
4 davadan 2247
5 chp 2128
6 chpli 1896
7 muğla 1457
8 babası 1121
9 milletvekili 1097
10 süleyman 938
11 vazgeç 870
12 babasını 756
13 girgin 722
14 vazgeçin 611
15 ailesine 562
16 vekil 518
17 diyen 495
18 milletvekilinin 489
19 arayarak 487
20 katledilen 446
1.5.3 Kelime bulutu:
1.5.4 En sık kullanılan Emojiler:
# A tibble: 10 × 2
emoji n
<chr> <int>
1 😡 44
2 🔴 34
3 ❗ 29
4 🔹 25
5 🔥 23
6 👇 22
7 ▪️ 18
8 📌 17
9 💣 16
10 🤬 16
1.6 Skip-gram Modeli
n-gram ve skip-gram ile metnin küçük parçalara ayrılması korelasyonların ve kelimelerin etrafındaki bağlamın incelenmesine olanak verir.
N-gram, örnek bir metin içerisindeki bitişik bir n sayıda öğe (bu çalışmada öğe ile kastedilen her bir kelimedir) dizisidir
n ifadesi metni kaçar kaçar böleceğimizi açıklar. n = 1 ise “unigram” , n = 2 ise “bigram” (art arda gelen iki kelime), n = 3 olduğundaysa “trigram” olarak ifade edilir.
n-gram modelleri doğal dil öğrenme (natural language processing -NLP) uygulamalarında bir sonraki gelecek metni ya da sözü tahmin etme yolu olarak sıklıkla kullanılır
k-skip-n-gram için n öğe (kelime) sayısını, k ise kaç kez atlama (skip) yapılmasına izin verildiğini ifade eder.
Dolayısıyla bir n-gram aslında hiç atlama olmadığı için 0-skip-n-gram ile aynı anlama gelmektedir
Skip-gram modeli, metin içerisindeki bir kelime için, yine metin içindeki onunla alakalı çevresindeki diğer kelimeleri tespit etmek için kullanılan güdümsüz bir öğrenme tekniğidir
1.6.1 Ağ Görselleştirmesi
1.6.2 Tüm zamanın metin analizinde ortaya çıkan gruplar (clusters)
[1] "gültekin, pınar, katledilen, öğrencisi, yeni, cinayetinde, vahşice, üniversite, öldürülen, gültekini, cinayeti, davasında, son, katleden, flaş"
[2] "cemal, metin, katil, mertcan, zanlısı, kardeşi, avcı, tahliye, avcının, sanık, cma, cüce, muğladaki, isimli, mekanın"
[3] "kadınların, pınargültekin, önceki, kişiyi, etiketler, sesiyim, yazıp, etiketleyebildiğiniz, çiçek, yeter, istanbulsözleşmesiyaşatır, çek, üzerinden, kadınasiddetedurde, misiniz"
[4] "gültekinin, davadan, katili, babasını, arayarak, vazgeç, sıddık, babası, ailesinin, ailesine, arayıp, rezan, cansız, diyen, avukatı"
[5] "emine, ozgecan, sule, münevver, aleyna, ceren, helin, cet, güleda, bulut, aslan, cakır, karabulut, ozdemir, oldürüldü"
[6] "süleyman, chp, muğla, chpli, milletvekili, ağır, suç, yönetim, katilin, ilçe, iddianame, hakkında, ceza, gündür, ailesi"
[7] "ortaya, ifadesi, görüntüleri, çıktı"
[8] "pinargultekin, adalet, pınargültekiniçinadalet, gerçek, erkek, istiyoruz, eski, tweet, imza, kampanyaya, arkadaşı, pınargueltekinicinadalet, yerini, sevgilisi, atın"
[9] "kadın, reddi, hakim, öldü, ülkede, cinayetleri, kız, yakılarak, talebi, insanlık, koklamaya, diyor, cesedi, külünü, öpüp"
[10] "adli, otopsi, tıp, raporu"
[11] "diri, yakılmış, yakıldığı"
[12] "üzerine, üstüne, beton, dökülen, varile, koyup, döken, dökülmüş, konup, dökülerek"
[13] "kan, donduran"
[14] "allahtan, allah, rahmet, belanızı, versin, eylesin"
[15] "bağ, keşif, evinde, yapılacak, evine"
[16] "cinayete, kurban, giden"
[17] "ört, bas, etmeye, etmek, isteyen, pis, çalıştı, ellerini"
[18] ""
[19] ""
1.6.3 Metin Analizi - Ağ Görselleştirmesi
667875 adet ikili kelime grubu (ski-gram analiziyle oluşturulan)
Code
nrow(skip.gram.count)
[1] 667875