Ana Sayfa Manşet Google Trendler İle COVID-19’un Analiz Edilmesi: Türkiye ve Dünya Vaka Örnekleri

Google Trendler İle COVID-19’un Analiz Edilmesi: Türkiye ve Dünya Vaka Örnekleri

Tevfik Bulut

Tevfik Bulut‘un çalışması  Uluslararası hakemli dergi olan Sağlık Bilimlerinde Yapay Zeka Dergisi (Journal of Artificial Intelligence in Health Sciences)’nde yayınlanmıştır.

Analyzing COVID-19 with Google Trends: Turkey and World Case Studies
Tevfik Bulut
T.C. Sanayi ve Teknoloji Bakanlığı
https://orcid.org/0000-0002-3668-7436

Bu çalışmada 01.01.2020 ile 21.03.2021 tarihini içine alan yaklaşık 14 aylık süre içerisinde büyük veri kaynağı olan Google Trends’i kullanarak COVID-19 pandemisinin eğilimleri ve bu eğilimler ile COVID-19 vakaları arasındaki ilişki düzeylerinin analiz edilmesi amaçlanmıştır.

 

Bu amaçla, öncelikle koronavirüs verileriyle ilişkili arama terimlerine göre oluşturulan Google Trends verilerine bağlı olarak pandeminin seyri hem Türkiye hem de Dünya bağlamında ortaya konulmuştur. Ardından ise günlük onaylanmış koronavirüs vakaları ile koronavirüs ilişkili arama terimleri kullanılarak üretilen Google Trends verileri karşılaştırmalı olarak hem Dünya hem de Türkiye özelinde incelenmiştir.

Son olarak, Türkiye’de ve Dünyada Google Trend koronavirüs pandemisi ilişkili alt arama sorgularında öne çıkan arama terimleri ortaya konulmuştur. Türkiye ve Dünya vakalarından elde edilen bulgular, Google Trend Hit sayıları ile günlük onaylanmış vaka sayıları trendinin birbiriyle benzerlik göstermediğini ortaya koymuştur. Aynı zamanda Türkiye ve Dünya vakalarında Google Trend Hit sayılarının izlediği dalgalı seyrin aksine günlük onaylanmış vaka sayılarının doğrusal bir seyir izlediği gözlenmiştir. Google Trends üzerinden halk sağlığına yönelik arama faaliyeti verileri, COVID-19 pandemisi gibi halk sağlığı krizlerinde gerçek zamanlı, bilgilendirici ve maliyet etkili halk sağlığı politikaları oluşturulmasında ön bulgu olarak kullanılabilir. Bu tür bulgular aynı zamanda istatistiki verilerle ile karşılaştırılarak aralarındaki ilişki ortaya konulabilir.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla Tevfik Bulut

https://tevfikbulut.net/

 

New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models

Tevfik Bulut

Soyut

Çalışmanın temel amacı, COVID-19 örneğinden yola çıkarak salgınların boyutunu ölçmek için geliştirilen dalga boyu modellerini tanıtmaktır. Bu sayede salgınların dalga boyları hesaplanarak salgınların ulusal ve uluslararası düzeyde geçerli, güvenilir ve takip edilmesi kolay olması sağlanır. Dalga boyu modelleri, onaylanmış vaka, ölüm, kurtarılmış vaka ve net dalga boyu modellerinden oluşur. Böylece salgının boyutu hem tek tek hem de bir bütün olarak ölçülebilir. Modellerin uygulanmasını göstermek için 181 ülkenin COVID-19 vakaları kullanıldı. Uygulanan dalga boyu modellerinde öne çıkan bulgular şu şekildedir: En yüksek vaka dalga boyuna sahip ülkeler sırasıyla ABD, İtalya, İspanya ve Almanya’dır. Ancak ölüm dalga boyunda İtalya ilk sırada yer alırken, onu İspanya, ABD ve Fransa takip ediyor. Diğer taraftan, Çin, iyileşen vaka dalga boyunda ilk sırayı aldı. Bu ülkeyi sırasıyla İspanya ve Almanya ve İtalya izledi. Bahsedilen tüm bu dalga boyu modellerine dayanarak net dalga boyu uzunlukları hesaplanır. Elde edilen net dalga boyları bulgularına göre Kanada ilk sırada yer alırken, onu sırasıyla İngiltere, ABD ve İtalya izledi.

giriş

Dünyayı derinden etkisi altına alan koronavirüs pandemisinde, 2 Nisan 2020 tarihi itibarıyla teyit edilen toplam vaka sayısı bir milyonu, hayatını kaybedenlerin sayısı ise elli iki bini aştı [ 4 ]. Durum böyleyken dünya, koronavirüs salgınıyla mücadele için önleyici tedbirlerden tedavi edici tedbirlere kadar yoğun bir çalışmanın içine girmiştir [ 8 , 9 , 10 , 11 , 15 ].

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar birçok hastalığa neden olan geniş bir virüs ailesidir [ 14 ]. Bu yeni virüs, yüzey çıkıntıları taçlı olduğu için koronavirüs olarak adlandırılır ve bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir. Coronavirüs hastalığı (COVID-19), Aralık 2019’da Çin’in Hubei Eyaleti, Wuhan’da keşfedildi. Bu hastalık insandan insana solunum yoluyla bulaşıyor [ 6 , 10 , 12 , 13 ].

Bu çalışma kapsamında ülkeleri derinden etkileyen koronavirüs pandemileri başta olmak üzere diğer salgınlardaki salgınların boyutunu ölçmek için matematiksel bir model geliştirilmiştir. Bu model ile salgınların dalga boyunun hesaplanması ve salgınların ulusal ve uluslararası düzeyde güvenilir ve geçerli bir temelde takibinin kolaylaştırılması amaçlanmıştır. Modellerin uygulamasını göstermek için “The Humanitarian Data Exchange (HDX)” web sitesinden alınan veri setleri kullanıldı [ 4 ].

metodoloji

Bu çalışmada, mevcut veri setinde geliştirilen matematiksel modeller ile başta koronavirüs salgını olmak üzere salgınların boyutu belirlenmiş ve salgınların boyutları ölçülebilir olmasının yanı sıra bu modların çıktılarını kendi bünyesinde karşılaştırma imkanı da sağlanmıştır. ülke ve ülkeler arası.

Dalga boylarını hesaplamak için OCHA’nın (United Nations Office for the Coordination of Humanitarian Affairs [ 4 ] web sitelerinden biri olan Human Data Exchange (HDX)) platformundan veri setleri alınmıştır . 2020-01-22’den 2020-04-02’ye kadar olan süre (bu tarih dahil) csv (virgülle ayrılmış değer) uzantısına sahip veri setleri, teyit edilmiş vakalar ve ölümler ve iyileşen koronavirüs dahil olmak üzere 3 farklı veri setinden oluştuğu için birleştirildi Veri setlerindeki vaka sayıları birikimli bir seyir izlemektedir.Analizde Microsoft Excel 2016 ve R Programlama dili kullanılmıştır [ 2 , 3 ].

Veri setlerinde ülkeler için zaman serilerinde mükerrerler olduğu için veri madenciliği teknikleri kullanılarak her ülke içinde benzersiz bir zaman serisi oluşturulmuştur. Veri setinde yer alan Dünya koronavirüs (COVID-19) vakalarına ilişkin tanımlayıcı istatistikler Tablo 1’de verilmiştir .

Tanımlayıcı istatistikler

Dünyadaki COVID-19 vakalarının seyri, onaylanmış vakalar, ölümler ve iyileşen vakalar bazında ayrı ayrı ele alınan 2020-01-22’den 2020-04-02’ye (bu tarih dahil) kadar grafikler halinde sunulmuştur. Grafiklerde x eksenine paralel mavi kesikli çizgi durumların ortalamasını göstermektedir. İlk olarak, Şekil 1’de onaylanan vakaların izlediği kurs verilir. İlk 60 günlük sürenin sonunda Şekil 1’e göre onaylanan vaka sayısında keskin bir artış oldu . Bu süre sonunda onaylanan dava sayısının ortalama dava sayısının üzerinde olduğu gözlemlendi.

Şekil 1:

Onaylanan Vakaların Zamana Göre İlerlemesi

Veri Kaynağı: Veri Değişimi (HDX)

Şekil 2’de ölüm vakalarının izlediği yol zamana göre verilmektedir . Şekil 1’dekine benzer şekilde, Şekil 2’ye göre ölüm vakalarında salgının ilk 60 gününün sonunda keskin bir artış olduğu ve ölüm vaka sayısının ortalama ölüm vaka sayısının üzerinde olduğu gözlemlendi.

Şekil 2:

Ölüm Vakalarının Zamana Göre Gelişimi

Veri Kaynağı: Veri Değişimi (HDX)

İyileşen vakaların zamana göre gelişimi Şekil 3’te verilmektedir . Şekil 1 ve 2’den farklı olarak Şekil 3’te salgının ilk 40 gününün sonunda iyileşen vakalarda keskin bir artış olduğu ve iyileşen vaka sayısının ortalama iyileşen vaka sayısının üzerinde olduğu gözlemlenmiştir .

Figür 3:

Zamana Göre İyileşen Vakaların Seyri

Veri Kaynağı: Veri Değişimi (HDX)

En fazla teyit edilmiş vaka sayısına sahip ilk 25 ülkenin vaka başına istatistikleri de 2020-01-22 ile 2020-04-22 (bu tarih dahil) arasındaki zaman diliminde tartışıldı. Bu kapsamda günlük teyit edilen vaka ve ölümlerin yanı sıra iyileşen vaka sayıları da incelenmiştir. Bulgular, ülkelere göre Tablo 2’de verilmiştir . Tablo 2’ye göre öne çıkan bulgular şu şekildedir:

-Günlük vaka sayısında ABD 3381.3 vaka ile ilk sırada yer alırken, onu sırasıyla İtalya, İspanya ve Almanya izledi.

-İtalya, yaklaşık 221 vaka ile günlük ölüm sayısında ilk sırada yer alırken, onu İspanya, ABD, Fransa ve İran izledi.

-Çin, yaklaşık 1064.3 vaka ile günlük iyileşen vaka sayısında ilk sırada yer alırken, onu İspanya, Almanya, İtalya ve İran izledi.

En Fazla Onaylanan Vaka Sayısına Sahip Ülkelerde Günlük Vaka, Ölüm ve İyileşen Sayısı

Modellerin Teorik Çerçevesi

Bu bölümde öncelikle model denkleminde kullanılan parametrelere yer verilmiştir. Daha sonra sırasıyla vaka, ölüm, iyileşen ve net dalga boyu modelleri verilmiştir. Dalga boyu denklemlerinin net dalga boyu denklemi ile ilişkisi Şekil 4’te sunulmaktadır .

Şekil 4:

Dalga Boyu Denklemlerinin Net Dalga Boyu ile İlişkisi

Şekil 4’teki denklemlerde net dalga boyunu hesaplamak için öncelikle vaka ve ölüm dalga boyu denklemleri hesaplanmalıdır. Daha sonra elde edilen dalga boyu hesaplanarak, vaka ve ölüm dalga boyu denklemleri çıkarılarak net dalga boyu elde edilir. Dalga boyu denklemlerinde kullanılan parametreler aşağıda verilmiştir.

c : Onaylanmış toplam vaka sayısı

c : Onaylanmış kümülatif toplam ölüm vaka sayısı

c : İlk vakanın açıklanmasından bu yana geçen gün sayısı

r : İlk ilan tarihinden itibaren geçen gün sayısının yılın toplam günü içindeki oranıGömülü Resim

c : Onaylanmış toplam iyileşen vaka sayısı

ln : Doğal logaritma

W : Dalga boyu

c : Vaka dalga boyu

d : Ölüm dalga boyu

r : Kurtarılan dalga boyu

net : Net dalga boyu

Parametreler dahil edildikten sonra dalga boyları için önerilen denklemlerdir. Denklemlerde doğal logaritma (ln) kullanılmasının nedeni, elde edilen değerlerin normalleştirilmek istenmesidir. Doğal logaritma çarpım katsayısının 1’e dahil edilmesinin nedeni ln (1) = 0 olmasıdır.

Dalga boyu denklemlerinde ortalama kullanılmaz. Bunun nedeni, örneğin “A” popülasyonunda ilk salgın vakanın ortaya çıkmasından bu yana toplam 20 gün içinde görülen vaka sayısının 2000 olmasıdır. Bir başka örnekte, salgından bu yana toplam 40 günde görülen vaka sayısı “B” popülasyonunda meydana gelen ilk salgın vakası 4000’dir. Her iki örnekte de “A” ve “B” popülasyonunda günlük ortalama vaka sayısı eşittir. Ancak gün ve vaka sayıları farklı olan popülasyonlar birbirinden ayırt edilmelidir. Dolayısıyla bu iki popülasyonu aynı ortalama ile aynı düzlemde değerlendirmek hatalı bulgulara neden olur. Bu ve benzeri durumlar epidemiyolojik oranlarda da mevcuttur. Dolayısıyla salgının büyüklüğünü yani dalga boyunu ortaya koymaktan uzaktırlar. Genel anlamda, pay ve paydadaki değişkenlerin değerleri aynı anda büyüdüğü veya küçüldüğü için farklılaşma olmayacaktır. Bunun bir örneği, epidemiyolojik hızlardan biri olan vaka bazlı ölüm oranıdır. Vaka ölüm oranı (CFR), belirli bir zamanda belirli bir hastalıktan ölenlerin oranıdır. CFR’de ürün katsayısı 100 [1 ]. Örneğin, “A” popülasyonunda, belirli bir hastalıkta ve belirli bir zamanda toplam vaka sayısı 1000 ve ölüm sayısı 50’dir. “B” popülasyonunda, belirli bir hastalıktaki toplam vaka sayısı hastalık ve belirli bir zamanda 10000 ve ölen kişi sayısı 500’dür. Bu durumda bu iki popülasyonda vaka ölüm oranı %5’tir.

Burada dikkat edilmesi gereken konu, COVID-19 veya diğer salgın veri setlerinde hangi zaman diliminde kaç vakaya ulaşıldığını ortaya koymaktır. Daha sonra yapılması gereken iş ise bu bulguları kullanarak salgının dalga boyunu hesaplamaktır. Çalışmada geliştirilen birçok model, salgının dalga boyunun ölçülmesinde test edildi. Son olarak aşağıdaki bölümlerde bahsedilen dalga boyu denklemlerinin kullanılmasına karar verilmiştir.

1. Vaka Dalga Boyu

Vaka dalga boyu denklem (1) yardımı ile hesaplanmıştır . Vaka dalga boyu (W c ) ne kadar yüksek olursa, popülasyondaki salgının boyutu da o kadar yüksek olur.Gömülü Resim

2. Ölüm Dalga Boyu

Ölüm dalga boyu denklem (2) kullanılarak hesaplandı . Ölüm dalga boyu (W d ) arttıkça popülasyonda salgının öldürücü etkisi artmaktadır.Gömülü Resim

3. Kurtarılan Vaka Dalga Boyu

Kurtarılan durumda dalga boyu, dalga boyu denklemi (3) yardımıyla hesaplanmıştır . İyileşen dalga boyu (W r ) arttıkça, popülasyonda salgından etkilenen vakaların iyileşme oranı da artmaktadır.Gömülü Resim

4. Net Dalga Boyu

Net dalga boyu denklem (4) yardımıyla hesaplanmıştır . Burada, vaka ve ölüm dalga boylarının toplamından elde edilen dalga boyu çıkarılarak net dalga boyu elde edilir. Net dalga boyu arttıkça popülasyonda salgının net etkisi artar.Gömülü Resim

bulgular

Bu bölüm, önceki bölümlerde bahsedilen her bir dalga boyu denkleminden elde edilen bulguları içerir. Bulgular, ilk vakanın kaydedildiği 2020-01-22 ile 2020-04-02 (bu tarih dahil) arasındaki dönemde 181 ülkedeki COVID-19 vakaları, ölümler ve iyileşen vakalardan elde edildi. Bulgular bölümünde, her bir dalga boyu denkleminde en yüksek dalga boyuna sahip ilk 12 ülkenin dalga boyu uzunlukları verilmiştir.

1. Vaka Dalga Boyu (W c )

Vaka dalga boylarına ilişkin bulgular , en yüksek dalga boylarına sahip ilk 12 ülke tarafından karşılaştırmalı olarak Tablo 3’te sunulmaktadır . Tablo 3’e göre öne çıkan bulgular şu şekildedir:

-En yüksek vaka dalga boyuna sahip ABD 36,77 puanla ilk sırada yer alırken, Belçika 28,56 puanla 12. sırada yer alıyor. En yüksek dalga boyuna sahip ABD’yi sırasıyla İtalya, İspanya ve Almanya takip etmektedir.

Tablo 3:

Vaka Dalga Boyu (W c )

2. Ölüm Dalga Boyu (W d )

Ölüm dalga boylarını içeren bulgular Tablo 4’te en yüksek dalga boyuna sahip ilk 12 ülke tarafından karşılaştırmalı olarak verilmektedir . Tablo 4’e göre öne çıkan bulgular şu şekildedir:

-Vaka dalga boyundan farklı olarak en yüksek ölüm dalga boyuna sahip İtalya 28,24 puanla ilk sırada yer alırken, Türkiye 17,49 puanla 12. sırada yer alıyor. Ölüm dalga boyunun en yüksek olduğu İtalya’yı sırasıyla İspanya, ABD ve Fransa takip ediyor.

Ölüm Dalga Boyu (W d )

3. Kurtarılan Vaka Dalga Boyu (W r )

Geri kazanılan vaka dalga boylarını içeren bulgular, Tablo 5’te en yüksek dalga boylarına sahip ilk 12 ülke tarafından sunulmaktadır . Tablo 5’e göre öne çıkan bulgular şu şekildedir:

– Diğer dalga boylarından farklı olarak, kurtarılan vaka dalga boyunda Çin 33.30 puanla 1. sırada yer alırken, Danimarka 20.99 puanla 12. sırada yer aldı. En yüksek iyileşen vaka dalga boyuna sahip Çin’i sırasıyla İspanya, Almanya ve İtalya takip ediyor.

Kurtarılan Vaka Dalga Boyu (W r )

4. Net Dalga Boyu (W net )

Net dalga boyu ile ilgili bulgular ilk on iki ülke tarafından büyükten küçüğe Tablo 6’da sunulmaktadır. Burada, net dalga boyu için önce vaka ve ölüm dalga boyları özetlenmektedir. Daha sonra bu toplamdan elde edilen dalga boyu çıkarılarak net dalga boyu hesaplanmıştır. Tablo 6’ya göre öne çıkan net dalga boyu bulguları aşağıdaki gibidir:

-Diğer tüm dalga boylarından farklı olarak net dalga boyunda Kanada 41.95 puanla 1. sırada yer alırken, Türkiye 28.83 puanla 12. sırada yer aldı. En yüksek net dalga boyuna sahip Kanada’yı sırasıyla İngiltere, ABD ve İtalya takip etmektedir.

Net Dalga Boyu (W net )

Çözüm

Bu çalışma kapsamında ülkeleri sosyal, ekonomik ve daha birçok yönden etkileyen COVID-19 pandemileri başta olmak üzere diğer salgınlardaki salgınların boyutunu ölçmek için matematiksel modeller geliştirilmiştir. Bu sayede salgınların dalga boyu hesaplanarak, salgınların ülke içinde ve uluslararası düzeyde takibinin mümkün olduğunca güvenilir, geçerli ve aynı zamanda kolay bir şekilde yapılması amaçlanmaktadır. Aynı zamanda, modellerden elde edilen bulguların karar vericiler için politika oluşturmaya katkı sağlaması beklenmektedir. Öte yandan geliştirilen modeller, salgınların boyutunu ortaya çıkarmak için tasarlanmış olsa da, enfeksiyon kaynaklı ve enfeksiyon kaynaklı olmayan diğer hastalıklarda kullanılabilir.

Geliştirilen dalga boyu modelleri, 181 ülkede COVID-19 vakaları, ölümler ve iyileşen vakalar içeren veri setleri üzerinde test edildi. Uygulamadan elde edilen bulgulara göre en yüksek vaka dalga boyuna sahip ilk dört ülke sırasıyla ABD, İtalya, İspanya ve Almanya’dır. Ancak ölüm dalga boyunda İtalya ilk sırada yer alırken, onu İspanya, ABD ve Fransa takip ediyor. Öte yandan Çin, geri kazanılan dalga boyunda ilk sırayı aldı. Bu ülkeyi sırasıyla İspanya ve Almanya ve İtalya izledi. Bahsedilen tüm bu dalga boyu modellerine dayanarak net dalga boyu uzunlukları hesaplanır. Elde edilen net dalga boylarına göre Kanada ilk sırada yer alırken, onu sırasıyla İngiltere, ABD ve İtalya izledi.

Mevcut veri setlerinde teyit edilen vaka, ölüm ve iyileşen vaka sayısı dışında başka değişken olmadığı için geliştirilen modeller bu değişkenlerle sınırlandırılmıştır. Elbette diğer değişkenler de parametre olarak bahsedilen dalga boyu denklemlerine dahil edilebilir ve dalga boyları hesaplanabilir.

Veri kullanılabilirliği

Bu çalışmada sunulan verilerin tamamı The Humanitarian Data Exchange’de (HDX) mevcuttur ( https://data.humdata.org/dataset/novel-coronavirus-2019-ncov-cases ).

https://data.humdata.org/dataset/novel-coronavirus-2019-ncov-cases

Etik beyanları

Çıkar çatışması

Yazar, herhangi bir çıkar çatışması olmadığını beyan eder.

Referanslar

  1. 1. 
  2. 2. 
  3. 3. 
  4. 4. 
  5. 5.
  6. 6. 
  7. 7.
  8. 8. 
  9. 9. 
  10. 10. 
  11. 11. 
  12. 12. 
  13. 13. 
  14. 14. 
  15. 15.