ÖRNEKLEME VE RANDOMİZASYON
Araştırmanın amacı, bir gruptaki gozlemlerden topluma genelleme yapabilmektir. Orneğin yeni bir antihipertansif ilacın etkinliğini tum hipertansiflerde denemek olası değildir. Bu amacla yapılan bir araştırmada bir grup hipertansif hasta uzerinde bu ilacın etkisi denenir ve sonuclar genellenir; yani “bu
ilac hipertansif hastalarda kan basıncını duşurmede etkilidir (ya da değildir)” denir. Calışmaya alınan deneklerin oluşturduğu gruba orneklem (sample), bu grubun temsil ettiği topluma evren (population) adı verilir. Yukarıdaki ornekte calışmaya alınan hipertansif hastalar orneklemi oluşturmaktadırlar. Bu calışmanın temsil ettiği evren ise tum hipertansif hastalardır. Bir calışmanın sonucları, yalnız calışma ornekleminin temsil ettiği evrene genellenebilir.
ÖRNEKLEME
Bir yıl boyunca Ankara’da hastaneye yatan hastaların tanılara gore dağılımını oğrenmek istiyorsak, en doğru sonuc tum hastane kayıtlarının toplanmasından elde edilir. “Tum hastane kayıtları” evreni oluşturur. Ama tum evreni bir calışmaya almak zaman ve para acısından altından kalkılabilecek bir şey değildir. O nedenle tum evreni temsil eden bir grup alıp, orneklem oluşturmak ve bu orneklemdeki deneklerin verilerini evrene ekstrapole etmek daha ekonomik olur. Bunun doğru olabilmesi icin orneklemin evreni doğru temsil etmesi gerekir. Bu nedenle orneklemdeki deneklerin evrenden rastgele (random) olarak secilmesi gerekir. Orneğin, yukarıdaki calışma icin Ankara’daki tum universite hastanelerinin kayıtlarının alınması yanıltıcı olabilir, cunku diğer hastanelerle karşılaştırıldığında universite hastanelerine tanı ve tedavisinde daha cok sorun olan hastalar yatmış olabilir. Boyle bir orneklemden elde edilecek sonuclar tum evrene genellenirse, hata yapılır. Ornek 13’teki calışmadan “Bu ilac Behcet hastalığında yararlıdır” sonucunu cıkarmadan once, orneklemin evrenden iyi secilip secilmediğini araştıralım. Orneklemdeki hastalarda deri tutulumunun hakim olduğu ve eklem ve goz tutulumunun nadir olduğu kestirilebilir. Bu nedenle bu calışmadaki orneklemin “Behcet hastaları” evrenini iyi temsil etmediği anlaşılabilir. Bu calışmanın sonuclarının genellenebileceği evren “Behcet hastaları” değil “Deri tutulumu olan Behcet hastaları”dır. Cunku ornekleme girecek hastalar “Tum Behcet hastaları” evreninden rastgele secilmemişlerdir. Calışmalar icin orneklem oluştururken, bazı randomizasyon yontemlerinin uygulanması gerekir. Orneklem secimi icin kullanılan başlıca dort yontem vardır: basit rastgele ornekleme, sistematik ornekleme, tabakalı ornekleme ve kume (cluster) tipi ornekleme. Bu dort yontemin nasıl olduğunu anlamak icin aşağıdaki ornekteki calışmayı ele alacağız.
Basit rastgele örnekleme
Her yatış dosyasının 1’den 12000’e kadar numaralandığını varsayalım. Basit rastgele (random) orneklemede ceşitli istatistik kitaplarındaki rastgele sayılar tablosundan ya da bilgisayarlardaki ornekleme modullerinden yararlanarak 1000 tane sayı belirlenir ve dosya numarası bu 1000 sayının icinde olan hastalar, ornekleme alınır.
Sistematik örnekleme
Bu yontemde evren genişliği (evrendeki denek sayısı), orneklem genişliğine (orneklemdeki denek sayısı) bolunerek elde edilecek rakam kullanılarak, ornekleme alınacak denekler belirlenir. Orneğin 12000/1000 = 12 olduğu icin once 1’den 12’ye kadar olan rakamlardan biri rastgele secilir. Orneğin bu rakam 5 olsun. Kayıt numarası 5 olan dosya ornekleme secilir. Daha sonra kayıt numarası 5+12 = 17 olan, 17+12 = 29 olan, ... diğer dosyalar secilerek, 1000 denekli orneklem tamamlanır.
Tabakalı örnekleme
Tamamen rastgele secim bazen sakıncalı olabilir. Orneğin her yaş grubundan hastalara ait dosyaların ornekleme alınması isteniyorsa, rastgele secim yapıldığında, bazı yaş gruplarından dosyalar secilmemiş olabilir. Tabakalı orneklemede, orneklem secimine başlamadan once, evren, belirlenmiş ozellikler acısından tabakalara ayrılır ve her tabakadan rastgele secim yapılır. Yaş dışında, cinsiyet, hastalığın şiddeti ya da evresi, suresi gibi ozellikler de tabakalı ornekleme icin sıklıkla kullanılır. Orneklemde olculecek değişkenin ozelliklerine uygun tabakalandırma kriterleri secilmelidir. Aksi halde fazla tabaka kullanma nedeniyle orneklem cok genişler. Orneğin anemi prevalansının araştırıldığı bir kesitsel calışmada hemoglobin değerlerini etkileyen yaş ve cinsiyet acısından tabakalandırma yapılması gereklidir. Orneklemin yaş ve cinsiyet acısından evrene benzemesi boylece sağlanabilir. Tabakalandırma yapılmadan tamamen rastgele secilen bir orneklemde bir cinsiyetin, ya da yaş grubunun daha fazla bulunması gibi istenmeyen durumlar ortaya cıkabilir. Tabakalı orneklemede goz onune alınması gereken bir konu, orneklem seciminden once evrene ait bazı ozelliklerin bilinmesi gerekliliğidir. Tablo 1 incelendiğinde, anemi prevalansı calışmasına alınan deneklerin %40’ının erkek, %60’ının kadın olduğu, ayrıca deneklerin %35’inin 60-79 yaş grubunda olduğu gorulmektedir. Oysa evrende erkek-kadın dağılımı eşit ve 60-79 yaş grubundakilerin oranı %15’tir. O halde orneklemde evrene gore daha fazla oranda kadın ve daha fazla yaşlı denek vardır. Bu nedenle hem erkek denekler grubu, hem de tum grup icin ortalama Hb değeri olması gerekenden daha duşuk olarak bulunmuştur. Bunun nedeni ya tabakalı ornekleme yonteminin kullanılmamış olması ya da her tabakaya duşecek denek sayısını belirlerken, evren oranlarının dikkate alınmamış olmasıdır. Yeniden Ornek 14’e donersek, hastane yatış kayıtları mevsime gore dort tabakaya ayrılıp, daha sonra her mevsimdeki yatış dosyalarından 250’şer tanesi ornekleme secilirse, farklı mevsimlerde yatan hastaların ozellikleri acısından rastgele orneklemeye gore evreni daha iyi temsil eden bir orneklem oluşturulmuş olur.
Küme tipi örnekleme
Bu ornekleme yonteminde once evren, kume (cluster) adı verilen altbirimlere bolunur. Daha sonra her kumedeki tum denekler, ya da diğer randomizasyon yontemlerinden birine gore secilen denekler ornekleme alınır. Orneğin cok merkezli calışmalarda her merkez bir kumeyi oluşturur. Her merkezden hangi bireylerin ornekleme secileceği ise başka bir yonteme gore belirlenebilir. Ornek 14’te hastalık sıklıklarının mevsimlere gore farklılık gostermesi nedeniyle, ornekleme her mevsimden hastaların alınması daha doğru olacaktır. Bunu sağlamanın bir yolu tabakalı ornekleme yontemidir. Alternatif olarak kume tipi ornekleme de kullanılabilir. Once 12000 hastane yatış kayıtları aylara gore 12 kumeye ayrılıp, daha sonra bu 12 kume icinden her mevsimden birer ay olmak uzere Ocak, Nisan, Temmuz ve Ekim aylarında yatanlar ornekleme alınmaya aday olarak secilebilir. Her aydaki yatış sayısı aşağı yukarı eşitse, 12000 yatışın 4000’i bu aylarda gercekleşmiş olmalıdır. Bu sayı hala istediğimiz orneklem genişliği olan 1000’den fazla olduğuna gore bu hastalar arasından dortte birini secmemiz gerekir. Bu kez her aydaki yatış kayıtları haftalara gore dorder kumeye ayrılıp, Ocak ayının ilk haftası, Nisan ayının ikinci haftası, Temmuz ayının ucuncu haftası ve Ekim ayının dorduncu haftasında yatan tum hastaların dosyaları, ornekleme alınabilir. Bu şekilde secilen orneklemde yaklaşık 1000 denek bulunması umulabilir. Eğer ceşitli altkumelere ayrıldığı halde istenen denek sayısından daha fazla denek kalıyorsa, denek sayısı rastgele ya da tabakalı ornekleme yontemleri ile istenen orneklem genişliğine indirilir. Kume tipi ornekleme, kamuoyu araştırmalarında sıklıkla kullanılır. Orneğin bir şehirdeki 20 semtten beşi secilir. Bu beş semtin her biri bir kumedir. Tum kumelerdeki bireylerin hepsi calışmaya alınabileceği gibi, her semtteki sokaklar ve her sokaktaki evler de altkumeleri oluşturabilir.
Tum bu orneklem secim yontemleri, evreni iyi temsil edecek bir orneklemin secilmesinden başka, klinik calışmalarda deneklerin tedavi ya da plasebo gruplarından hangisine alınacağını belirlemek icin de kullanılabilir.
RANDOMİZASYON
Paralel duzende yapılan bir calışmada once hastalar calışmaya alınma olcutleri acısından değerlendirilir. Olcutlere gore uygun olmayan hastalar calışma dışı bırakılır. Uygun hastalar ise tedavi gruplarından birine alınır. Hastalara verilecek tedavinin secilme yontemi yapılacak calışmanın sonuclarının guvenilirliği acısından cok onemlidir. Tedavi seciminin araştırıcının insiyatifinde olmasının onemli sakıncaları vardır. Orneğin yeni ve etkinliği pek de bilinmeyen bir antidepresif ilacın plaseboyla karşılaştırıldığı bir calışmada araştırmacılar bilincli ya da bilincsiz olarak, depresyon bulgularının ağır olduğu bir hastalarda ilacı, hafif olduğu hastalarda plaseboyu secebilir. Boylece ilac grubunda ağır depresyonlu, plasebo grubunda hafif depresyonlu hastalar yer alacağı icin elde edilecek sonuclar ilac aleyhine olabilir. Bu nedenle hastaların calışma gruplarına seciminin rastgele olmasının sağlanması gerekir. Bunu sağlayan yontemlere randomizasyon adı verilir. Randomizasyon, hastaların tedavi gruplarına secilmesinde bilincli ya da bilincsiz olarak yapılan “manipulasyon”ları engeller. En kolay randomizasyon yontemi basit randomizasyondur. Orneğin hastalara verilecek tedavinin yazı-tura ile belirlenmesi bir basit randomizasyon yontemidir. Bu yontemle hastaların prognostik etkenler acısından durumları dikkate alınmadığı halde, ozellikle hasta sayısı fazla tutulduğunda genellikle dengeli dağılım sağlanabilir. Hasta sayısı az olduğu zaman basit randomizasyonla bile gruplar arasında dengesizlik olabilir. Hasta sayısı arttıkca, gruplar arasında dengesizlik olma olasılığı azalır. Hasta sayısının az olduğu bir calışmada basit randomizasyon tek başına dengesizliğin azaltılmasında yeterli olmayabilir. Bu durumda randomizasyona şu iki yontemden biri ya da her ikisi birlikte eklenmelidir:
• Tabakalandırma
• Bloklama
Ornek 16’daki araştırmada, araştırmacı once hastaları bir ya da daha cok prognostik etkene gore sınıflandırır (tabakalandırır), daha sonra her tabakaya baştan belirlenmiş (ve genellikle eşit) sayıda hasta girecek şekilde hastaları secer (bloklar). Orneğin her iki erkek hastadan birini bir gruba, diğerini diğer gruba sececek şekilde bir randomizasyon şeması kurar ve kadınları da aynı şekilde secerse, calışma grupları cinsiyete gore tabakalandırılmış ve ikili gruplar halinde bloklanmış olur. Orneğin ilk erkek hastayı yazı-tura ile Agrubuna sectikten sonra gelen erkek hasta zorunlu olarak B grubuna alınır. Ucuncu erkek hastada yine yazı-tura ile ilac secimi belirlenir. Aynı işlem kadınlar icin de benzer şekilde yapıldığında, tabakaların birleştirilmesi ile gruplar kendiliğinden dengeli olur. Yazı-tura yerine istatistik kaynak kitaplar ya da bilgisayarlardan elde edilebilecek rastgele sayılar tablosundan yararlanarak da randomizasyon yapılabilir. Tablo 2’de cinsiyetin tabaka değişkeni olduğu ve blokların ikişer kişiden oluştuğu bir randomizasyon şeması goruyorsunuz. Blok I’de ve II’de ikişer erkek, blok III ve IV’de ikişer kadın yer almaktadır. Her bloktaki hastaların biri ilac grubuna, diğeri ise plasebo grubuna secilmiştir. Boylece iki grubun cinsiyet acısından benzer olması sağlanmıştır. Tablo 2’deki
randomizasyon şemasına gore ilk erkek hastaya ilac, ikinci ve ucuncu erkek hastaya plasebo, dorduncu erkek hastaya ilac verilecektir. Tabakalandırmaya mutlaka bloklama da eşlik etmelidir. Aksi takdirde basit randomizasyon ile bloklama yapılmadan yapılan tabakalandırma arasında, gruplar arası dengenin sağlanması acısından fark yoktur. Ama tabakalandırma olmaksızın bloklama yapılabilir. Orneğin tek amac gruplarda hasta sayısının eşit olması ise, tek başına bloklama yeterlidir. Birden cok ozellik acısından da tabakalandırma yapılabilir. Kac adet tabakalandırma değişkeni kullanılacağının seciminde tedaviye yanıtı etkileyen prognostik etkenlerin (ya da kontrol değişkenlerinin) araştırmacı tarafından, henuz araştırma başlamadan belirlenmesi onemlidir. Prognostik etkenlerin neler olduğu ya literaturdeki bilgilere dayanarak, ya da araştırmacının deneyimlerine dayanarak secilmelidir. Ornek 17’deki calışmada uygulanacak tabakalandırmada ozen gosterilmesi gereken konu, her tabaka değişkeninin nasıl kategorize edileceğidir. Ornek 16’da “cinsiyet”in iki adet kategoriden oluşacağında kuşku yoktur. Ancak yaş, vertebra sayısı gibi sayısal değişkenler icin tabakaların kategorilerinin
araştırmacı tarafından belirlenmesi gerekecektir. Eğer gereğinden fazla kategori kullanılırsa, araştırmaya alınacak hasta sayısının cok artması ve buna rağmen gruplar arası dengenin tam olarak sağlanamaması gibi sakıncalar ortaya cıkabilir. Orneğin “yaş” tabakasının kategorileri “0-4, 5-9, 10-14, 15-19, ...” gibi beşer yıllık ve “vertebra sayısı” tabakasının kategorileri “1-3, 4-6, 7-9, ...” gibi ucer vertebra olarak belirlenirdiğini ve “skolyoz nedeni”nin ise “doğumsal, edinsel” olarak iki kategoriden oluştuğunu varsayalım. Operasyon bolgesindeki vertebra sayısı “7-9” grubuna giren 6 yaşında (yani 5-9 yaş grubuna giren) doğumsal skolyozu olan bir hasta desmopressin grubuna alındığında, plasebo grubuna da vertebra sayısı ve yaşı benzer olan doğumsal skolyozlu bir hastanın alınması gerekecektir.
Aksi takdirde gruplar, prognostik etkenler acısından dengeli olmayacak ve tabakalandırma işe yaramamış olacaktır. Ote yandan tabakaların kategorilerinin fazla geniş olması da sakıncalıdır. Orneğin “vertebra sayısı” tabakasının kategorileri “1-10 ve >10 vertebra” olarak belirlenirse, 2 vertebraya mudahele yapılacak bir hastayla 10 vertebraya mudahele yapılacak bir hasta aynı kategoride ele alınacak ve kanama miktarına vertebra sayısının etkisi acısından bu iki hasta arasında fark olmadığı
varsayılacaktır. Hem tabaka sayısı, hem de tabakalardaki kategori sayısı arttıkca araştırmanın yurutulmesi ve grupların dengesinin sağlanması gucleşir. Bu nedenle prognostik etkisi belirgin olmayan değişkenlere gore tabakalandırma yapılmasından kacınılması uygun olur. Aynı şekilde tabakaların kategorilerinin alt ya da ust sınırlarının belirlenmesinde de prognostik acıdan aralarında fark olduğu varsayılan sınırlar secilmelidir. Orneğin alt solunum yolu infeksiyonu gelişmesinde yaşın etkisine gore grupların benzerliğini sağlamak icin hastaların “45’in altında - ustunde” olarak iki kategoriye ayrılması yeterli olacaksa “20-24, 25-29, 30-34, ...” gibi dar kategoriler oluşturmaya gerek yoktur. Tabakaların kategorilerinin eşit genişliklerde olması gerekmez. Orneğin ozellikle ilk yaşta ve 60 yaşından sonra daha ağır seyreden ve bu nedenle ilaca yanıt acısından bu yaş gruplarında farklı seyir gosteren bir hastalık icin yaş acısından tabakalandırma yapılacağı zaman kategoriler “0-1 yaş, 2-20 yaş, 21-60 yaş ve >60 yaş” olarak belirlenebilir. Onemli olan kategorilerin alt ya da ust sınırlarının, hastaları prognoz acısından farklı olan gruplara ayırmasıdır. Tekrar skolyoz cerrahisi orneğine donersek, araştırmacı tarafından yaşın “<20,>49” olarak uc kategoriye, vertebra sayısı tabakasının “1-5, 6-10 ve >10” olarak uc kategoriye ve “skolyoz nedeni”nin ise “doğumsal, edinsel” olarak iki kategoriye ayrıldığını duşunelim. Bu durumda bu uc prognostik etken acısından 3 X 3 X 2 = 18 kombinasyon olacaktır (Tablo 3). Gorulduğu gibi “<20>ş, 6-10 vertebra sayısı ve doğumsal skolyoz” ve “20-49 yaş, 6-10 vertebra sayısı ve doğumsal skolyoz” tabakalarında desmopressin ve plasebo gruplarında hasta sayıları eşit değildir. Buna bağlı olarak grupların tam dengeli olmadığı soylenebilir. Bazı gruplarda hem desmopressin, hem de plasebo gruplarında hasta olmaması grupların dengesi acısından sakınca yaratmaz. Calışma suresince bu 18 kombinasyondan bazılarına uygun hastaların bulunmamasının gorulmemesi tabakalandırma ve bloklama icin bir engel değildir. Orneğin hem desmopressin, hem de plasebo grubunda 20 yaşından kucuk, 1-5 vertebraya mudahele yapılacak edinsel skolyozu olan hasta olmaması sorun oluşturmaz. Onemli olan toplam 18 altgruptaki hasta sayılarının desmopressin- plasebo gruplarında eşit olmasıdır. Ancak her şeye rağmen tum prognostik etkenler acısından gruplar arasında denge tam olarak sağlanamayabilir.
TABAKALI ANALİZ
Calışma gruplarının prognostik etkenler acısından dengeli olmasını sağlamanın en guvenilir yolu tabakalı randomizasyondur. Ancak kimi zaman araştırmaya başlarken prognostik onemi olmadığı sanılan bir etkenin araştırma sırasında ya da araştırmanın yurutulmesi bittikten sonra prognostik oneminin olduğu ve bu ozellik acısından grupların dengeli olmadığı anlaşılabilir. Orneğin araştırmanın başlangıcında henuz bilinmeyen bir etkenin prognostik onemi olduğu, araştırma henuz devam ederken ya da bittikten sonra başka araştırma grupları tarafından gosterilebilir, ya da daha sıklıkla araştırmaya başlamadan once yapılan literatur taramasının yetersiz olmasına bağlı olarak, başlangıcta yapılan randomizasyonda bu etkene gore tabakalandırma yapılmamış olabilir. Bu durumda prognostik etkenlerin dengesizliğinin cozumunde kullanılabilecek bir yontem, analizi tabakalandırmaktır. Tabakalı analiz, calışma grupları icindeki prognostik etkenler acısından homojen altgrupların analizinin ayrı ayrı yapılmasıdır. Bu yontemle calışmanın gucu azalır, ama ciddi denge sizlik nedeniyle işe yaramayacak bir calışmada yapılması gereken budur. Tabakalı analizin nasıl yapıldığını Ornek 18’deki calışmada inceleyelim. Tablo 4’ten Tablo 9’a kadar yer alan tablolarda Ornek 18’deki calışmadaki verilere ilişkin capraz tablolar gorulmektedir. Beta-bloker grubunda 21, kalsiyum antagonisti grubunda 30 hastanın MI gecirdiği gozleniyor ve ki-kare analizi ile beta-bloker grubundaki MI oranının kalsiyum antagonisti grubundan istatistiksel olarak onemli derecede az olduğu goruluyor (p=0.03) (Tablo 4). Ancak gruplardaki hastaların cinsiyetlere gore dağılımının farklı olduğu goruluyor. Beta-bloker grubunda 10 erkek, 30 kadın, kalsiyum antagonisti grubunda 30 erkek, 10 kadın var (p<0.001)>ı cinslerde ilacların etkilerinin farklı olabileceği, ya da verilen ilac ne olursa olsun farklı cinslerde hastalığın seyrinin farklı olabileceği gibi sorular akla geliyor. Gercekten de iki farklı tedavi grubundaki hastalar cinsiyet ve prognoz arasındaki ilişki acısından incelendiği zaman her iki ilac grubunda da erkeklerde MI oranının daha yuksek olduğu saptanıyor (erkeklerde p=0.04, kadınlarda p<0.001)>ının duşuk olmasının nedeni ilacın daha etkili olması mıdır, yoksa bu grupta hastalığın daha kotu seyrettiği anlaşılan cinsten, yani erkeklerden daha az hasta bulunması mıdır? Acaba her iki tedavi grubundaki hastaların cinsiyet acısından dağılımı benzer olsaydı, sonuc yine beta-bloker lehine mi bulunacaktı? Bu sorunun cozumu
icin tabakalı analiz yontemi kullanılabilir. İnfarktus oranlarının, tedaviye yanıt ya da hastalığın seyri acısından farklı olan altgruplarda, yani erkeklerde ve kadınlarda tedavi gruplarındaki ayrı ayrı incelenmesi grupların cinsiyet acısından dengesiz olmasının neden olduğu yorumlama gucluğunu ortadan kaldıracaktır. Gercekten de hem erkeklerde (p=0.41) (Tablo 8), hem de kadınlarda (p=0.46) (Tablo 9) hangi ilac kullanılırsa kullanılsın, prognozun farklı olmadığı gorulmektedir. Bu ornekte olduğu gibi calışma bittikten sonra altgrupların belirlenmesine “sonradan-tabakalandırma” (post-stratification) adı verilir. Ceşitli etkenlerin prognostik oneminin derecesinin belirlenmesinde sonradan-tabakalandırma yararlıdır, ancak bu yontemde iki sorun vardır:
• Calışmanın gucu azalır ve bazı tabakalarda hasta sayısı cok az olacağı icin istatistik analiz sonucları guvenilir olmayabilir.
• Gruplararası karşılaştırma sayısı artacağı icin “istatistiksel onemlilik enflasyonu” riski vardır.
Yeri gelmişken calışmanın gucu ya da istatistik analizin gucunu ne anlam geldiğini acıklamakta yarar var. Orneğin iki ilaca yanıtın incelendiği bir araştırmada, iki grupta tedaviye yanıt oranı arasında fark olduğu varsayımı araştırmada toplanan verilere dayanarak test edilir ve analiz sonucunda genellikle herkesin cok aşina olduğu bir p değeri elde edilir. P değeri, kabaca iki grup arasında gercekte fark olmadığı halde, şans eseri olarak fark varmış gibi sonuc elde edilmiş olması olasılığıdır. Orneğin bir ilaca yanıt oranı %45, diğer ilaca yanıt oranı %60 ve analiz sonucunda hesaplanan p değeri 0.12 ise, iki ilac arasında gozlenen bu farkın tamamen tesadufi olma olasılığı %12’dir. Ya da daha doğru bir anlatımla, bu araştırma aynı sayıda hasta ile ve aynı koşullarda 100 kez yapılsa, iki ilac arasında 12 araştırmada fark bulunamayacak, 88’inde fark bulunacaktır. Ote yandan gercekte fark olduğu halde, yapılan araştırmadan elde edilen verilerin analizi ile fark olmadığı gibi bir hata da yapılabilir. Bir calışmanın gucu, gercekte fark olduğu zaman bunun istatistik analizle de gosterilebilmesi, yani saptanabilmesi olasılığı olarak tanımlanabilir. Orneğin bir calışmanın gucunun 0.85 olması, bu calışma ile eğer gercekte de fark varsa bunun %85 olasılıkla saptanabileceği anlamına gelir. Bu araştırmanın analizini 6 tane capraz tablo ile yapabildik (Tablo 4-9). MI gecirmeyi onleme etkisi acısından beta-bloker ve kalsiyum antagonisti arasında fark olup olmadığı amacıyla yapılan calışmaya 80 hasta alındığı halde erkekler (n=40) ve kadınlar (n=40) olmak uzere altgruplarda analiz yapıldığı icin (yani daha az sayıda hasta ile analiz yapıldığı icin) calışmanın gucu onemli derecede azaldı. Eğer araştırmanın başlangıcında cinsiyetin prognoz uzerine etkisi olabileceği ongorulse ve buna gore hastalar tabakalandırılarak randomize edilseydi, 80 hastayla yapılmış olan bu araştırmadaki istatistik analizin gucune, aşağı yukarı 40 hasta ile yapılacak bir calışmayla ulaşılabilecekti. Tabakalı analizin tek sakıncası calışmanın gucunun azalması değildir. İstatistikte genel ilke olarak mumkun olan en az sayıda analiz ile inceleme yapılmalıdır. Yukarıdaki ornekte hastalara verilen ilac, cinsiyet ve prognoz olmak uzere uc değişken arasındaki ilişkiyi 6 farklı tabloda analiz etmek yalnızca zahmetli olduğu icin değil, aynı zamanda istatistiksel onemlilik enflasyonuna neden olacağı icin de sakıncalıdır. İstatistiksel onemlilik enflasyonu, cok sayıda analiz yapınca gercekte fark olmadığı halde fark varmış gibi sonuc elde edilmesidir. Orneğin Tablo 4’un analizi ile hesaplanan p değerinin 0.03 olması, iki ilac arasında prognoz acısından tamamen şansa bağlı olarak fark olması olasılığının %3 olduğunu gostermektedir. Bilindiği gibi coğu kez p değerinin 0.05’ten daha kucuk olması halinde istatistiksel olarak onemli fark olduğu soylenir. Ancak bu araştırmada cok sayıda analiz yapıldığı icin her analizle hesaplanan p değerlerinin ne kadar guvenilir olduğu tartışılır hale gelecektir. Bu durumda Tablo 4’un analizi ile 0.03 olarak hesaplanan p değeri gercekte olduğundan daha kucuk olarak hesaplanmış olacaktır.
Sonuçların prognostik etkene göre standardizasyonu
Standardizasyon, tabakalardaki sonucların ağırlıklandırarak kullanılmasıdır. Ağırlıkların secimi, analizin amacına gore değişir.Standardizasyonun nasıl yapıldığını şu ornekte inceleyelim: Ornek 19’daki calışmada gruplar cinsiyet acısından dengeli olmadığı icin once kan basıncındaki duşme miktarı her grupta erkekler ve kadınlar icin ayrı ayrı analiz edilmiştir (Tablo 11). Erkek ve kadınlarda kan basıncındeki azalma miktarı arasında farklılık olduğu gorulmektedir. Bu nedenle erkekleri ve kadınları iceren tum grubun ortak sonucu guvenilir olmayacaktır. Gruplar cinsiyet acısından dengeli olmadığı icin, tedaviye yanıtın nasıl olacağını kestirmek icin sonuclar standardize edilmelidir. Ailacı alan hastalarda gozlenen ortalama kan basıncı duşmesi 23.9 mmHg’dır. Calışmaya alınan 150 kişiden yarısı erkek, yarısı kadın olduğuna gore, bu 150 kişiye A ilacı verilseydi, kan basıncındaki ortalama duşme (25.4 x 0.50) + (22.4 x 0.50) = 23.9 mmHg olacaktı. Hesaplanan bu değer standardize edilmiş ortalama kan basıncı azalma miktarıdır. Bu gruptaki hastaların cinsiyete gore dağılımı tum gruptaki dağılımın aynısı olduğu icin, yani yarı yarıya erkek ve kadın olduğu icin standardize ortalama, gozlenen ortalamadan farklı değildir. B ilacı verilen grupta gozlenen ortalama kan basıncı duşmesi 34.0 mmHg’dır. Benzer şekilde hesaplandığında standardize ortalama, (22.4 x 0.50) + (38.9 x 0.50) = 30.6
mmHg olarak hesaplanmıştır. Yani bu grupta 15 erkek, 35 kadın değil de, 25 erkek, 25 kadın olsaydı, ortalama kan basıncı duşmesi 30.6 mmHg olacaktı. Plasebo grubunda ise gozlenen ortalama 4.5 mmHg, hesaplanan standardize ortalama ise (1.2 x 0.50) + (8.9 x 0.50) = 5.1 mmHg’dır. Bu uc ortalama, artık cinsiyetin etkisinden arıtılmıştır, cunku her ucu de %50’si erkek, %50’si kadın olan hipotetik populasyonlarda gozlenmesi beklenen değerlerdir.
Kontrol değişkenlerinin etkilerinin arıtıldığı istatistik modeller
Gruplar arasında dengesizlik olduğu zaman kullanılabilecek bir yontemin tabakalı analiz olduğundan ve bu yontemin sakıncalarından yukarıda soz edildi. Dikkat ederseniz, tabakalı analizde prognostik etkene gore her altgrubun analizini ayrı ayrı yaparken, analize aldığımız hasta sayısı calışmaya aldığımız hasta sayısından daha az oluyor ve buna bağlı olarak calışmanın gucu azalıyordu. Tabakalı analizin bu sakıncalarını ortadan kaldıran ve sonuc uzerine prognostik etkenlerin (kontrol değişkenlerinin) etkilerinin arıtıldığı ve tedavinin “saf” etkisinin belirlenebildiği matematik modeller vardır. Bu yontemlerle sonuc uzerine etkisi olan etkenler (verilen ilac, cinsiyet, hastalığın şiddeti, yaş vb.) parcalara ayrılarak incelenir. Buna gore yukarıdaki ornekte kan basıncındaki duşme miktarına tedavinin katkısı ve cinsiyetin katkısı ayrı ayrı hesaplanabilir. Anstabil anjina pektoriste beta-bloker ve kalsiyum antagonistlerinin karşılaştırıldığı calışmada tabakalı analizle iki ilac arasında fark olmadığı, ilk bakışta gozlenen farkın iki gruptaki hastaların cinsiyete gore dağılımları arasındaki farktan kaynaklandığı 6 farklı capraz tablonun istatistiksel analizi ile gosterilmişti. Ancak bu sonuca ulaşabilmek icin calışmanın gucunun azalması ve istatistiksel onemlilik enflasyonu riskini goze almıştık. Bu araştırmada alternatif olarak log-lineer analiz yapıldığında iki tedavi grubundaki hastaların cinsiyet dağılımının benzer olmadığı (p<0.0001),> benzer olmadığı (p=0.0001), ancak tedavi ile prognoz arasında ilişki olmadığı (p=0.88) saptanmıştır. Burada uzerinde onemle durulması gereken nokta tedavi ile prognoz arasında ilişki olmadığını soylerken, cinsiyetin etkisinin arıtılmış olmasıdır. Prognostik etkenlerin etkilerinin arıtılmasında hangi durumlarda hangi istatistik modellerin uygulanabileceği Tablo 12’de ozetlenmiştir. Sonradan-tabakalandırma ile grup karşılaştırmaları sayısındaki artmaya bağlı “istatistiksel onemlilik enflasyonu”, bu istatistik modellerle onlenebilir. Bu yontemlerle, hem tedavinin etkisi prognostik etkenlerden arıtılmış, hem de prognostik etkenlerin onemi test edilmiş olur. Gerek tabakalı analiz, gerekse kontrol değişkenlerinin etkilerinin arıtıldığı modellerin amacı, gruplar arası dengesizliğin neden olduğu taraf tutmayı, ya da yanlılığı ortadan kaldırmaktır. Ancak iki yontem arasında onemli bir fark vardır. Tabakalı analizde, tabakalardaki hasta sayısı azalacağı icin, calışmanın gucunun azalması pahasına, taraf tutma ortadan kaldırılabilir. Kontrol değişkenlerinin etkilerinin arıtıldığı modeller kullanıldığında ise, (eğer doğru model kullanılırsa) hem taraf tutma azalır, hem de sonucların doğruluk derecesi artar. Boylece istatistiksel onemliliği sınırda olan yargıların doğruluğu artabilir, ya da bazen tersine farklı tedavi grupları arasında istatistiksel olarak onemli gorunen farklılıkların tedavinin kendisinden değil, gruplar arası prognostik etken dengesizliğinden kaynaklandığı ortaya konabilir. Model kullanılmasının bir diğer yararı ise prognostik etkenlerin onemlilik derecesinin belirlenmesi ve daha sonra yapılacak calışmaların planlanmasında yararlı olacak veriler elde edilmesidir.
Prognostik etken denetim yöntemlerinin karşılaştırılması
Calışma grubu (orneklem) yeterince buyukse, basit randomizasyon, olculen ve olculmeyen prognostik etkenler acısından yeterli dengeyi genellikle sağlar. Randomizasyona bir-iki onemli prognostik etkene gore tabakalandırma ve bloklama eklenirse, gruplar daha da dengeli olur. Herşeye karşın, calışmaya başlamadan once denetlenmeyen bazı ozellikler acısından gruplarda dengesizlik olabilir. Bu durumda hasta sayısının izin verdiği olcude sonradan- tabakalandırma yapılarak tabakalar ayrı ayrı analiz edilebilir. Grupların dengesi mukemmel olsa bile, analiz sırasında prognostik etkenlere gore standardizasyon yapılması ile gruplarda tedaviye yanıtın karşılaştırılması daha da saflaştırılmış olur. Sonradan-tabakalandırma ve prognostik etkenlere gore standardizasyon birbirini tamamlayan iki yontemdir. Sonradan-tabakalandırma ile prognostik etkenler acısından farklı olmalarına karşın, grupların karşılaştırılmasının ne kadar gecerli olduğu test edilmiş olur. Standardizasyon ile sonucların doğruluğu daha da belirginleştirilip, calışmadan daha fazla bilgi edinilmiş olur. Araştırmanın amacı, calışmaya alınan hastalardaki sonucların tum hastalara genelleştirilebilmesidir. Bu yazıda anlatılan randomizasyon ve prognostik etken denetim cabalarının nedeni budur.
Yorumlar
Yorum Gönder