İstatistik

Kısaca: İstatistik ya da sayımlama, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. ...devamı ☟

İstatistik
İstatistik

İstatistik, kişiler ya da nesnelerin oluşturduğu bir gruptan rasgele seçilen bir örneklemden elde edilen sayısal bilgiye dayanarak bu grubun özelliklerine ilişkin geçerli sonuçlar çıkarma bilimi. Betimsel istatistik ve kuramsal istatistik adıyla iki ana bölüme ayrılır.

İstatistik belirli olayların gözlemlenmesi yoluyla elde edilen verilerin toplanması, işlenmesi ve bu verilerden bir sonuca varılabilmesi için kullanılan tekniklerin tümünü kapsamaktadır. Bir bilim dalı olarak geçmişi ve içinde bulunulan durumu sayısal yöntemlerle analiz ederek gelecek hakkında karar vermeyi kolaylaştırmaktadır. İstatistiğin konusu olan olayları, kendi türünden olayları tam anlamıyla temsil edip edemediğine bakarak ikiye ayırabiliriz. Buna göre olaylar tipik olay ve kollektif olay olarak ayrılabilir.

Tipik olay birbirinin tam benzeri olaylardır. Gerekli koşullar oluştuğunda hep aynı şekilde tekrar eden olaylardır. Fiziksel ve kimyasal olaylar tipik olay olarak örnek verilebilirler.olaylar birbirinin aynısı olduğundan bunlardan sadece bir tanesi oluşturduğu topluluğu temsil edebilir.Hidrojen ve oksijenin belirli koşullarda suyu meydana getirmesi tipik bir olaydır.

Kollektif olay ise birbirine benzemeyen, ortak yönleri olmasına karşın aralarında farklılıklar bulunan olaylardır. Genellikle canlı varlıklarla ilgili olaylar kollektif olay olarak adlandırılırlar. Nüfus kollektif olay için iyi bir örnektir. Nüfusu oluşturan bireylerin, insan olmak ve aynı bölgede veya ülkede yaşamak gibi ortak özellikleri olmasına rağmen cinsiyet,yaş,meslek gibi çeşitli özellikler bakımından farklıdırlar.

Teorik olarak tipik olaylarla kollektif olaylar birbirlerinden kolayca ayrılabilirse de gerçekte aralarında çok kesin bir çizgi çekilememektedir. Olayların tipik ve kollektif olarak ayrılması bunları etkileyen nedenlere bağlıdır. Olayları etkilen nedenler de genel neden ve rastsal neden olarak ikiye ayrılır. Genel nedenler aynı topluluktaki bütün olaylar üzerinde hep aynı yönde ve aynı derecede etkindir. Rastsal nedenler ise olayları zıt yönlerde ve çeşitli derecelerde etkilerler. Örneğin verimi etkileyen çeşitli faktörlerden toprağın cinsi ve iklim genel neden; hava değişimleri, uygulanan tarımsal teknikler, tohumun kalitesi gibi faktörler rastsal neden olarak tanımlanabilir. Büyük sayılar kanununa göre (Bernoulli) gözlem sayısı arttıkça sonuçlar rastsal nedenlerin etkisinden kurtulmaktadır. Bu kanunun işleyişine en iyi örnekler rastsal faktörlerin en belirgin olduğu şans oyunları olarak gösterilmektedir. İstatistiğin konusunu tipik olayların değil, kollektif olayların oluşturduğunu söyleyebiliriz.

İstatistik'in Tarihi

İstatistik kelimesi Modern Latincedeki statisticum collegium (devlet konseyi) ve İtalyancadaki statista (devlet adamı, politikacı) kelimelerinden türemiştir. Kelime ilk olarak Almanca'da Gottfried Achenwall tarafından devlete ait verilerin sunulduğu Statistik (1749) adlı eserde devlet bilimi anlamında kullanılmıştır. Bu tanımı içeren İngilizce terim ise o dönemde political arithmetic (siyasi aritmetik) olarak geçmekteydi. İstatistik kelimesi veri toplama ve sınıflandırma anlamını ise yaklaşık olarak 19. yüzyılın başlarında kazandı. Terim İngilizce'ye Sir John Sinclair tarafından aktarıldı.

Statistik adlı eserin temel amacı hükümet tarafından ve yönetimsel organlar tarafından kullanılacak veriler sunmaktı. Eyaletler, ve yerel bölgeler hakkında bilgi toplama işi ulusal ve uluslararası istatistik kurumları tarafından sürdürülmektedir. Daha dar anlamda nüfus hakkında düzenli bilgiler ise nüfus sayımları ile elde edilir.

20. yüzyıl boyunca kamu sağlığı ile ilgili konularda (epidemiyoloji, biyoistatistik), ekonomik ve sosyal (işsizlik, ekonometri gibi) alanlarda daha titiz araçlara ihtiyaç duyulması istatistiksel uygulamalarda ilerlemeyi zorunlu kılmıştır. Bu ihtiyaç özellikle I. Dünya Savaşı sonucu gelişen, nüfusları hakkında derin bilgi sahibi olmak isteyen refah devletlerinde daha belirgin olmuştur. Bu anlamda "toplum yönetimi adına bilgi toplama isteği" filozof Michel Foucault tarafından biyogüç olarak nitelendirilmiştir, bu terim daha sonra pek çok yazar tarafından da kullanılmıştır.

Olasılık kuramı

İstatistiğin matematiksel temelleri Pierre Fermat ve Blaise Pascal'ın 1654 yılına kadar giden olasılık kuramı hakkındaki yazışmalarına dayanır. Christiaan Huygens (1657) konunun bilinen ilk bilimsel uygulamasını sunmuştur.

Jakob Bernoulli'nin Ars Conjectandi (posthumous, 1713) ve Abraham de Moivre'nin Doctrine of Chances (1718) adlı eserleri konuya matematiğin bir dalı olarak yaklaşmıştır.

Hata teorisi Roger Cotes'nin Opera Miscellanea (posthumous, 1722) adlı eserine dayanır, fakat teorinin gözlem hatalarına uygulanmasının ilk örneği Thomas Simpson tarafından 1755'te yazılan (basım: 1756) bir bildiride bulunur. Bu bildirinin 1757 yılındaki tekrar basımı pozitif ve negatif hataların eşit derecede olasılıklı olduğu aksiyomunu kabul ederken, bütün hataları içinde bulunduracağını varsayabileceğimiz belirli tanımlanabilir limitlerin varlığından söz ederek "sürekli hatalar"ı ve bir olasılık eğrisini sunar.

Pierre-Simon Laplace, olasılık teorisinin ilkelerine dayanarak gözlem kombinasyonları için bir kural geliştirmeye çalıştı (1774). Hata olasılıkları kanununu bir eğri ile gösterdi.

Ana kütle

Ana kütle kollektif olay özelliğinde ve aynı cinsten(homojen) birimlerin meydana getirdiği topluluktur. Birimler tamamen aynı özelliklere sahip olmasalar da, bazı ortak yanlarının bulunması gereklidir.örneğin yıl bir kütle olarak alınırsa günler birimdir. Kütleler çeşitli şekillerde sınıflandırılabilirler. Birimleri sayılabilen kütlelere belirli kütle, sayılamayanlara belirsiz kütle adı verilir. Bir ülkenin nüfusu, bir şehirdeki binalar belirli kütle,bir nehirdeki balıklar, ormandaki karıncalar sayılamayacağı için belirsiz kütledir. Kütleler sürekli süreksiz olarak da sınıflanabilirler. Arsa,tarla gibi birbirine bitişik olan birimler sürekli,insan, otomobil gibi birimler süreksiz kütleleri oluştururlar.

Birim

Kütleyi oluşturan kollektif olayların her birine birim adı verilir. Canlılar(insan,hayvan) sosyal bir kuruluş(aile,şirket) bir olay(doğum,ölüm,evlenme) birim olarak kabul edilir. Birimler mutlaka sayılabilir veya ölçülebilir özelliklere sahip olmalıdırlar. Birimler aynı zamanda homojen olmalıdırlar. İstatistikte homojenlik eşitlik anlamına gelir. Aynı tanıma uygun birimler biçimsel homojenlik tanımına uymaktadır.

Örnek

Anakütle bütün birimlerin oluşturduğu topluluktur. Anakütleden seçilen birimlerin oluşturduğu alt topluluk örnek olarak adlandırılır. Bir firmada satın alınan hammaddenin tamamı anakütleyi, kalite kontrolü için alınan parça örneği oluşturur.

Vasıf (nitelik) ve şık

Birimlerin sahip oldukları ve birbirlerinden ayırdedilmelerine yarayan özellikler vasıf olarak adlandırılır. Nüfus sayımında birim insandır. İnsanların yaş, boy,medeni durum gibi özellikleri vasıftır. Belli bir vasıf çeşitli biçimlerde ortaya çıkabilir. Bu ortaya çıkış biçimleri de şık adını alır. Örneğin medeni durumun, "evli", "bekar", "boşandı", "dul" şeklinde 4 şıkkı vardır.

İstatistik analiz

İlk bilgilerin toplanması (rölöveler) aşamasında araştırmanın konusu ve birimlerin tarifi yapılır. Rölövenin zamanı ve kapsamı belirlenir. İkinci aşamada toplanan veriler matematik ve istatistik analizlere uygun, düzenli duruma getirilir. Verilerin tasnifi ve gruplaması yapılır. Üçüncü aşamada düzenlenmiş ve gruplandırılmış veriler tablolar ya da grafikler şeklinde sunulur. Son aşamada ise çeşitli yöntemler kullanarak eğilimler ortaya çıkarılır, olaylar arasındaki ilişkiler bulunur ve karar verilerek sonuca ulaşılır.

Örneklem verisinden elde edilen temel betimsel nicelik, örneklem verisinin aritmetik ortalaması ya da kısaca ortalamasıdır. Eğer örneklem, ortalama üzerinde abartılmış bir etkide bulunan birkaç tane çok büyük ya da çok küçük değer içerirse, ortanca (medyan) örneklemi daha doğru biçimde temsil eder. Ortanca, örneklem değerleri büyüklüklerine göre sıralandığında her iki yanında eşit sayıda denek kalan değerdir.

Değerlerin ortalamanın çevresindeki dağılımını ölçmek için en yaygın biçimde kullanılan nicelikler varyans ve varyansın kare kökü olan standart sapmadır. Varyans, ortalamanın örneklem değerlerinden çıkarılmasıyla bulunan sapmalann karelerinin ortalaması alınarak hesaplanır. Örneklemin ortalaması ve standart sapması örneklemin alındığı grubun içindeki değerlerin dağılımını tam olarak tanımlamaz. Gerçekte, farklı dağılımlann ortalamaları ve standart sap-malan aynı olabilir. Ortalama ve standart sapmanın tam olarak tanımladığı dağılım biçimine normal dağılım adı verilir. Normal dağılımda ortalamadan artı ya da eksi yönde sapmalar eşit ölçüde olasıdır ve küçük sapmalar büyük sapmalara göre daha yaygındır. Bir değerler kümesinin normal dağılımında, sapmalann çokluğu ile büyüklükleri arasındaki ilişkiyi gösteren grafik, çan biçimli bir eğridir. Böyle bir dağılımda değerlerin yaklaşık yüzde 68'inin ortalamadan farkı standart sapmadan daha küçük, yaklaşık yüzde 100'ünün ortalamadan farkı ise standart sapmanın üç katından az olacaktır.

İstatistik kuramı, olasılık hesabı ile nüfus ve örneklem kavramlarına dayanır. İstatistikçinin belirli özelliklerini araştırdığı canlı varlıklar ya da nesneler kümesi nüfus olarak adlandırılır. Örneklem ise nüfus içinden seçilmiş bir alt kümedir. İstatistikçi, nüfusu olasılık kurammdaki toplar kümesi gibi ele alır. Rasgele seçimden dolayı her top için örneklemin içine girme olasılığı aynıdır. Nüfusta ilgi duyulan özellik topların soyutlanmış fiziksel bir niteliği, örneğin kırmızı ve mavi gibi iki renk olabilir. Belirli bir konudaki görüşlerin araştırıldığım ve ilgilenilen özelliğin belirli bir politikadan yana olmak biçiminde tanımlandığını düşünelim. Böyle bir durumda söz konusu politikadan yana olanlar kırmızı, olmayanlarsa mavi toplarla özdeşleştirilebilir. Böylece sorun, belirli renklerdeki topların nüfus içindeki oranlarıyla ilgili bir soruya indirgenerek nüfusun çoğunluğunun söz konusu politikadan yana olup olmadığı araştırılabilir. Bu model 17. yüzyıldan beri olasılık kuramı çerçevesinde incelenmektedir. Örneklem rasgele seçildiği zaman, örneklem üyeliğinin, belirli olasılık yasaları uyarınca nüfusun bileşimine bağlı olacağı gösterilmiştir. İstatistik, olasılık bileşiminden yararlanarak nüfusun bileşimini örneklemin bileşiminden çıkaracak yöntemleri belirler. İstatistik kuramı ise istatistiksel bir işlemin etkinliğini doğru sonuç verecek örneklem oranlarına bağlı olarak değerlendirmeyi olanaklı kılar. İstatistikte iki tür çıkarsama vardır. Birincisi, belirli bir niteliği taşıyanların oranı ya da belirli bir sayısal ölçünün ortalaması gibi bir nüfus özelliğinin bilinmeyen değerini, örneklemeden kaynaklanan bir hata payıyla belirlemeyi içeren tahmindir. Nüfus özelliklerine ilişkin tahminler genellikle tahminlerin "standart sapmaları" ile birlikte verilir. Bunlar tahminlerin, nüfusun tam sayımı yerine rasgele örneklemlere dayandırılmasından kaynaklanan olası hataları gösterir. İkinci çıkarsama türü, belirli bir hipotezin sınanmasıdır. Bu çıkarsama, olası bir nüfusa ilişkin değerlerle tanımlanan bir "hipotez" ile bir başka nüfusun değerleri cinsinden tanımlanan "alternatif bir hipotez"i içerir. Bir örnekleme dayanarak hipotezlerden hangisinin doğru olduğunu belirlemek amacıyla çeşitli istatistiksel yöntemler geliştirilmiştir.

İstatistik çeşitli alanlardaki her türlü bilimsel çalışma yanında ticaret ve sanayi ile ilgili pek çok araştırmada kullanılır. Nüfusun çok büyük olduğu durumlarda, standart istatistiksel işlemler için gerekli örneklemin büyüklüğü nüfusun büyüklüğünden bütünüyle bağımsızdır. Bu durum, kamu görevleri için yapılan genel seçimlerde son derece çarpıcı biçimde görülür. İstatistikçiler son derece küçük örneklemlerden elde edilen verilere dayanarak seçim sonuçlarıyla ilgili doğruya çok yakın tahminler yapabilmektedir.

İstatistiksel yöntemler

Deneye ve gözleme dayalı çalışmalar [1]


İstatistiksel araştırmaların ortak amaçlarından biri nedenselliği incelemek ve özelde tahmin edicilerdeki veya bağımsız değişkenlerdeki bir değişimin bağımlı değişken üzerindeki etkisini incelemektir. Nedenselliği ele alan temelde iki tür istatistiksel yöntem bulunur: deneysel çalışmalar ve gözleme dayalı çalışmalar. İki çalışma türünde de bağımsız değişken veya değişkenlerdeki farklılıkların gözlenen bağımlı değişken üzerindeki etkisi incelenir. Bu çalışma türlerinde oluşan fark ise yöntemin uygulanma biçimidir. Yöntemlerin ikisi de verimli sonuçlar ortaya koyabilir.

Deneysel yöntemde çalışılan sistem üzerinde bir takım ölçümler yapılır, sistem üzerinde oynamalar yapılır, ve bu oynamaların sistem üzerinde etkisi olup olmadığını anlamak için tekrar ölçüm yapılır. Gözleme dayalı yöntemde ise sisteme müdahale olmaz, bunun yerine veri toplanır ve tahmin edicilerle (bağımsız değişkenler) tepki değişkenleri(bağımlı değişkenler) arasındaki örüntüler araştırılır.

Deneysel çalışmaya örnek olarak Western Elektrik Şirketi'nde aydınlatmanın çalışanlar üzerindeki etkisini araştıran Hawthorne deneyi verilebilir. Deneyde önce santraldeki üretim ölçülmüş, daha sonra kayan bant etrafında çalışan işçilerin aydınlatma koşulları değiştirilmiştir. Bütün deney sonuçları aydınlatmanın verimliliği arttırdığını göstermiştir. Ne var ki bu çalışmanın sonuçları deneysel yöntemdeki hatalar sebebiyle ciddi eleştiriler almıştır. Örneğin çalışmada kontrol grubu kullanılmamıştır.

Gözleme dayalı çalışmaya örnek olarak sigara kullanımı ve akciğer kanseri arasındaki bağınıtıyı inceleyen bir araştırma gösterilebilir. Bu tür çalışmada ilgi alanları hakkında bilgi toplamak için anket yöntemini kullanır ve sonra bilgiler istatistiksel analiz altında incelenir. Bu örnekte araştırmacılar sigara içen ve sigara içmeyen gruplardan bilgi toplar ve her iki gruptaki kanser vakası sayısı ele alınarak karşılaştırılır.

Bir deneyin temel adımları: 1. Araştırmanın planlanması, bilgi kaynaklarının, araştırmanın konusunun belirlenmesi, öne sürülen yöntemdeki ahlaki yönlerin ele alınması. 2. Sistemin modellenmesi, bağımlı ve bağımsız değişkenler arasındaki ilişkiye odaklanma. 3. Bir gözlem grubunu ortak yönlerini ele alacak şekilde özetlemek. 4. Gözlemlediğimiz dünya hakkında sayıların bize neler söylediğini açıklamak. 5. Çalışmanın sonuçlarını belgelemek ve sunmak.

Ölçülme ölçekleri

İstatistik verileri sayılar halinde olup bu sayılar için dört çeşit ölçülme ölçeği şeklinde elde edilme olabilirliği vardır. Bu verilerin dört çeşit ölçülme ölçeği olabileceğini ilk defa 1946da Amerikan istatistikçi Stanley Stevens ortaya atmıştır. Stevens'in dört ölçülme ölçeği şunlardır: isimsel, sırasal, aralıksal ve oransal. Her bir değişik ölçülme ölçeğine göre elde edilen istatistiksel veriler değişik matematiksel güçte olup her biri için kullanılabilecek matematik işlemler ve betimleyici ve çıkarımsal istatistiksel işlemler ve analizler değişiktir.

İsimsel ölçekte verilerde sayılar sadece birbirinden karşılıklı ayrılık gösteren kategorilere verilen adlardır ve bu isim/sayı sırası ve aralığı veya orijini için hiçbir matematiksel özellik yoktur. Bu çeşit ölçekte verilere ancak çok zayıf istatistik betimleyici ölçüler ve çıkarımsal analizler uygulanabilir.

Sırasal ölçek verilerdeki sayılar birbirinden karşılıklı ayrantılı kategorilere isim verdiği gibi, bu kategoriler arasındaki rütbe ve sıralı düzeni de açıklarlar. Sayı değerleri arasındaki sırasal düzen değiştirilemeden her kategoriye atıf edilen gerçek sayı değiştirilebilir (yani monotonik dönüşüm uygulanabilir.) Sayılar arasında büyüklük farkı önemli olmadığı için değişik kategori sayıları üzerinde uygulanan bir basit aritmetik işlem (toplama, çıkarma, çarpma veya bölme) anlamsız sonuçlar verebilir.

Aralıksal ölçekte veri sayıları gerçekten sayı olup aralarındaki değişikler basit aritmetik işlem için bile anlamlıdır. Ancak aralıksal ölçekde veri değerleri için sayıların başlama orijini (yani 0 değer) keyfidir. Örneğin ısı derecesi olarak elde edilen veriler aralıksaldır. Ölçüm ölçeği santigrad olabilir; ancak değişik 0 orijin değerleri olan fahrenhayt da olabilirler.

Oransal ölçekte veriler hem değişik ölçülmeler arasında farklar anlamlıdır ve hem de bunlar için gerçek bir 0 başlangıç noktası mevcuttur. Yine ısi derecesi örneği verilirse Kelvin derecesi oransal ölçektedir; çünkü orijin (-273 °C mutlak sıfır) 0°Kelvin olur; bu bir gerçek ) noktasıdır ve bu ısı derecesi altında ısı olamaz.

İsimsel veya sırasal ölçekle ölçülen değişkenler için veriler birlikte kategorik değişkenler olarak anılmakta ve aralıksal veya oransal ölçekte olan veriler kantitatif niceliksel değişkenler olarak adlandırılmaktadır.

İstatistik

1 . Bir sonuç çıkarmak için verileri yöntemli bir biçimde toplayıp sayı olarak belirtme işi, sayımlama (I):
"İstatistikler gösteriyor ki sahada en çok alkışlanan oyuncu kalecilerdir."- H. Taner.
2 . İlkelerini olasılık kuramlarından alarak eldeki verileri grafik ve sayı biçiminde değerlendirmeye dayandıran matematiğin uygulamalı dalı, sayım bilimi.

İstatistik

Türkçe İstatistik kelimesinin İngilizce karşılığı.
n. statistic, statistics

İstatistik

bir sonuç çıkarmak için olguları yöntemli bir biçimde toplayıp sayı olarak belirtme işi, sayılama. bir dizi olayın ya da sayıyla gösterilen olguların yöntemli öbekleştirilmesine dayanan ve ilkelerini olasılık kuramlarından alan, matematiğin uygulamalı dalı, sayımbilim.

İstatistik

Türkçe İstatistik kelimesinin Fransızca karşılığı.
statistique [la]

İstatistik

Türkçe İstatistik kelimesinin Almanca karşılığı.
n. Statistik adj. statistisch

İlgili konular

seçimler

Bu konuda henüz görüş yok.
Görüş/mesaj gerekli.
Markdown kullanılabilir.

İstatistik Resimleri