Standar deviasi: untuk apa dan untuk apa ukuran ini?

Istilah standar deviasi atau standar deviasi mengacu pada ukuran yang digunakan untuk mengukur variasi atau penyebaran data numerik dalam variabel acak, populasi statistik, kumpulan data, atau distribusi probabilitas. Dunia penelitian dan statistik dapat tampak rumit dan asing bagi populasi umum, karena tampaknya perhitungan matematis terjadi di bawah pandangan kita tanpa kita dapat memahami mekanisme yang mendasarinya.

Tidak ada yang lebih jauh dari kenyataan. Dalam kesempatan ini kami akan melaporkan secara sederhana namun sekaligus lengkap tentang konteks, dasar dan penerapan istilah esensial seperti standar deviasi dalam bidang statistika.

  • Artikel terkait: “Psikologi dan statistik: pentingnya probabilitas dalam ilmu perilaku”

Apa standar deviasi?

Statistika adalah cabang matematika yang bertanggung jawab untuk mencatat variabilitas, serta proses acak yang menghasilkannya mengikuti hukum probabilitas. Ini segera dikatakan, tetapi dalam proses statistik adalah jawaban atas segala sesuatu yang hari ini kita anggap sebagai “dogma” di dunia alam dan fisika.

Sebagai contoh, katakanlah ketika Anda melempar koin tiga kali ke udara, dua di antaranya muncul kepala dan satu ekor. Kebetulan yang sederhana, bukan? Di sisi lain, jika kita melempar koin yang sama 700 kali dan 660 di antaranya muncul, mungkin ada faktor yang mendukung fenomena ini di luar keacakan (mari kita bayangkan, misalnya, bahwa ia hanya punya waktu untuk memberi sejumlah belokan terbatas di udara, yang membuatnya hampir selalu mendarat dengan cara yang sama).

Dengan demikian, pengamatan pola di luar kebetulan belaka mendorong kita untuk berpikir tentang alasan yang mendasari tren tersebut. Apa yang ingin kami tunjukkan dengan contoh yang luar biasa ini adalah bahwa statistik adalah alat penting untuk proses ilmiah apa pun, karena berdasarkan itu kami dapat membedakan kenyataan yang dihasilkan dari kebetulan dari peristiwa yang diatur oleh hukum alam.

Dengan demikian, kita dapat membuang definisi deviasi standar dengan tergesa-gesa dan mengatakan bahwa itu adalah produk ukuran statistik dari akar kuadrat variansnya. Ini seperti memulai rumah dari atap, karena bagi seseorang yang tidak sepenuhnya didedikasikan untuk dunia angka, definisi ini dan tidak tahu apa-apa tentang istilah itu sedikit berbeda.

Jadi mari kita luangkan waktu sejenak untuk membedah dunia pola statistik dasar.

Ukuran posisi dan variabilitas

Ukuran posisi adalah indikator yang digunakan untuk menunjukkan berapa persentase data dalam distribusi frekuensi yang melebihi ekspresi ini, yang nilainya mewakili nilai data yang berada di pusat distribusi frekuensi. Jangan putus asa, karena kami mendefinisikannya dengan cepat:

  • Mean: Rata-rata numerik sampel.
  • Median: mewakili nilai variabel posisi sentral dalam kumpulan data yang diurutkan.

Secara sederhana, kita dapat mengatakan bahwa ukuran posisi difokuskan pada pembagian kumpulan data menjadi bagian persentase yang sama, yaitu, “mencapai tengah”. Di sisi lain, ukuran variabilitas bertanggung jawab untuk menentukan tingkat pendekatan atau jarak nilai distribusi dibandingkan dengan lokasi rata-ratanya (yaitu, dibandingkan dengan rata-rata).

Ini adalah sebagai berikut:

  • Range: mengukur lebar data, yaitu dari nilai minimum hingga maksimum.
  • Varians: ekspektasi (rata-rata dari seri data) kuadrat dari deviasi variabel tersebut terhadap meannya.
  • Standar deviasi: indeks numerik dari dispersi kumpulan data.

Tentu saja, kita bergerak dalam istilah yang relatif kompleks untuk seseorang yang tidak sepenuhnya didedikasikan untuk dunia matematika. Kami tidak ingin masuk ke ukuran variabilitas lainnya, karena mengetahui bahwa semakin besar produk numerik dari parameter ini, semakin tidak homogen kumpulan datanya.

  • Mungkin Anda tertarik: “Psikometrik: apa itu dan apa tanggung jawabnya?”

“Rata-rata dari atipikal”

Setelah kita menetapkan pengetahuan tentang ukuran variabilitas dan pentingnya mereka dalam analisis data, sekarang saatnya untuk memfokuskan kembali perhatian kita pada standar deviasi. Tanpa masuk ke konsep yang kompleks (dan mungkin terlalu menyederhanakan hal-hal), kita dapat mengatakan bahwa ukuran ini adalah produk dari menghitung rata-rata dari nilai-nilai “atipikal”.

Mari kita ambil contoh untuk memperjelas definisi ini: Kami memiliki sampel enam anjing betina hamil dari jenis dan usia yang sama yang baru saja melahirkan anak anjing mereka secara bersamaan.

Tiga di antaranya telah melahirkan masing-masing 2 anak, sementara tiga lainnya melahirkan 4 anak per betina. Secara alami, nilai keturunan rata-rata adalah 3 anak per betina (jumlah semua anak dibagi dengan jumlah total betina).

Berapa standar deviasi dalam contoh ini? Pertama-tama, kita harus mengurangi nilai yang diperoleh dari mean dan kuadratkan angka ini (karena kita tidak menginginkan angka negatif), misalnya: 4-3=1 atau 2-3= (-1, kuadrat, 1). Varians akan dihitung sebagai mean dari deviasi dari nilai mean (dalam hal ini, 3).

Di sini kita akan berurusan dengan varians, dan oleh karena itu, kita harus mengambil akar kuadrat dari nilai ini untuk mengubahnya menjadi skala numerik yang sama dengan mean. Setelah ini, kita akan mendapatkan standar deviasi.

Jadi apa yang akan menjadi standar deviasi dari contoh kita? Yah, anak anjing. Diperkirakan jumlah anak rata-rata adalah tiga anak, tetapi normal bagi ibu untuk melahirkan satu anak lebih sedikit atau satu anak per kelahiran.

Mungkin contoh ini terdengar agak membingungkan sejauh menyangkut varians dan deviasi (karena akar kuadrat dari 1 adalah 1), tetapi jika variansnya 4 di dalamnya, hasil dari standar deviasinya adalah 2 (ingat, kuadratnya akar). Apa yang ingin kami tunjukkan dengan contoh ini adalah bahwa varians dan standar deviasi adalah ukuran statistik yang berusaha mendapatkan mean dari nilai yang berbeda dari rata-rata.

Ingat: semakin besar standar deviasi, semakin besar penyebaran populasi. Kembali ke contoh sebelumnya, jika semua bitches berasal dari ras yang sama dan memiliki bobot yang sama, wajar jika penyimpangannya adalah satu anak anjing per tandu.

Tetapi misalnya, jika kita mengambil seekor tikus dan seekor gajah, jelas bahwa penyimpangan dalam hal jumlah keturunan akan mencapai nilai yang jauh lebih besar dari satu. Sekali lagi, semakin sedikit kesamaan yang dimiliki kedua kelompok sampel, semakin besar penyimpangan yang diharapkan.

Meski begitu, satu hal yang jelas: menggunakan parameter ini kita menghitung varians dalam data sampel, tetapi ini tidak harus mewakili seluruh populasi. Dalam contoh ini kami telah mengambil enam anjing, tetapi bagaimana jika kami memantau tujuh dan yang ketujuh memiliki 9 anak anjing?

Tentu saja pola penyimpangan akan berubah. Untuk alasan ini, mempertimbangkan ukuran sampel sangat penting ketika menafsirkan kumpulan data apa pun.

Semakin banyak angka individual yang dikumpulkan dan semakin sering eksperimen diulang, semakin dekat kita dengan mendalilkan kebenaran umum.

Kesimpulan

Seperti yang telah kita lihat, standar deviasi adalah ukuran dispersi data. Semakin besar dispersi, semakin besar nilai ini, karena jika kita menghadapi serangkaian hasil yang sepenuhnya homogen (yaitu, semuanya sama dengan rata-rata), parameter ini akan sama dengan 0.

Nilai ini sangat penting dalam statistik, karena tidak semuanya direduksi untuk menemukan jembatan umum antara angka dan peristiwa, tetapi juga penting untuk mencatat variabilitas antara kelompok sampel untuk mengajukan lebih banyak pertanyaan kepada diri sendiri dan memperoleh lebih banyak pengetahuan dalam jangka panjang..

Referensi bibliografi:

  • Hitung standar deviasi langkah demi langkah, khanacademy.org. Dikumpulkan pada 29 Agustus di https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spread-distributions/a/calculating-standard-deviation-step-by-step
  • Jaime, S., & Vinicio, M.

    (1973). Probabilitas dan statistik.

  • Vine, J.M.

    (1995). Statistik deskriptif dan inferensial I.

    Diperoleh dari: http://www. akademi.

    edu/download/35987432/ESTADISTICA_DESCRIPTIVA_E_INFERENCIAL. pdf.

  • Rendón-Macías, ME, Villasís-Keeve, M.., & Miranda-Novales, MG (2016).

    Statistik deskriptif. Majalah Alergi Meksiko, 63(4), 397-407.

  • Ricardi, CF (2011).

    Statistik diterapkan untuk penelitian kesehatan. Diperoleh dari Chi-Square Test: http://www.

    gelombang menengah kl/tautan.

    cgi/Medwave/Seri/MBE04/5266.