Bagaimana cara menjelaskan statistik deskriptif

Statistik deskriptif adalah salah satu bagian dari ilmu statistika yang berhubungan dengan aktivitas penghimpunan, penataan, peringkasan dan penyajian data dengan harapan agar data lebih bermakna, mudah dibaca dan mudah dipahami oleh pengguna data. Statistik deskriptif hanya sebatas memberikan deskripsi atau gambaran umum tentang karakteristik objek yang diteliti tanpa maksud untuk melakukan generalisasi sampel terhadap populasi. Kegiatan dalam statistik deskriptif meliputi pengumpulan, pengelompokan dan pengolahan data yang selanjutnya akan menghasilkan ukuran-ukuran statistik seperti frekuensi, pemusatan data, penyebaran data, kecenderungan suatu gugus data dan lain-lain. Selain itu, agar data lebih mudah dibaca dan dipahami maka data dapat diringkas dalam bentuk tabulasi atau disajikan dalam bentuk grafik atau diagram. Penggunaan grafik dan diagram dimaksudkan agar data yang disajikan lebih menarik dan lebih komunikatif.

Pengumpulan dan Penataan Data

Berdasarkan sumbernya, data statistik tergolong kedalam menjadi 2 jenis, yaitu data sekunder dan data primer. Data sekunder adalah data yang diperoleh dari pihak lain, sedangkan data primer adalah data yang diperoleh langsung dari objek penelitian. Pengumpulan data dapat dilakukan dengan 4 metode, yaitu sensus, survei, registrasi dan eksperimen. Keempat metode pengumpulan data tersebut memiliki kelebihan dan kekurangan masing-masing.
  1. Sensus
  2. Sensus adalah pengumpulan data dengan cara melakukan pendataan secara lengkap terhadap seluruh unit populasi.

    Kelebihan:


    1. Cakupannya lengkap.
    2. Bebas dari kesalahan pengambilan sampel (sampling error).
    3. Dapat dijadikan sebagai kerangka sampel induk untuk kegiatan survei.

    Kelemahan:
    1. Kesalahan tidak dapat diukur.
    2. Boros waktu, tenaga dan biaya.
    3. Karakteristik objek penelitian yang dicakup biasanya tidak terlalu banyak.

  3. Survei

  4. Survei adalah pengumpulan data hanya pada sebagian unit populasi. Sebagian unit populasi tersebut disebut juga dengan sampel.

    Kelebihan:


    1. Kesalahan dapat diukur.
    2. Dapat digunakan untuk menguji kualitas sensus dan registrasi.
    3. Hemat waktu, biaya dan tenaga.
    4. Kegiatan pendataan lebih mudah.
    5. Karakteristik yang dicakup lebih banyak dan rinci.

    Kelemahan:
    1. Memerlukan kerangka sampel jika tujuan penelitian adalah untuk mengeneralisasi sampel terhadap populasi.
    2. Biaya untuk mendapatkan kerangka sampel sangat besar.
    3. Terdapat kesalahan sampling (sampling error).

  5. Registrasi
  6. Registrasi adalah pencatatan secara terus menerus, misalnya pencatatan kelahiran, kematian dan migrasi yang dilakukan pemerintah.

    Kelebihan:


    1. Hemat biaya.
    2. Data yang diperoleh lebih aktual.
    3. Registrasi lebih baik daripada survei maupun sensus apabila terdata dengan lengkap, misalnya seluruh penduduk melaporkan setiap kejadian kelahiran, kematian dan migrasi.

    Kelemahan:
    1. Informasi yang diperoleh tidak terlalu banyak.
    2. Sangat sulit mengumpulkan data secara lengkap karena membutuhkan kesadaran seluruh penduduk.

  7. Eksperimen
  8. Eksperimen adalah pengumpulan data dengan melakukan percobaan.

    Kelebihan:


    1. Perencanaan sangat sistematis dan hasilnya lebih akurat.
    2. Peneliti dapat memanipulasi variabel-variabel yang diinginkan.

    Kelemahan:
    1. Waktu yang dibutuhkan lebih lama.


Ukuran-Ukuran Statistik

Ada 4 ukuran statistik yaitu ukuran frekuensi, ukuran kecenderungan terpusat, ukuran penyebaran (variasi) dan ukuran posisi.

  1. Ukuran Frekuensi

  2. Jumlah adalah hasil dari penambahan nilai-nilai data.
    \[X=\sum_{i=1}^{n} x_i\] Persentase adalah nilai yang disajikan dalam bentuk pecahan per seratus. \[\%X=\frac{\sum_{j=1}^{m} x_j}{\sum_{i=1}^{n} x_i}\times 100\%\] dimana \(j\leq i.\)

    Frekuensi adalah penjumlah

    Menunjukkan seberapa sering sesuatu terjadi Gunakan ini bila Anda ingin menunjukkan seberapa sering respons diberikan

  3. Ukuran Kecenderungan Terpusat

  4. Rata-rata adalah nilai yang mewakili sekelompok data. Rata-rata diperoleh dari penjumlahan seluruh nilai data dibagi dengan banyaknya data. \[\bar{x}=\frac {1}{n}\sum_{i=1}^{n} x_i\] Median adalah nilai yang terletak di tengah dari data yang nilainya telah diurutkan. Bayaknya data di bawah median sama dengan banyaknya data di atas median. \[Me= x_b + \left ( \frac {\frac {n}{2} - F_b}{f_{me}} \right )p\] Modus adalah nilai yang sering muncul dalam sekelompok data.

  5. Ukuran Penyebaran atau Variasi

  6. Jangkauan (Range) adalah ukuran dari selisih nilai maksimum dengan nilai minimum yang ada dalam sekelompok data. \[R = x_{max} - x_{min}\] Simpangan-rata-rata (Mean Deviation) \[S_R=\frac {1}{n} \sum_{i=1}^{n} \left | x_i - \bar {x}\right |\] Varian adalah rata-rata jarak kuadrat antara data ke rata-rata. \[s^2 = \frac{1}{n-1}\sum_{i=1}^{n}\left (x_i-\bar {x} \right )^2\] Standar Deviasi (Simpangan Baku) merupakan akar kuadrat dari varian. \[s = \sqrt{ \frac{1}{n-1}\sum_{i=1}^{n}\left (x_i-\bar {x} \right )^2}\] Koefisien Variasi adalah perbandingan antara simpangan baku dengan rata-rata. \[KV = \frac{s}{\bar {x}}\] Mengidentifikasi penyebaran skor dengan menyatakan interval Rentang = Tinggi / Rendah poin Perbedaan atau Standar Deviasi = perbedaan antara nilai dan mean yang diamati

  7. Ukuran Posisi

  8. Quartil adalah \[Q_i=x_{\frac {i(n+1)}{4}}\] Desil adalah \[D_i=x_{\frac {i(n+1)}{10}}\] Percentil, \[D_i=x_{\frac {i(n+1)}{100}}\] Menggambarkan bagaimana skor jatuh dalam hubungan satu sama lain. Bergantung pada nilai standar Gunakan ini saat Anda perlu membandingkan skor dengan skor normalisasi (mis., Norma nasional)

Penyajian dalam bentuk tabel
  1. Tabel
  2. Tabel meringkas/merekap data kualitatif maupun kuantitatif, tabulasi silang

    Tabel satu arah (one-way table)

    Tabel dua arah atau lebih (two-way table) atau lebih (Tabulasi silang)

    Tabel distribusi frekuensi

  3. Grafik dan Diagram
  4. Penyajian dalam bentuk grafik dan diagram Eksplorasi data, diagram sebaran data

    Batang (Bar Graph) perbandingan/pertumbuhan data kuantitatif maupun kualitatif dirangkum dalam frekuensu, frekuensi relative atau persen distribusi frekuensi


    Linkaran (Pie Chart) perbandingan (persentase/proporsi)
    Grafik Garis (Line Chart), pertumbuhan
    Grafik Peta, melihat/menunjukkan lokasi
    Ogive
    Diagram Batang-Daun
    Diagram scatter menggambarkan hubungan dua variable kuantitatif

Statistika adalah cabang keilmuan yang membuat berbagai tools dan teknik analisis untuk menangani tingkat data yang sangat besar, dalam istilah sederhana itu adalah ilmu merakit, mengklasifikasikan, menganalisis dan menafsirkan dan memanifestasikan bentuk numerik data untuk membuat kesimpulan tentang populasi, dari data sampel yang dipilih yang dapat digunakan oleh para ahli bisnis untuk memecahkan masalah mereka. Oleh karena itu, dalam upaya untuk mengatur data dan mengantisipasi tren data di masa depan, banyak organisasi dan perusahaan yang sangat bergantung pada analisis statistik.  Pemilihan metode statistik yang tepat untuk analisis data kamu menyangkut pengumpulan data, interpretasi hingga presentasi sangatlah penting.

Hal ini dapat digunakan terutama ketika kamu menangani data untuk memecahkan masalah yang kompleks. Lebih tepatnya, analisis statistik memberikan signifikansi pada data atau angka yang tidak signifikan atau tidak relevan. Secara khusus, analisis statistik adalah proses mengkonsolidasikan dan menganalisis sampel data yang berbeda untuk membocorkan pola atau tren dan mengantisipasi peristiwa atau situasi di masa depan untuk membuat keputusan yang tepat. Terdapat jenis-jenis metode statistik salah satunya analisis statistik deskriptif yang akan kami bahas pada artikel di bawah ini.

1. Sekilas Tentang Analisis Statistik Deskriptif

Bagaimana cara menjelaskan statistik deskriptif

Pada dasarnya, ini berkaitan dengan mengatur dan meringkas data menggunakan angka dan grafik. Ini memudahkan sejumlah besar data untuk interpretasi yang dapat dipahami bahkan tanpa membentuk kesimpulan di luar analisis atau menanggapi hipotesis apapun. Alih-alih memproses data dalam bentuk mentahnya, analisis statistik deskriptif sangat memungkinkan kamu untuk dapat mewakili dan menafsirkan data lebih efisien melalui perhitungan numerik, grafik atau tabel. Analisis statistik deskriptif melibatkan berbagai proses seperti tabulasi, mean, median, range, variasi, standar deviasi, hingga analisis deret waktu. 

Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik

2. Statistik Deskriptif VS Statistik Inferensial

Jika sebelumnya kita sama-sama sudah membahas tentang statistika deskriptif. Nah, ada lagi yang namanya statistika inferensial. Lalu apa sih bedanya? Jadi, statistik inferensial itu dilakukan dengan cara membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas. Proses ini berkaitan dengan proses pendugaan estimasi terhadap parameter. Selain itu, ruang lingkup statistika inferensial meliputi analisis korelasi, regresi, analisis varians, kovarians dan uji statistik lainnya. Untuk lebih jelasnya, mari kita simak gambar tabel dibawah ini untuk memahami perbedaan antara statistik deskriptif vs statistik inferensial.

Bagaimana cara menjelaskan statistik deskriptif

3. Fungsi Statistik Deskriptif

Penerapan statistik deskriptif sangat penting karena jika kita hanya memunculkan data original yang kita miliki, informasi dan insight dari data tersebut pun cukup sulit didapatkan, terutama ketika kamu bekerja dengan data dalam jumlah besar. Dalam hal ini, statistika deskriptif memungkinkan kita untuk menampilkan data dengan lebih jelas dan bermakna, sehingga interpretasi terhadap data tersebut mudah dilakukan. Statistika deskriptif memiliki fungsi antara lain: 1) menyediakan informasi dasar tentang variabel dalam dataset; 2)menonjolkan potensi hubungan antar variabel.

Selain itu, dalam konteks data science dan machine learning, setelah kamu mendapatkan data, kamu tidak bisa menerapkan algoritma dan membuat prediksi begitu saja. Tentu, pertama kali kita perlu memahami data kamu miliki. Untuk itu penting memahami tahapan EDA (Exploratory Data Analysis). Pada EDA statistika deskriptif juga sangat membantu.

Bagaimana cara menjelaskan statistik deskriptif

4. Contoh Penggunaan Statistika Deskriptif

Sebagai contoh penggunaan statistika deskriptif adalah untuk menyajikan data pelanggan dari sebuah perusahaan asuransi seperti, jenis kelamin, usia, pekerjaan mereka. Nah, untuk dapat menerapkan analisis menggunakan statistik deskriptif. Misal, ukuran frekuensi dapat digunakan untuk mengidentifikasi seberapa banyak pelanggan di bawah usia 30 tahun. Hal ini dapat dicapai dengan membuat tabel frekuensi, dan menyajikannya dalam bentuk diagram batang. Kemudian ukuran pemusatan atau tendensi sentral dapat digunakan untuk mengidentifikasi bagaimana karakteristik terbesar pelanggan mereka. Ukuran dispersi dapat digunakan untuk mengidentifikasi variasi, misalnya usia pelanggan. 

Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika

5. Belajar Metode Statistik dengan Python dan R Bersama DQLab, Yuk!

Belajar metode statistik merupakan langkah awal yang tepat untuk memulai karir sebagai seorang data scientist. Kini belajar otodidak bisa lebih terstruktur dan terarah bersama DQLab. Tanpa perlu takut overdosis informasi dan kamu tidak akan bingung dengan urusan waktu, karena dengan kursus data science online waktu belajar kamu bisa lebih fleksibel dan dapat diakses dimanapun dan kapanpun. 

Dengan materi-materi yang ditawarkan lengkap dan sesuai dengan kebutuhan industri, disusun oleh mentor-mentor yang kompeten di bidangnya dari perusahaan unicorn dan startup. Jadi, jangan khawatir, kamu bisa mulai kursus data science online bersama DQLab! Sign up sekarang di DQLab.id atau klik button dibawah ini untuk nikmati pengalaman belajar yang seru dan menyenangkan! 

Penulis: Rian Tineges

Editor: Annissa Widya Davita