Statistik deskriptif adalah salah satu bagian dari ilmu statistika yang berhubungan dengan aktivitas penghimpunan, penataan, peringkasan dan penyajian data dengan harapan agar data lebih bermakna, mudah dibaca dan mudah dipahami oleh pengguna data. Statistik deskriptif hanya sebatas memberikan deskripsi atau gambaran umum tentang karakteristik objek yang diteliti tanpa maksud untuk melakukan generalisasi sampel terhadap populasi. Kegiatan dalam statistik deskriptif meliputi pengumpulan, pengelompokan dan pengolahan data yang selanjutnya akan menghasilkan ukuran-ukuran statistik seperti frekuensi, pemusatan data, penyebaran data, kecenderungan suatu gugus data dan lain-lain. Selain itu, agar data lebih mudah dibaca dan dipahami maka data dapat diringkas dalam bentuk tabulasi atau disajikan dalam bentuk grafik atau diagram. Penggunaan grafik dan diagram dimaksudkan agar data yang disajikan lebih menarik dan lebih komunikatif. Pengumpulan dan Penataan Data Show
Kelebihan: Kelemahan: Survei adalah pengumpulan data hanya pada sebagian unit populasi. Sebagian unit populasi tersebut disebut juga dengan sampel. Kelebihan: Kelemahan: Kelebihan: Kelemahan: Kelebihan: Kelemahan: Ukuran-Ukuran Statistik Ada 4 ukuran statistik yaitu ukuran frekuensi, ukuran kecenderungan terpusat, ukuran penyebaran (variasi) dan ukuran posisi.
Jumlah adalah hasil dari penambahan nilai-nilai data. \[X=\sum_{i=1}^{n} x_i\] Persentase adalah nilai yang disajikan dalam bentuk pecahan per seratus. \[\%X=\frac{\sum_{j=1}^{m} x_j}{\sum_{i=1}^{n} x_i}\times 100\%\] dimana \(j\leq i.\) Frekuensi adalah penjumlah
Rata-rata adalah nilai yang mewakili sekelompok data. Rata-rata diperoleh dari penjumlahan seluruh nilai data dibagi dengan banyaknya data. \[\bar{x}=\frac {1}{n}\sum_{i=1}^{n} x_i\] Median adalah nilai yang terletak di tengah dari data yang nilainya telah diurutkan. Bayaknya data di bawah median sama dengan banyaknya data di atas median. \[Me= x_b + \left ( \frac {\frac {n}{2} - F_b}{f_{me}} \right )p\] Modus adalah nilai yang sering muncul dalam sekelompok data.
Jangkauan (Range) adalah ukuran dari selisih nilai maksimum dengan nilai minimum yang ada dalam sekelompok data. \[R = x_{max} - x_{min}\] Simpangan-rata-rata (Mean Deviation) \[S_R=\frac {1}{n} \sum_{i=1}^{n} \left | x_i - \bar {x}\right |\] Varian adalah rata-rata jarak kuadrat antara data ke rata-rata. \[s^2 = \frac{1}{n-1}\sum_{i=1}^{n}\left (x_i-\bar {x} \right )^2\] Standar Deviasi (Simpangan Baku) merupakan akar kuadrat dari varian. \[s = \sqrt{ \frac{1}{n-1}\sum_{i=1}^{n}\left (x_i-\bar {x} \right )^2}\] Koefisien Variasi adalah perbandingan antara simpangan baku dengan rata-rata. \[KV = \frac{s}{\bar {x}}\] Mengidentifikasi penyebaran skor dengan menyatakan interval Rentang = Tinggi / Rendah poin Perbedaan atau Standar Deviasi = perbedaan antara nilai dan mean yang diamati
Quartil adalah \[Q_i=x_{\frac {i(n+1)}{4}}\] Desil adalah \[D_i=x_{\frac {i(n+1)}{10}}\] Percentil, \[D_i=x_{\frac {i(n+1)}{100}}\] Menggambarkan bagaimana skor jatuh dalam hubungan satu sama lain. Bergantung pada nilai standar Gunakan ini saat Anda perlu membandingkan skor dengan skor normalisasi (mis., Norma nasional) Penyajian dalam bentuk tabel
Tabel satu arah (one-way table) Tabel dua arah atau lebih (two-way table) atau lebih (Tabulasi silang) Tabel distribusi frekuensi
Batang (Bar Graph) perbandingan/pertumbuhan data kuantitatif maupun kualitatif dirangkum dalam frekuensu, frekuensi relative atau persen distribusi frekuensi Linkaran (Pie Chart) perbandingan (persentase/proporsi) Grafik Garis (Line Chart), pertumbuhan Grafik Peta, melihat/menunjukkan lokasi Ogive Diagram Batang-Daun Diagram scatter menggambarkan hubungan dua variable kuantitatif
Statistika adalah cabang keilmuan yang membuat berbagai tools dan teknik analisis untuk menangani tingkat data yang sangat besar, dalam istilah sederhana itu adalah ilmu merakit, mengklasifikasikan, menganalisis dan menafsirkan dan memanifestasikan bentuk numerik data untuk membuat kesimpulan tentang populasi, dari data sampel yang dipilih yang dapat digunakan oleh para ahli bisnis untuk memecahkan masalah mereka. Oleh karena itu, dalam upaya untuk mengatur data dan mengantisipasi tren data di masa depan, banyak organisasi dan perusahaan yang sangat bergantung pada analisis statistik. Pemilihan metode statistik yang tepat untuk analisis data kamu menyangkut pengumpulan data, interpretasi hingga presentasi sangatlah penting. Hal ini dapat digunakan terutama ketika kamu menangani data untuk memecahkan masalah yang kompleks. Lebih tepatnya, analisis statistik memberikan signifikansi pada data atau angka yang tidak signifikan atau tidak relevan. Secara khusus, analisis statistik adalah proses mengkonsolidasikan dan menganalisis sampel data yang berbeda untuk membocorkan pola atau tren dan mengantisipasi peristiwa atau situasi di masa depan untuk membuat keputusan yang tepat. Terdapat jenis-jenis metode statistik salah satunya analisis statistik deskriptif yang akan kami bahas pada artikel di bawah ini. 1. Sekilas Tentang Analisis Statistik DeskriptifPada dasarnya, ini berkaitan dengan mengatur dan meringkas data menggunakan angka dan grafik. Ini memudahkan sejumlah besar data untuk interpretasi yang dapat dipahami bahkan tanpa membentuk kesimpulan di luar analisis atau menanggapi hipotesis apapun. Alih-alih memproses data dalam bentuk mentahnya, analisis statistik deskriptif sangat memungkinkan kamu untuk dapat mewakili dan menafsirkan data lebih efisien melalui perhitungan numerik, grafik atau tabel. Analisis statistik deskriptif melibatkan berbagai proses seperti tabulasi, mean, median, range, variasi, standar deviasi, hingga analisis deret waktu. Baca juga : Pengolahan Data Statistik Parametrik dan Non-Parametrik 2. Statistik Deskriptif VS Statistik InferensialJika sebelumnya kita sama-sama sudah membahas tentang statistika deskriptif. Nah, ada lagi yang namanya statistika inferensial. Lalu apa sih bedanya? Jadi, statistik inferensial itu dilakukan dengan cara membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas. Proses ini berkaitan dengan proses pendugaan estimasi terhadap parameter. Selain itu, ruang lingkup statistika inferensial meliputi analisis korelasi, regresi, analisis varians, kovarians dan uji statistik lainnya. Untuk lebih jelasnya, mari kita simak gambar tabel dibawah ini untuk memahami perbedaan antara statistik deskriptif vs statistik inferensial. 3. Fungsi Statistik DeskriptifPenerapan statistik deskriptif sangat penting karena jika kita hanya memunculkan data original yang kita miliki, informasi dan insight dari data tersebut pun cukup sulit didapatkan, terutama ketika kamu bekerja dengan data dalam jumlah besar. Dalam hal ini, statistika deskriptif memungkinkan kita untuk menampilkan data dengan lebih jelas dan bermakna, sehingga interpretasi terhadap data tersebut mudah dilakukan. Statistika deskriptif memiliki fungsi antara lain: 1) menyediakan informasi dasar tentang variabel dalam dataset; 2)menonjolkan potensi hubungan antar variabel. Selain itu, dalam konteks data science dan machine learning, setelah kamu mendapatkan data, kamu tidak bisa menerapkan algoritma dan membuat prediksi begitu saja. Tentu, pertama kali kita perlu memahami data kamu miliki. Untuk itu penting memahami tahapan EDA (Exploratory Data Analysis). Pada EDA statistika deskriptif juga sangat membantu. 4. Contoh Penggunaan Statistika DeskriptifSebagai contoh penggunaan statistika deskriptif adalah untuk menyajikan data pelanggan dari sebuah perusahaan asuransi seperti, jenis kelamin, usia, pekerjaan mereka. Nah, untuk dapat menerapkan analisis menggunakan statistik deskriptif. Misal, ukuran frekuensi dapat digunakan untuk mengidentifikasi seberapa banyak pelanggan di bawah usia 30 tahun. Hal ini dapat dicapai dengan membuat tabel frekuensi, dan menyajikannya dalam bentuk diagram batang. Kemudian ukuran pemusatan atau tendensi sentral dapat digunakan untuk mengidentifikasi bagaimana karakteristik terbesar pelanggan mereka. Ukuran dispersi dapat digunakan untuk mengidentifikasi variasi, misalnya usia pelanggan. Baca juga : Yuk Pelajari Macam-Macam Metode Analisis Statistika 5. Belajar Metode Statistik dengan Python dan R Bersama DQLab, Yuk!Belajar metode statistik merupakan langkah awal yang tepat untuk memulai karir sebagai seorang data scientist. Kini belajar otodidak bisa lebih terstruktur dan terarah bersama DQLab. Tanpa perlu takut overdosis informasi dan kamu tidak akan bingung dengan urusan waktu, karena dengan kursus data science online waktu belajar kamu bisa lebih fleksibel dan dapat diakses dimanapun dan kapanpun. Dengan materi-materi yang ditawarkan lengkap dan sesuai dengan kebutuhan industri, disusun oleh mentor-mentor yang kompeten di bidangnya dari perusahaan unicorn dan startup. Jadi, jangan khawatir, kamu bisa mulai kursus data science online bersama DQLab! Sign up sekarang di DQLab.id atau klik button dibawah ini untuk nikmati pengalaman belajar yang seru dan menyenangkan! Penulis: Rian Tineges Editor: Annissa Widya Davita |