Hai hai semua 👋👋👋
Buat kalian yang baru mengenal dunia data, penasaran ga sih gimana data di perusahaan itu di proses dan akhirnya bisa dimanfaatkan?
Nah di edisi kali ini aku bakal bahas gimana sih proses pemanfaatan data secara general di industri. Pemanfaatan data di mulai dari pengumpulan data sampai akhirnya akan di manfaatkan dalam beberapa bentuk seperti report, dashboard atau machine learning model.
Gambar berikut dapat menggambarkan perjalanan data dari sumber data sampai akhirnya bisa mendapatkan sesuatu yang berharga dari situ.
Sumber data
Kita mulai dari yang warna ungu yang menggambarkan sumber data.
Secara umum data di perusahaan biasanya tersebar di berbagai sumber. Data tersebut bisa terbentuk dan tersimpan di berbagai tempat dan dalam berbagai tempat, misalnya di:
Database
Aplikasi
File dan Spreadsheet
Platform External
Data Processing
Data tersebut kemudian akan di pindahkan kedalam data lake yang kemudian akan di proses di data warehouse. Proses ini umum di sebut dengan proses Extract Transform Load (ETL). Proses ini juga bisa dilakukan dengan urutan Extract Load Transform (ELT).
Extract disini maksudnya data di ambil dari sumber data. Transform maksudnya data mentah yang kita dapat di rubah format dan strukturnya agar bisa di gunakan atau digabungkan dengan data lain yang disusul dengan proses Load atau menyimpan datanya.
Di dalam data warehouse biasanya juga akan di lakukan transformasi data dan disitu juga ada beberapa komponen yang perlu di perhatikan seperti data catalog, discovery, lineage, dan keamanannya. Tujuan dari proses ini adalah data yang tadinya masih mentah dan terpisah sekarang sudah berada di dalam satu sempat dan siap di manfaatkan.
Pemanfaatan Data
Tahap selanjutnya adalah memanfaatkan data yang sudah tersimpan di data warehouse tersebut. Pemanfaatannya pun bisa dalam berbagai bentuk.
Salah satu pemanfaatannya bisa dengan memberikan akses data warehouse tersebut kepada tim-tim lain yang membutuhkan dalam bentuk data yang sudah di proses di data warehouse.
Pemanfaatan lainnya bisa dengan membuat chart dan dashboard dari data tersebut untuk menganalisa kejadian-kejadian yang sudah terjadi sebelumnya. Hal ini biasa di sebut juga dengan descriptive analytics. Dari situ juga kita bisa melakukan diagnostik analisis untuk mengetahui alasan terjadinya kejadian di masa lampau.
Selain yang sudah di sebutkan data-data tersebut juga dapat dimanfaatkan untuk pengembangan Machine Learning untuk melakukan prediktif dan prescriptive analysis. Model machine learning yang sudah di buat ini kemudian bisa di manfaatkan dengan pembuatan API tersendiri agar dapat di integrasikan dengan platform lain atau langsung di manfaatkan untuk menghasilkan prediksi dalam periode waktu tertentu.
Penutup
Nah, jadi harusnya sekarang kalian udah mulai tergambar ya tentang gimana sih data itu di manfaatkan di organisasi. Mulai dari data mentah yang tersebar sampai akhirnya menjadi sebuah produk data.
Yang pasti agar proses ini berjalan dengan baik perlu adanya skill set tertentu yang harus di miliki. Itulah juga yang menyebabkan munculnya beberapa pekerjaan yang beda-beda di bidang data dan akan kita bahas di tulisan selanjutnya !
So, buat kalian yang belum subscribe newsletter ini bisa subscribe biar tetep dapet update tulisan-tulisan selanjutnya.
Kalian juga bisa liat konten lain ngulik data lewat sini ya: lynk.id/bima.putra1
🎬 Video baru Ngulik Data
Satu minggu kemarin aku publish beberapa konten juga di Youtube. Buat yang belum liat, kalian bisa check disini ya:
Belajar jadi data analis, sebuah roadmap yang bisa kamu ikutin buat belajar skill data analis
Studi kasus Tes Excel, belajar menyelesaikan salah satu tes interview Excel
Explorasi Data Analisis Otomatis, pemanfaatan library dataprep untuk EDA secara cepat dan mudah.
Latihan Tes SQL Tiktok & JP Morgan, belajar menyelesaikan studi kasus SQL dari test interview Tiktok dan JPMorgan
🎓 Join Kelas Ngulik Data
Beberapa minggu kedepan ada kelas yang bisa kamu ikutin nih:
Ngulik Excel Batch 3 - Data Preparation
Belajar pemanfaatan formula yang umum di gunakan untuk preparasi data.
10 April 2023 jam 20.30 PM - 22.30 PM.
Ngulik Excel Batch 3 - Pivot dan Dashboard
Belajar pemanfaatan pivot tabel untuk analisa data dan pembuatan dashboard interaktif.
12 April 2023 jam 20.30 PM - 22.30 PM.