data warehouse dan data science
Data Warehouse dan DATA Science
DATA WAREHOUSE
Sebelum adanya big data, terdapat istilah data warehouse.
Data warehouse merupakan kumpulan data dari berbagai sumber.
Data tersebut dianalisis untuk improving decision making.
Pemrosesan data warehouse melibatkan 3 hal: Extract, Transform, dan Load (ETL). Proses ini juga dapat diterapkan pada big data.
ETL – Extract, Transform, Load
Merupakan proses-proses untuk menyiapkan data dari operational source (sumber data) agar disimpan ke dalam data warehouse
E: Ekstraksi/penyaringan data.
T: Pemetaan dari skema sumber ke skema datawarehouse serta preparasi data
L: memasukkan data ke target akhir
Data Warehouse VS Big Data
Terkadang istilah data warehouse & big data digunakan untuk mengacu pada hal yang sama (data yang besar).
Terdapat beberapa artikel yang membuat persamaan (similarities) diantara keduanya, dan
terdapat beberapa artikel menyatakan perbedaan (differences) terhadap 2 hal ini.
Differences Data Warehouse & Big Data
Big Data :
Data besar tidak mengikuti kueri SQL apa pun untuk mengambil data dari database.
Data besar tidak memerlukan teknik manajemen yang efisien dibandingkan dengan gudang data.
Data warehouse
Di gudang data kami menggunakan kueri SQL untuk mengambil data dari database relasional.
Gudang data membutuhkan teknik manajemen yang lebih efisien karena data dikumpulkan dari berbagai departemen perusahaan
DATA SCIENCE
Data science merupakan kombinasi ilmu statistika, matematika , pemrograman, problem-solving, dan pengambilan data. Disertai beberapa aktivitas untuk cleansing, preparing, dan aligning data.
Relasi
Data science merupakan cabang ilmu untuk mengolah Big Data dengan menerapkan pengetahuan terkait data analytics.
Data science dan data analytic merupakan pengolahan data
Data analytic bersifat lebih spesifik dibanding data science
Terkadang kedua istilah digunakan untuk mengacu pada hal yang sama, akan tetapi beberapa artikel menyatakan bahwa kedua hal tersebut berbeda
Perbedaan
Data sience :
berfokus pada menemukan pertanyaan baru yang mungkin tidak Anda sadari membutuhkan jawaban untuk mendorong inovasi temukan pertanyaan bisnis yang tepat dan temukan jawabannya lebih berfokus pada pembelajaran mesin dan pemodelan prediktif perpaduan multi-disiplin yang melibatkan pengembangan algoritma, inferensi data, dan pemodelan prediktif Data Analytics berfokus pada area tertentu dengan tujuan tertentu menganalisis dan Menambang Data Bisnis lebih berfokus pada melihat data historis dalam konteks melibatkan beberapa cabang berbeda dari statistik dan analisis yang lebih luas
Data science dapat diterapkan di semua bidang mulai dari bidang jurnalisme, sosial, finansial, dan lain sebagainya.
Contoh:
Meningkatkan sistem operasional bisnis
Meningkatkan Customer Relationship Management (CRM)
Membuat piranti cerdas berdasarkan behaviour user
Kemudahan penggunaan aplikasi melalui analisis user experience
Komentar
Posting Komentar