data warehouse dan data science

 Data Warehouse dan DATA Science

DATA WAREHOUSE

Sebelum adanya big data, terdapat istilah data warehouse.
Data warehouse merupakan kumpulan data dari berbagai sumber. 
Data tersebut dianalisis untuk improving decision making.
Pemrosesan data warehouse melibatkan 3 hal: Extract, Transform, dan Load (ETL). Proses ini juga dapat diterapkan pada big data.

ETL – Extract, Transform, Load
Merupakan proses-proses untuk menyiapkan data dari operational source (sumber data) agar disimpan ke dalam data warehouse

E: Ekstraksi/penyaringan data.

T: Pemetaan dari skema sumber ke skema datawarehouse serta preparasi data

L: memasukkan data ke target akhir

Data Warehouse VS Big Data

Terkadang istilah data warehouse & big data digunakan untuk mengacu pada hal yang sama (data yang besar). 
Terdapat beberapa artikel yang membuat persamaan (similarities) diantara keduanya, dan
terdapat beberapa artikel menyatakan perbedaan (differences) terhadap 2 hal ini.

Differences Data Warehouse & Big Data

Big Data :
Data besar tidak mengikuti kueri SQL apa pun untuk mengambil data dari database.
Data besar tidak memerlukan teknik manajemen yang efisien dibandingkan dengan gudang data.

Data warehouse

Di gudang data kami menggunakan kueri SQL untuk mengambil data dari database relasional.
Gudang data membutuhkan teknik manajemen yang lebih efisien karena data dikumpulkan dari berbagai departemen perusahaan

DATA SCIENCE

Data science merupakan kombinasi ilmu statistika, matematika , pemrograman, problem-solving, dan pengambilan data. Disertai beberapa aktivitas untuk cleansing, preparing, dan aligning data. 


Relasi

Data science merupakan cabang ilmu untuk mengolah Big Data dengan menerapkan pengetahuan terkait data analytics. 

Data science dan data analytic merupakan pengolahan data

Data analytic bersifat lebih spesifik dibanding data science

Terkadang kedua istilah digunakan untuk mengacu pada hal yang sama, akan tetapi beberapa artikel menyatakan bahwa kedua hal tersebut berbeda

Perbedaan

Data sience :

berfokus pada menemukan pertanyaan baru yang mungkin tidak Anda sadari membutuhkan jawaban untuk mendorong inovasi
temukan pertanyaan bisnis yang tepat dan temukan jawabannya
lebih berfokus pada pembelajaran mesin dan pemodelan prediktif
perpaduan multi-disiplin yang melibatkan pengembangan algoritma, inferensi data, dan pemodelan prediktif
Data Analytics
berfokus pada area tertentu dengan tujuan tertentu menganalisis dan Menambang Data Bisnis
lebih berfokus pada melihat data historis dalam konteks
melibatkan beberapa cabang berbeda dari statistik dan analisis yang lebih luas
Data science dapat diterapkan di semua bidang mulai dari bidang jurnalisme, sosial, finansial, dan lain sebagainya.
Contoh:
Meningkatkan sistem operasional bisnis 
Meningkatkan Customer Relationship Management (CRM)
Membuat piranti cerdas berdasarkan behaviour user
Kemudahan penggunaan aplikasi melalui analisis user experience

Komentar

Postingan populer dari blog ini

Kalau ga ada yang semangatin kamu sini aku semangatin