𝓑𝓲𝓰 𝓓𝓪𝓽𝓪

Nama : Nadira Andini

NPM : 21120004

Mata Kuliah : Data Warehouse

Dosen Pengampu : Dito Putro Utomo, S.Kom, M.Kom


Big data adalah kumpulan informasi yang sering disimpan dalam basis data komputer dan dianalisis menggunakan perangkat lunak yang dirancang khusus untuk menangani kumpulan data yang besar dan kompleks.
Sederhananya, big data adalah sekumpulan data yang lebih besar, lebih kompleks, terutama dari sumber data baru. Kumpulan data ini sangat banyak sehingga perangkat lunak pemrosesan data tradisional tidak dapat mengelolanya. Tetapi volume data yang sangat besar ini dapat digunakan untuk mengatasi masalah bisnis yang sebelumnya tidak dapat diatasi.

Karakteristik Tiga V

Big data sering dicirikan oleh tiga V, yaitu volume, velocity, dan variety. Karakteristik ini pertama kali diidentifikasi pada tahun 2001 oleh Doug Laney. Kemudian Gartner semakin mempopulerkannya setelah mengakuisisi Meta Group pada tahun 2005.

Volume

Jumlah data adalah yang terpenting. Mengutip dari oracle.com, big data akan memproses data tidak terstruktur bervolume tinggi dengan kepadatan rendah. Ini bisa berupa data dengan nilai yang tidak diketahui, seperti umpan data Twitter, aliran klik di halaman web atau aplikasi seluler, atau peralatan berkemampuan sensor. Untuk beberapa organisasi, data ini mungkin berukuran puluhan terabyte. Dan bagi yang lain, mungkin berukuran ratusan petabyte.

Velocity

Velocity adalah tingkat kecepatan di mana data diterima dan (mungkin) ditindaklanjuti. Biasanya, kecepatan tertinggi aliran data langsung ke memori dibandingkan yang ditulis ke disk. Beberapa produk pintar berkemampuan internet beroperasi dalam waktu nyata atau mendekati waktu nyata dan memerlukan evaluasi dan tindakan waktu nyata.

Variety

Variety mengacu pada banyaknya jenis data yang tersedia. Tipe data tradisional terstruktur dan cocok tersusun dengan rapi dalam database relasional. Dengan munculnya big data, data datang dalam tipe data baru yang tidak terstruktur.

Tipe data tidak terstruktur dan semi terstruktur, seperti teks, audio, dan video, memerlukan prapemrosesan tambahan untuk mendapatkan makna dan mendukung metadata.

Cara Kerja Big Data

Diua kategori big data adalah data yang tidak terstruktur dan data yang terstruktur. Data terstruktur terdiri dari informasi yang sudah dikelola oleh organisasi dalam database dan spreadsheet (biasanya bersifat numerik).

Sedangkan data tidak terstruktur adalah informasi yang tidak terorganisir dan tidak termasuk dalam model atau format yang telah ditentukan. Data ini termasuk data yang dikumpulkan dari sumber media sosial, yang membantu institusi mengumpulkan informasi tentang kebutuhan pelanggan.

Big data adalah data yang dapat dikumpulkan dari komentar yang dibagikan secara publik di jejaring sosial atau situs web, dikumpulkan secara sukarela secara elektronik dan aplikasi pribadi, melalui kuesioner, pembelian produk, dan check-in elektronik. Kehadiran sensor dan input lain di perangkat pintar memungkinkan data dikumpulkan di seluruh spektrum situasi dan keadaan yang luas.

Data besar biasanya disimpan dalam basis data komputer dan dianalisis menggunakan perangkat lunak yang dirancang khusus untuk menangani kumpulan data yang besar dan kompleks. Banyak perusahaan jasa perangkat lunak (SaaS) berspesialisasi dalam mengelola jenis data kompleks ini.

Penggunaan Big Data

Analis data akan melihat hubungan antara berbagai jenis data yang terkumpul, seperti data demografis dan riwayat pembelian, untuk menentukan apakah ada korelasi. Penilaian semacam itu dapat dilakukan secara internal atau eksternal oleh pihak ketiga yang berfokus pada pemrosesan big data ke dalam format yang lebih mudah dicerna.

Dalam dunia bisnis, penilaian dari para ahli tentang big data adalah yang sering digunakan untuk mengubahnya menjadi informasi yang dapat ditindaklanjuti. Dengan big data, pelaku bisnis dapat menemukan jawaban untuk 1) menyederhanakan pengelolaan sumber daya, 2) meningkatkan efisiensi operasional, 3) mengoptimalkan pengembangan produk, 4) mendorong pendapatan baru dan peluang pertumbuhan, dan 5) memungkinkan pengambilan keputusan yang cerdas.

Hampir setiap departemen di perusahaan dapat memanfaatkan temuan dari analisis data, mulai dari sumber daya manusia dan teknologi hingga pemasaran dan penjualan. Tujuan dari big data ini adalah untuk meningkatkan kecepatan produk sampai ke pasar, untuk mengurangi jumlah waktu dan sumber daya yang dibutuhkan untuk mendapatkan adopsi pasar, audiens target, dan untuk memastikan pelanggan tetap puas.

Kelebihan dan Kekurangan Big Data

Peningkatan jumlah data yang tersedia menghadirkan peluang dan masalah. Secara umum, memiliki lebih banyak data tentang pelanggan akan memungkinkan perusahaan untuk dapat menyesuaikan produk dan upaya pemasaran guna menciptakan tingkat kepuasan yang tinggi dan bisnis yang berulang. Perusahaan yang mengumpulkan data dalam jumlah besar diberi kesempatan untuk melakukan analisis yang lebih dalam untuk kepentingan semua stakeholder.

Meskipun mendapat analisis yang lebih baik adalah hal yang positif, big data juga dapat menimbulkan kelebihan beban dan gangguan, sehingga mengurangi kegunaannya. Perusahaan harus menangani volume data yang sangat besar dan menentukan data mana yang mewakili sinyal dibandingkan dengan noise. Memutuskan apa yang membuat data relevan menjadi faktor kunci.

Selain itu, sifat dan format data memerlukan penanganan khusus sebelum ditindaklanjuti. Data terstruktur, yang terdiri dari nilai numerik, dapat dengan mudah disimpan dan diurutkan. Data tidak terstruktur, seperti email, video, dan dokumen teks, mungkin memerlukan teknik yang lebih canggih untuk diterapkan sebelum menjadi berguna.

Perbedaan Antara Data warehouse Dengan Big data

Perbedaan Antara Big data vs Data warehouse, dijelaskan dalam poin-poin di bawah ini:

  1. Data warehouse adalah arsitektur penyimpanan data atau repositori data. Padahal Big data adalah teknologi untuk menangani big data dan menyiapkan repositori.
  2. Data DBMS apa pun yang diterima oleh Data warehouse, sedangkan Big data menerima semua jenis data termasuk data transnasional, data media sosial , data mesin atau data DBMS.
  3. Data warehouse hanya menangani data struktur (relasional atau tidak relasional), tetapi big data dapat menangani struktur, non-struktur, data semi-terstruktur.
  4. Big data biasanya menggunakan sistem file terdistribusi untuk memuat big data dengan cara terdistribusi, tetapi data warehouse tidak memiliki konsep semacam itu.
  5. Dari sudut pandang bisnis, karena big data memiliki banyak data, analitik tentang itu akan sangat bermanfaat, dan hasilnya akan lebih berarti yang membantu mengambil keputusan yang tepat untuk organisasi itu. Sedangkan data warehouseterutama membantu analitik pada informasi informasi.
  6. Data warehouse berarti database relasional, sehingga menyimpan, mengambil data akan mirip dengan permintaan SQL normal. Dan big data tidak mengikuti struktur database yang tepat, kita perlu menggunakan sarang atau memicu SQL untuk melihat data dengan menggunakan kueri spesifik sarang.
  7. 100% data yang dimuat ke dalam data warehouse digunakan untuk laporan analitik . Tetapi data apa pun yang dimuat oleh Hadoop , maksimum 0,5% digunakan pada laporan analisis sampai sekarang. Data lain dimuat ke dalam sistem, tetapi tidak menggunakan status.
  8. Data Warehousing tidak pernah dapat menangani data yang sangat besar (data yang benar-benar tidak terstruktur). Big data ( Apache Hadoop ) adalah satu-satunya opsi untuk menangani data yang sangat besar.
  9. Waktu pengambilan meningkat secara bersamaan di data warehouse berdasarkan volume data. Berarti, ini akan memakan waktu kecil untuk data volume rendah dan waktu besar untuk volume besar data seperti DBMS. Tetapi dalam kasus big data, akan membutuhkan waktu yang sangat singkat untuk mengambil big data (karena dirancang khusus untuk menangani big data), tetapi mengambil waktu besar jika kita mencoba memuat atau mengambil data kecil di HDFS dengan menggunakan peta mengurangi 

Komentar