Depoladığınız veri size neler kazandırabilir? Eğer elinizde onu analiz edebilecek ve analizlerinizde çıkan sonuçları doğru biçimde raporlayacak yazılımınız yoksa eliniz boş demektir. Peki Büyük Veri için yazılım gereksinimleri neler? Bu sorunun cevabı projeden projeye değişebilir fakat sizin için ortak noktaları bir araya toplamaya çalıştık.
1- Hadoop ve MapReduce
Hadoop, Büyük Veri için depolama ve işleme yapabilen açık kaynak kodlu bir platform sunuyor. MapReduce ise yüzlerce hatta binlerce sunucu içerisinde size ölçeklendirebilirlik sağlayan bir yazılım.
2- Veritabanı/Dosya Sistemi
Hadoop Distributed File System (HDFS) sayesinde gerekli olan veri ve veritabanının depolanmasını ve hesaplanmasını sağlayabiliyorsunuz.
3- Pig Latin
Pig, Hadoop ile birlikte MapReduce yazılımını yaratabileceğiniz yüksek derecede bir platform ve bu platformun dili Pig Latin olarak anılıyor.
4- Hive Veri Ambarı
Apache Hive, Hadoop’un en üst katmanında veri ambarı oluşturabileceğiniz bir platform.
5- Cascading
Cascading bir Java uygulaması. Bu uygulama sayesinde zengin veri analitiği ve veri yönetimi için uygun bir yapı oluşturabilirsiniz.
6- Büyük Veri Entegrasyon Araçları
CR – X gibi yarı otomatik modelleme araçları hızlı etkileşime sahip geliştirmeye olanak sağlayacak ve analitik çalışacak veritabanını yapılandırmanız için size yardımcı olabilir.
7- Analitik Veritabanı
Veritabanınızı analize uygun şekilde uzmanca hazırlamalısınız. Pivotal Greenplum veya IBM Netezza gibi uygulamalar analitik modelle için hızlı yükleme ve yeniden yükleme özellikleri sunarlar.
8- Müşteri Memnuniyeti
ClickFox gibi uygulamalar müşteri memnuniyeti konusunda size yardımcı olacak özellikler sunuyorlar.
9- İşlemsel Yaklaşımlar
İşlemsel büyük veri projeleri gerçek zamanlı olmadığı sürece Hadoop’u kullanamazlar. Bunun için verileri Hadoop’a uygun hale getirmelisiniz.
10- Resmi İyi İnceleyen
Sizin için örnek oluşturacak yapı aşağıdaki resimde gösterilmiştir.