Big Data คืออะไร

Big Data คืออะไร ข่าวเทคโนโลยี นวัตกรรมใหม่ โลกอนาคต

Big Data หมายถึงชุดข้อมูลทั้งที่มีโครงสร้างและไม่มีโครงสร้างที่ซับซ้อนขนาดใหญ่ ซึ่งสร้างและส่งข้อมูลอย่างรวดเร็วจากแหล่งที่มาที่หลากหลาย

ขอบคุณภาพปกจาก FREEWARE.IN.TH

คุณลักษณะที่ประกอบขึ้นเป็น Big Data ประกอบด้วยสาม V คือ

Volume หรือปริมาณ ข้อมูลที่ถูกจัดเก็บมีจำนวนมาก Velocity หรือความเร็ว ความเร็วในระดับแสงที่สตรีมข้อมูลต้องได้รับการประมวลผลและวิเคราะห์ Variety หรือความหลากหลาย แหล่งข้อมูลและรูปแบบต่างๆ ที่ใช้ในการเก็บรวบรวมข้อมูล เช่น ตัวเลข ข้อความ วิดีโอ รูปภาพ เสียง และข้อความ

            ทุกวันนี้ ข้อมูลต่างๆถูกสร้างขึ้นอย่างต่อเนื่องทุกครั้งที่เราเปิดแอป ค้นหาใน Google หรือเพียงแค่เดินทางไปยังที่ต่างๆ ด้วยอุปกรณ์มือถือของเรา ผลลัพธ์คือ การรวบรวมข้อมูลอันมีค่าจำนวนมหาศาลที่บริษัทและองค์กรต่างๆ จำเป็นต้องจัดการ จัดเก็บ แสดงภาพ และวิเคราะห์

            เครื่องมือที่ใช้จัดการข้อมูลแบบดั้งเดิมไม่พร้อมสำหรับรองรับความซับซ้อนและปริมาณเช่นนี้ ซึ่งนำไปสู่ซอฟต์แวร์ Big Data เฉพาะและโซลูชันทางสถาปัตยกรรมที่ออกแบบมาเพื่อจัดการปริมาณข้อมูลเหล่ายนี้

ขอบคุณภาพประกอบจาก Aware

แพลตฟอร์มสำหรับ Big Data คืออะไร

            แพลตฟอร์มสำหรับ Big Data คือแพลตฟอร์มที่ได้รับการออกแบบมาเป็นพิเศษเพื่อจัดการกับปริมาณข้อมูลที่ไม่สามารถหยั่งรู้ได้ ซึ่งเข้าสู่ระบบด้วยความเร็วสูงและหลากหลาย แพลตฟอร์ม Big Dataเหล่านี้มักจะประกอบด้วย Server , ฐานข้อมูล และเครื่องมือทางธุรกิจอัจฉริยะที่หลากหลาย ซึ่งช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถจัดการข้อมูลเพื่อค้นหาแนวโน้มและจัดรูปแบบข้อมูลได้

            โดยพื้นฐานแล้ว Big Data คือการผสานกันของ V ทั้งสามเพื่อให้ได้ข้อมูลเชิงลึกและคาดการณ์ได้ ดังนั้นจึงมีประโยชน์ที่จะพิจารณาแต่ละองค์ประกอบอย่างละเอียดยิ่งขึ้น

Volume

            Big Data นั้นมีปริมาณมหาศาล แม้ว่าข้อมูลดั้งเดิมจะถูกวัดในขนาดที่คุ้นเคย เช่น เมกะไบต์ กิกะไบต์ และ เทราไบต์ แต่ Big Data จะถูกเก็บไว้ในข้อมูลระดับเพตะไบต์ (Petabytes) และเซตตะไบต์ (Zettabytes)

            เพื่อทำความเข้าใจความใหญ่โตของความแตกต่างในด้านขนาด ให้พิจารณาการเปรียบเทียบนี้จาก Berkeley School of Information หนึ่งกิกะไบต์เทียบเท่ากับวิดีโอความยาวเจ็ดนาทีในรูปแบบ HD ในขณะที่เซตตะไบต์เดียวจะเท่ากับ 250 พันล้านดีวีดี

            นี่เป็นเพียงส่วนยอดของภูเขาน้ำแข็ง ตามรายงานของ EMC ในจักรวาลดิจิทัลมีขนาดเพิ่มขึ้นเป็นสองเท่าทุก ๆ สองปี และคาดว่าจะถึง 44 ล้านล้านเซตตะไบต์ภายในปี 2020

ขอบคุณภาพประกอบจาก SOMKIAT

            Big Data ต้องใช้สถาปัตยกรรมที่จัดการข้อมูลประเภทนี้ได้ หากไม่มีโซลูชันที่เหมาะสมสำหรับการจัดเก็บและการประมวลผล เป็นไปไม่ได้เลยที่จะสามารถหาข้อมูลเชิงลึกได้

Velocity

            ตั้งแต่ความเร็วที่สร้างไปจนถึงระยะเวลาที่ใช้ในการวิเคราะห์ ทุกสิ่งที่เกี่ยวกับข้อมูลขนาดใหญ่นั้นรวดเร็ว บางคนเปรียบเปรยว่าเหมือนเป็นการพยายามดื่มน้ำจากท่อดับเพลิง

            บริษัทและองค์กรต้องมีความสามารถในการควบคุมข้อมูลเหล่านี้และสร้างข้อมูลเชิงลึกจากข้อมูลแบบเรียลไทม์ มิฉะนั้นข้อมูลจะไม่มีประโยชน์มากนัก การประมวลผลแบบเรียลไทม์ช่วยให้ผู้มีอำนาจตัดสินใจดำเนินการได้อย่างรวดเร็วทำให้พวกเขามีพร้อมที่จะแข่งขัน

            แม้ว่าข้อมูลบางรูปแบบสามารถประมวลผลเป็นชุดและยังคงมีความเกี่ยวข้องกันอยู่เมื่อเวลาผ่านไป แต่ Big Data ส่วนใหญ่จะถูกสตรีมไปยังองค์กรในคราวเดียว และจำเป็นต้องดำเนินการทันทีเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด ข้อมูลเซ็นเซอร์จากอุปกรณ์ด้านสุขภาพเป็นตัวอย่างที่ดี ความสามารถในการประมวลผลข้อมูลด้านสุขภาพในทันทีสามารถให้ข้อมูลที่สามารถช่วยชีวิตคนไข้แก่แพทย์ได้

Variety

            ประมาณ 95% ของ Big Data ทั้งหมดไม่มีโครงสร้าง หมายความว่ามันไม่เข้ากับแบบโมเดลดั้งเดิมที่ตรงไปตรงมา ทุกอย่างตั้งแต่อีเมล์และวิดีโอไปจนถึงข้อมูลทางวิทยาศาสตร์และอุตุนิยมวิทยาสามารถเป็นสตรีมของ Big Data ซึ่งข้อมูลแต่ละอย่างมีลักษณะเฉพาะของตัวเอง

#Big Data #ข้อมูลดิจิตอล #เครื่องมือจัดการข้อมูล