John Matherly ผู้ก่อตั้ง Shodan ได้ออกมาเปิดเผยถึงการค้นพบว่ามี Server ที่ใช้งาน Apache Hadoop ทั่วโลกนั้น มีข้อมูลรั่วรวมกันทั้งสิ้นเกินกว่า 5 Petabyte หรือเกินกว่า 5,000 Terabyte เลยทีเดียว
Credit: Shodan
ข้อมูลทั้งหมดนั้นมาจาก HDFS-based Server จำนวนกว่า 4,487 Instance ทั่วโลก ที่มี Public IP Address และไม่ได้ทำการกำหนดค่าเรื่องการยืนยันตัวตนใดๆ ก่อนการเข้าถึงข้อมูลเลย ทำให้คนทั่วไปสามารถเข้าถึงข้อมูลเหล่านั้นได้อย่างอิสระ โดยระบบส่วนใหญ่ที่ถูกค้นพบนี้อยู่ในประเทศสหรัฐอเมริกาและจีนแทบทั้งหมด
นอกจากประเด็นด้านการถูกเข้าถึงข้อมูลโดยไม่ได้รับอนุญาตแล้ว เหล่าผู้ใช้งาน Apache Hadoop ที่ไม่ระมัดระวังเหล่านี้เองก็ควรจะต้องเกรงกลัว Ransomware กันบ้างเช่นกัน เพราะเมื่อต้นปีที่ผ่านมามีเหตุการณ์ Ransomware โจมตี Hadoop ไปแล้วเกือบ 500 เครื่อง และแน่นอนว่าด้วยข้อมูลปริมาณมหาศาลภายในระบบ Big Data เหล่านั้น การถูกเข้ารหัสไปแบบนี้คงไม่สามารถกู้คืนมาได้อย่างง่ายดายนัก
ที่ผ่านมาเรามักได้ยินเรื่องราวการนำ Open Source Software มาใช้งานจากธุรกิจในฝั่งอเมริกาและยุโรปกันเป็นส่วนมาก แต่ในปัจจุบันนี้จีนเองก็เริ่มกลายเป็นตลาดใหญ่ของวงการ Open Source ที่ผันตัวออกมาจากการเป็นเพียงผู้ใช้ ก้าวสู่การเป็นผู้ Contribute เป็นที่เรียบร้อยแล้ว ตัวอย่างหนึ่งที่เห็นได้ค่อนข้างชัดคือ Huawei ที่ทำธุรกิจ IT อยู่ในทั้งวงการโทรคมนาคมและ Enterprise ก็เป็นอีกหนึ่งบริษัทที่ได้ลงทุนกับ Open Source และนำ Open Source ออกมาสร้างเป็นผลิตภัณฑ์ออกสู่ตลาดจริง โดยเฉพาะ Big Data Analytics ที่กลายเป็นหัวใจของธุรกิจโทรคมนาคมและการเงินในทุกวันนี้ไปแล้ว
Big Data สำคัญอย่างไรในประเทศจีน?
จีนเองนั้นก็เหมือนกับประเทศอื่นๆ ทั่วโลกที่ต้องก้าวเข้าสู่ยุคของการทำ Digital Transformation แต่จุดที่น่าสนใจมากของจีนก็คือการที่ประเทศจีนนั้นมีขนาดของประชากรขนาดใหญ่ และมีธุรกิจขนาดใหญ่ในหลากหลายอุตสาหกรรม และมีภาษาของตนเอง รวมถึงยังเป็นตลาดที่มีการแข่งขันรุนแรง Big Data Analytics จึงเป็นเทคโนโลยีที่จำเป็นอย่างมากสำหรับจีนในการวิเคราะห์ข้อมูลปริมาณมหาศาลที่เกิดจากทั้งประชากรและภาคธุรกิจจำนวนมหาศาลเหล่านี้ เพื่อให้แต่ละธุรกิจสามารถแข่งขันกันได้ดียิ่งขึ้นทั้งด้วยการปรับปรุงกระบวนการการทำงานให้มีประสิทธิภาพสูงขึ้น, การพัฒนาผลิตภัณฑ์ให้ตรงกับความต้องการของลูกค้ามากขึ้น ไปจนถึงการทำให้การตัดสินใจเชิงธุรกิจดีขึ้น และประเด็นอื่นๆ อีกมากมาย
นอกจากนี้ การมาของเทคโนโลยี Internet of Things (IoT) เองนั้นก็เป็นอีกประเด็นสำคัญ ซึ่งจีนเองก็ถือเป็นฐานการผลิตอุปกรณ์ IoT ที่ใหญ่ที่สุดในโลก และข้อมูลที่จะเกิดขึ้นจากอุปกรณ์ IoT นี้ก็ต้องถูกนำมาวิเคราะห์บน Big Data Analytics Platform อยู่ดี ดังนั้นจึงไม่แปลกใจนักที่จีนจะต้องเร่งพัฒนาเทคโนโลยีทางด้าน Big Data Analytics เพื่อรองรับต่อนวัตกรรมใหม่ๆ ที่จะเกิดขึ้นทุกๆ วัน
บริษัท China United Network Communication Group สาขา Shanghai หรือ Shanghai Unicom นั้นเป็นธุรกิจให้บริการโครงข่ายโทรคมนาคมขนาดใหญ่ และเริ่มพบกับปัญหา 3 ประการจากการเติบโตอย่างรวดเร็วของธุรกิจดังนี้
ช่วย China Merchants Bank ให้มีลูกค้าเพิ่มขึ้น 40 เท่าด้วยการวิเคราะห์ข้อมูล
China Merchants Bank (CMB) นั้นเป็นธนาคารที่ต้องการปรับตัวเพื่อให้สามารถแข่งขันในประเทศจีนได้ดีขึ้น และความสามารถในการวิเคราะห์ข้อมูลให้ได้นั้นก็เป็นสิ่งที่จำเป็นต่อการปรับปรุงคุณภาพการให้บริการ, การออกแบบผลิตภัณฑ์หรือบริการใหม่ๆ ให้ตอบโจทย์ความต้องการของลูกค้า, การวัดคุณภาพของพนักงาน และอื่นๆ อีกมากมาย แต่เทคโนโลยีที่มีอยู่เดิมนั้นไม่ตอบโจทย์ต่อการวิเคราะห์ข้อมูลทั้งหมดของธนาคารรวมกันเป็นภาพเดียวได้ เนื่องจากข้อมูลนั้นมีปริมาณมหาศาล และถูกจัดเก็บอยู่ทั้งในรูปของ Structured Data และ Unstructured Data อย่างกระจัดกระจาย
ผู้ที่สนใจโซลูชั่น Open Source Software ต่างๆ รวมถึง Linux/Unix/OpenStack Data Center Infrastructure และระบบ CMS สำเร็จรูปที่มีประสิทธิภาพสูงและปลอดภัยระดับองค์กรพร้อมบริการครบวงจร ทั้ง WordPress และ Magento สามารถติดต่อทีมงาน UnixDev ได้ทันทีที่โทร 081-651-9393 หรืออีเมลล์ info@unixdev.co.th
เกี่ยวกับ UnixDev
UnixDev คือทีมงานผู้เชี่ยวชาญทางด้าน System Engineering ที่ครอบคลุมทั้ง Linux, Unix, Microsoft Windows และ VMware แบบ Full Stack ซึ่งสามารถให้บริการในการตรวจสอบแก้ไขปัญหาและปรับปรุงประสิทธิภาพและความปลอดภัยสำหรับระบบ Hypervisor, Operating System, Application, Web Application ไปจนถึง Database แบบครบวงจร https://www.unixdev.co.th
Big Data Analytics เป็นคำที่ทุกคนในวงการได้ยินกันมานาน หลายๆ คนก็คงอยากสัมผัสกับเทคโนโลยีเหล่านี้แต่ไม่รู้จะเริ่มต้นยังไง วันนี้ทาง TechTalkThai เลยขอออกมาแชร์ประสบการณ์ในการลองเล่น Apache Hadoop แบบง่ายๆ ใช้เวลาไม่ถึง 2 ชั่วโมง แต่ได้เห็นภาพรวมคร่าวๆ ของเทคโนโลยี Big Data Analytics ต่างๆ มาให้ทุกคนได้ลองเล่นตามกันด้วย Cloudera CDH 5.5 QuickStart VM ที่สามารถลองเล่นได้ทุกคนไม่ว่าจะเป็น IT Manager, Programmer, Netowork Engineer, System Engineer หรือ Security Expert ดังนี้ครับ
รู้จักกับ Cloudera กันก่อน
Cloudera http://www.cloudera.com/ เป็นบริษัทชั้นนำทางด้าน Big Data Platform ที่ดังที่สุดในตลาดรายหนึ่ง โดย Cloudera นี้จะนำ Apache Hadoop และ Open Source Component ต่างๆ ที่เกี่ยวข้องมาแพ็ครวมกันเป็น Distribution ให้ พร้อมมีระบบบริหารจัดการให้เสร็จสรรพ เรียกง่ายคือ Cloudera ทำให้การใช้งาน Apache Hadoop เพื่อทำ Big Data Analytics นั้นง่ายขึ้นนั่นเอง
ลองเล่น Apache Hadoop กันเลย
Cloudera นั้นได้พัฒนา QuickStart VM ขึ้นมาเพื่อให้ทุกคนในสาย IT ได้ลองเข้าถึงเทคโนโลยีและแนวคิดของ Big Data Analytics กันง่ายๆ ผ่านระบบ Lab ที่สามารถทำเองเล่นเองได้เลย ทำให้เราได้ลองใช้เครื่องไม้เครื่องมือต่างๆ ในการวิเคราะห์ข้อมูล, แสดงผล และบริหารจัดการ Infrastructure กันพอเป็นไอเดีย
ก่อนอื่นนั้นทุกคนต้องเลือกก่อนครับว่าจะทดลองใช้ Cloudera QuickStart VM ทางไหน ดังนี้
ทำ Policy-driven Compression และ Quality of Service ได้
รองรับ Hardware และ Operating System ได้หลากหลาย ตามแนวคิดของ Software Defined Storage
ด้วยความที่ IBM Spectrum Scale นี้เป็น Software Defined Storage จึงทำให้สามารถติดตั้งใช้งานได้บน Hardware และ Operating System ที่มีความหลากหลายได้ดี โดยสำหรับ Hardware ที่รองรับนั้นได้แก่ x86 CPU และ IBM POWER ส่วนระบบปฏิบัติการที่รองรับนั้นได้แก่ IBM AIX, Red Hat, SUSE Linux Enterprise Server, Microsoft Windows Server 2012, Microsoft Windows 7 และ IBM z Systems
IBM Spectrum Scale ถูกใช้งานอยู่แล้วทั่วโลก
จากการต่อยอดมาจากหนึ่งในเทคโนโลยีที่ดีที่สุดอันหนึ่งของ IBM ทำให้ IBM Spectrum Scale นั้นเป็นที่นิยมและมีผู้ใช้งานมากมายอยู่แล้วทั่วโลก ดังนี้