การใช้เทคโนโลยี In-Memory Computing ในงานด้าน Analytics

.

การใช้เทคโนโลยี In-Memory Computing ในงานด้าน Analytics

พรชัย ลีลาพรชัย 

ทุกวันนี้ ภาคอุตสาหกรรมเทคโนโลยีมีความเชื่อว่า in-memory computing จะแก้ทุกปัญหาที่มีอยู่ได้ จากการที่ RAM มีราคาถูกลงมากจนเราสามารถบรรจุข้อมูลทั้งหมดลง in-memory ได้ และจะไม่ต้องกังวลเรื่องปัญหาด้านความเร็วอีกต่อไป แต่ความเชื่อดังกล่าวเป็นเพียงเรื่องเล่าเท่านั้น

 

แม้ว่าจะมีความจริงบางส่วนในเรื่องเล่าดังกล่าว การเก็บข้อมูลทั้งหมดใน in-memory จะทำงานได้อย่างดีเยี่ยมสำหรับบาง application แต่ไม่ใช่สำหรับการใช้งานทุกแบบ จริงอยู่ที่ RAM มีราคาถูกลง และปัญหาการเข้าใช้ฐานข้อมูลต่างๆ จะหายไปเมื่อเราใส่ข้อมูลลงใน in-memory แต่ก็มีสิ่งที่ควรพิจารณา

การอ่านข้อมูลจาก RAM ไม่ได้เร็วหรือง่ายอย่างที่เราคิด CPU สมัยใหม่จะมี cache อยู่ 3 ระดับอยู่ก่อนหน้า RAM และ RAM บนเครื่องจะมีการแยกระหว่างส่วนที่เป็น local และ remote ไปยังแต่ละ processorApplication ส่วนใหญ่ทุกวันนี้จะ run ในระบบแบบกระจายโดยที่หน่วยความจำอาจจะอยู่คนละด้านของ hop ของเครือข่าย นั่นหมายถึงว่าการเข้าถึงหน่วยความจำอาจใช้เวลาตั้งแต่หนึ่ง processor cycle ไปจนถึงหลาย cycle ข้อแตกต่างดังกล่าวจะยิ่งเพิ่มขึ้นตามความซับซ้อนของระบบ

ยิ่งไปกว่านั้น แม้ว่า RAM จะมีราคาถูก แต่ disk มีราคาถูกกว่าและ dataset ก็มีขนาดใหญ่ขึ้นด้วย ดังนั้น ในไม่ช้าหรือเร็ว เราก็จะเจอปัญหาข้อจำกัดของโครงสร้าง in-memory เมื่อ in-memory application ต้องการข้อมูลมากขึ้นและมี feature ต่างๆ เพิ่มขึ้น เราจะไม่สามารถตอบสนองต่อความต้องการดังกล่าวด้วยการเพิ่ม RAM ขึ้นเท่านั้น เราต้องการเทคนิคมากกว่าหนึ่งแบบในการแก้ไขปัญหาความล่าช้าในการเข้าใช้ข้อมูลจากแหล่งเก็บข้อมูลที่มีขนาดเพิ่มเรื่อยๆ

มุมมองของภาคอุตสาหกรรมได้แสดงให้เห็นแนวโน้มการตอบรับเทคโนโลยี in-memory computing (IMC) แม้ภาคอุตสาหกรรมมีความเข้าใจแนวคิด In-Memory Computing ดีแต่ยังมีการใช้งานอยู่จำกัด ผู้เล่นส่วนใหญ่มักจะอยู่ในช่วงวางแผนโครงการนำร่อง โดยที่ยังไม่แน่ใจนักว่า IMC เป็นแนวคิดที่ได้รับการโฆษณาเกินจริงหรือไม่และมักจะมีท่าทีในการรอดูรูปการณ์ที่จะเกิดขึ้น องค์กรที่ยังไม่ได้ใช้ IMC มักจะประเมินในความพยายามในการ implement ระบบต่ำไป ในขณะเดียวกันก็จะไม่ทราบถึงศักยภาพของ IMC อย่างเต็มที่ด้วย

IMC ช่วยหลอมรวมเทคโนโลยีที่มีนวัตกรรมใหม่ๆเข้ากับนวัตกรรมทางด้าน business process และ application ดังนั้น In-Memory Computing จึงเป็นเหมือน computing แห่งอนาคต และจะมีบทบาทในการเพิ่มข้อได้เปรียบในธุรกิจในด้านประสิทธิภาพ นวัตกรรมของ process รวมถึง ความง่ายของสถาปัตยกรรมและความยืดหยุ่นของระบบ ในบทความนี้จะกล่าวถึง In-Memory Computing (IMC) และแง่มุมต่างๆ โดยเฉพาะในการใช้ IMC ในระบบวิเคราะห์ข้อมูล

1.IMC คืออะไร

จากมุมมองทางด้านฮาร์ดแวร์ การวิเคราะห์ข้อมูลประกอบด้วย 3 ส่วน คือ Processor ที่ทำการคำนวณ ส่วนเก็บข้อมูลที่จะเก็บข้อมูลที่เราจะทำการจัดการ และระบบที่ทำการถ่ายโอนข้อมูลระหว่างสองส่วน ตามหลักแล้ว ส่วนที่ช้าที่สุดใน 3 ส่วนนี้จะถือเป็นคอขวดของระบบ IT ในการวิเคราะห์ข้อมูล ซึ่งในปัจจุบัน คอขวดจะอยู่ที่ความล่าช้าของส่วนเก็บข้อมูล หรือหากจะกล่าวโดยเจาะจง คือมันไม่ใช่ความล่าช้าของ RAM แต่เป็นความล่าช้าของฮาร์ดดิสก์ ความสามารถในการประมวลผลไม่ได้ถูกใช้อย่างเต็มที่เพียงเพราะเราไม่สามารถดึงข้อมูลจากฮาร์ดดิสก์มาใช้ได้เร็วพอ

IMC เป็นการย้ายข้อมูลที่เดิมทีเก็บอยู่ในฮาร์ดดิสก์มาอยู่ในหน่วยความจำ เมื่อเราดูกันเฉพาะที่คุณสมบัติทางด้านฮาร์ดแวร์แล้ว ความล่าช้าจะลดลงอย่างมากตัวอย่างเช่น ในการทดสอบกับสถาปัตยกรรม Nehalem ของ Intel ความล่าช้าของการเก็บข้อมูลจะลดลงจาก 1 ล้านรอบของ CPU cycle เหลือเพียง 250cycle เท่านั้น ดังนั้นกระบวนการวิเคราะห์ข้อมูลจึงเร็วขึ้นมาก

เราจะต้องใช้ฐานข้อมูลแบบพิเศษเฉพาะในการเคลื่อนย้ายข้อมูลไปยังหน่วยความจำ ตัวอย่างเช่น SAP HANA IMC database ซึ่ง launch ขึ้นโดยทาง SAP เมื่อเปรียบเทียบกับระบบแบบเก่า ฐานข้อมูล IMC ไม่ได้เพียงใช้ประโยชน์จากข้อดีทางด้านฮาร์ดแวร์ ยังมีการประมวลผลอันชาญฉลาด หรือ intelligent data processing, การบีบอัดข้อมูล และ engine ในการคำนวณแบบ built-in ซึ่งช่วยให้ได้ผลลัพธ์จากการ query ที่ซับซ้อนได้แบบเกือบ real-time เป็นการเพิ่มประสิทธิภาพของระบบ ยิ่งไปกว่านั้น feature เหล่านี้ช่วยให้สามารถประมวลผลทั้งข้อมูลแบบ transactional และข้อมูล analytical data ได้ มันสามารถ run application ที่เป็นแบบ operational และทำการวิเคราะห์ข้อมูลในเวลาใกล้ real-time บนฐานข้อมูลเดียวกันได้ ตัวอย่างผู้ที่ใช้ SAP HANA สามารถลดเวลาในการ run report จาก 1 ชั่วโมงเหลือเพียง 1 วินาทีได้ การเปลี่ยนจาก data warehouse แบบเดิมที่อาศัยฮาร์ดดิสก์ไปเป็น data warehouse แบบ IMC เป็นเหมือนการลด layer หรือชั้นในการนำข้อมูลดิบไปสู่ผลของการวิเคราะห์ข้อมูล (รูปที่ 1)

ในวิธีการแบบเก่าที่ใช้ data warehouse ข้อมูลดิบจะถูกเก็บไว้ใน data warehouse ข้อมูลส่วนหนึ่งจะถูกดึงมายัง data mart เพื่อวัตถุประสงค์ในการรวบรวม pre-aggregation และ pre-calculation โดยขึ้นอยู่กับบริบท (context) หรือความต้องการของผู้ใช้ ผลที่เก็บอยู่ใน data mart จะถูกเรียกขอโดย business intelligent application เพื่อทำการประมวลผลและจัดทำการแสดงข้อมูล visualization ของผลลัพธ์

ในระบบแบบใหม่ ข้อมูลดิบจะถูกเก็บอยู่ในฐานข้อมูล data warehouse แบบ IMC อย่างไรก็ตาม business intelligent application มิได้ทำการเรียกผลเพียงบางส่วนจาก data mart แต่จะเป็นการเรียกผลลัพธ์จาก data warehouse แบบ IMC เลย ผลลัพธ์จะถูกคำนวณด้วยความเร็วใกล้ real time โดยการ query จาก built-in calculation engine หน้าที่ของ business intelligent application จึงถูกลดเหลือเพียงการจัดทำรูปแบบแสดงผล (visualization) ของผลลัพธ์ที่ทำการ query ชั้นของ data mart จึงหมดความจำเป็นและล้าสมัยไป ยิ่งไปกว่านั้น ด้วยการใช้ data warehouse แบบ IMC เรายังสามารถทำการ update ข้อมูลดิบได้บ่อยๆ เพื่อที่ว่า transactional application จะสามารถป้อนข้อมูลเข้าไปยังส่วน data warehouse แบบ IMC ได้โดยตรง

1

รูปที่ 1 Data Warehouse แบบเก่าเมื่อเทียบกับ Data Warehouse ที่ใช้ IMC 

2.RAM และ IMC

ทุกวันนี้ผู้คนในภาคอุตสาหกรรมต่างก็คิดว่า IMC จะสามารถแก้ปัญหาทุกอย่างได้ ต้นเรื่องเกิดจากการที่ RAM มีราคาถูกลงากจนกระทั่งเราสามารถจับข้อมูลทั้งหมดของคุณใส่ไว้ใน in-memory และคุณก็ไม่ต้องกังวลเรื่องความเร็วอีกต่อไป แต่นั่นเป็นเพียงความเชื่อซึ่งบริษัทที่เชื่อง่ายๆ แบบนั้นอาจต้องเสียใจในการตัดสินใจของตนเองในอนาคตก็เป็นได้

ความเชื่อดังกล่าวมีมูลอยู่บ้าง กล่าวคือการเก็บข้อมูลทั้งหมดไว้ในหน่วยความจำนั้นเหมาะกับการประยุกต์ใช้งานบางอย่างเท่านั้น การที่ RAM มีราคาถูกลงและปัญหารการเข้าถึงข้อมูลในฐานข้อมูลจะหมดไปเมื่อเราบรรจุข้อมูลไว้ในหน่วยความจำ

แต่การอ่านข้อมูลจาก RAM ก็ไม่ได่เร็วหรือง่ายอย่างนั้น CPU แบบใหม่มักจะมี cache ถึง 3 ระดับอยู่ก่อนถึง RAM และ RAM บนเครื่องนั้นถูกแบ่งระหว่างส่วน local และ remote สำหรับแต่ละ processor นอกจากนี้ application ส่วนใหญ่ทุกวันนี้จะ run ในระบบแบบกระจาย (distributed system) โดยที่หน่วยความจำอาจอยู่ข้ามคนละ hop ในเครือข่าย นั่นหมายความว่าการเข้าถึงหรือ access หน่วยความจำอาจใช้เวลาตั้งแต่ 1 processor cycle จนถึงหลายร้อย cycle โดยความแตกต่างของเวลาดังกล่าวจะเพิ่มขึ้นตามเมื่อระบบมีความซับซ้อนขึ้น

ที่สำคัญยิ่งกว่านั้น ถึงแม้ว่า RAM มีราคาถูก แต่ disk ก็ยิ่งมีราคาถูกกว่า และ dataset ก็มีขนาดใหญ่ขึ้น ดังนั้น ในอีกไม่ช้า เราก็คงจะเจอกับปัญหาขีดจำกัดของโครงสร้างของระบบแบบ in-memory ยิ่ง application แบบ in-memory ของคุณรับเอาปริมาณข้อมูลเพิ่มขึ้นและคุณได้เพิ่ม feature ต่างๆ เพิ่มขึ้น คุณก็ไม่สามารถตามความต้องการดังกล่าวทันเพียงด้วยการเพิ่มจำนวน RAM เท่านั้น

คุณต้องการเทคนิคมากกว่า 1 อย่างในการแก้ปัญหาข้อท้าทายทางเทคนิคในการ access ปริมาณข้อมูลที่เพิ่มขึ้นอย่างรวดเร็วโดยมีความล่าช้าในระดับต่ำ ระบบที่ดีจะใช้องค์ประกอบที่มีอยู่ให้เกิดประโยชน์สูงสุด

แนวคิดที่ว่าโครงสร้างพื้นฐานของข้อมูลแบบ in-memory นั้นดีเยี่ยมอาจมาจากสถาปัตยกรรมของ Facebook ทาง Facebook ได้ใช้โครงสร้างแบบ in-memory ค่อนข้างมาก แต่ก็ไม่สามารถบรรจุทุกอย่างใน RAM ได้ จึงมีการจัดลำดับความสำคัญ ทุกครั้งที่มีการ loadhomepage บน Facebook จะมีการใช้ disk มากมายในการหาข้อมูล รวมถึงการอ่านข้อมูลจาก flash card มากมาย

จะกล่าวไปแล้ว in-memory จะทำงานได้ดีหากทุกอย่างลงตัวในระบบได้ดี แต่หากไม่สามรถบรรจุทุกอย่างได้หมด ก็จะมีปัญหาขึ้น สำหรับ Facebook แล้ว มีกรณีการใช้งานมากมายที่ทำงานได้ดี ส่วนกรณีที่ใช้งานได้ไม่ดีคือกรณีที่ปริมาณข้อมูลเพิ่มขึ้นเรื่อยๆ ดังนั้นหากคุณมีปริมาณข้อมูลจำนวนน้อยเกี่ยวกับผู้ใช้แต่ละคน เราก็สามารถบรรจุลงในหน่วยความจำและจะทำงานได้ดี แต่หากคุณมีผู้ใช้โพสข้อมูลต่างๆ เพิ่มขึ้นเรื่อยๆ ปริมาณข้อมูลก็มีแนวโน้มที่จะโตขึ้นโดยไม่มีขีดจำกัด 

รูปแทรก 1

การใช้ Flash ในฐานข้อมูลของ Facebook ในช่วงปี 2012-2013

แรกเริ่มเดิมที Facebook เก็บข้อมูลใน spinning disk และ MySQL โดยมีการ optimize การเก็บข้อมูลในฐานข้อมูลเพื่อให้การอ่านข้อมูลจาก disk ไม่ช้ามาก และทุกครั้งที่มีการเพิ่ม machine ใหม่ก็จะมีการเพิ่ม main memory เพิ่มขึ้นด้วย ทำให้ได้ความเร็วเพิ่มขึ้น แต่สุดท้ายแล้วการใช้วิธีนี้พื้นที่หน่วยความจำก็จะหมดไปได้ จากนั้น ทาง Facebook จึงหันมาใช้ solid state disk สำหรับ MySQL ซึ่งเป็นการปรับปรุงที่ดีขึ้นมาก

รูปแทรก 2

เดิมที Facebook Newsfeed นั้นใช้ in-memory เพราะจะทำการเก็บข้อมูลเพียง window ที่มีช่วงเวลาสั้นๆ แต่เมื่อผู้ใช้ต้องการเห็นประวัติการใช้ย้อนหลังไปนานๆ จึงต้องมีการใช้ disk สำหรับ Newsfeed และเมื่อ server flash เกิดขึ้น หลายๆ อย่างก็ถูกย้ายไป flash รูปต่างๆ ยังคงอยู่บน spinning disk เพราะมันมีขนาดใหญ่และ disk เองก็มีราคาถูก แต่ข้อมูลของผู้ใช้คงอยู่บน SSD ทั้งหมดในปัจจุบัน

เหตุผล 3 ประการที่ทำให้ dataset ของ Facebook ใหญ่ขึ้นเรื่อยๆ ซึ่งทำให้ยากต่อการเก็บข้อมูลทั้งหมดในหน่วยความจำ คือการที่มีการเพิ่มผู้ใช้ใหม่ขึ้นเรื่อยๆ ผู้ใช้ที่มีอยู่ก็สร้าง content เพิ่มขึ้นเรื่อยๆ และจะเติบโตโดยไร้ขอบเขต และการที่ application มีความซับซ้อนขึ้นเรื่อยๆ ตามไป

2.1 ชนิดของหน่วยความจำสำหรับแต่ละงาน

เทคนิค 2 อย่างที่มีความสำคัญพิเศษเพื่อให้ application ที่มี performance สูงและความล่าช้าต่ำ โดยที่ลดการพึ่งพา RAM คือการบีบอัดข้อมูลและการทำ pipelining เพื่อเพิ่มความเร็วในการสแกน

Server แบบ Transactional ได้เพิ่มเทคนิคเช่น block level compression เรามักจะไม่นึกถึงการบีบอัดข้อมูลหรือcompression เมื่อเราต้องการเพิ่มสเกลของฐานข้อมูล ทีมงานด้าน IT มักจะใช้เวลาในการ optimize และพยายามที่จะลดความต้องการด้านหน่วยความจำ

ผู้เชี่ยวชาญด้าน IT มักจะคิดว่าการทำ compression และ decompression ใช้จำนวน CPU cycle มากเกินไป แต่เมื่อ processor มีความเร็วขึ้น และอัลกอริทึมด้านการบีบอัดข้อมูลดีขึ้น ต้นทุนด้านการทำ compression ก็เป็นเรื่องที่ไม่ต้องคำนึงถึง อันที่จริง การที่เราบีบอัดข้อมูลก่อนทำการส่งเข้าเครือข่ายจะเร็วกว่าเพราะชั้น stack ของซอฟต์แวร์ที่ทำงานด้านเครือข่ายจะใช้จำนวน cycle ต่อไบต์มากกว่าการบีบอัดข้อมูลด้วยซ้ำ

เทคนิคที่สำคัญอีกอย่างในการใช้ประโยชน์จาก spinning disks และ SSD คือการปรับปรุงความสามารถในการ pipeline ข้อมูลออกจาก disk แง่มุมในการปรับปรุงประสิทธิภาพจากวิธีดังกล่าวมักจะถูกมองข้าม คุณสามารถชดเชยความช้าของ disk หรือ SSD ด้วยการทำ pipeliningDisk นั้นมีความเร็วสำหรับข้อมูลแบบ streaming data แม้กระทั่ง spinning disk ความเร็วก็จะเพิ่มขึ้นตาม Moore’s Law ความช้าจะเกิดขึ้นเมื่อเราทำการหาข้อมูล ดังนั้นข้อมูลที่กระจัดกระจายจะเป็นปัญหา เราจะปรับปรุงประสิทธิภาพของซอฟต์แวร์ด้านฐานข้อมูลและ filesystem ด้วยการออกแบบ application อย่างเหมาะสม โดยจัดให้ข้อมูลที่จะถูกเข้าถึงด้วยกันให้มีการจัดเก็บด้วยกัน

ความเร็วในการ scan นั้นยากในการทำนายเพราะเป็นการง่ายที่ software stack จะทำให้เกิดการไม่ต่อเนื่องและจำเป็นต้องทำการ seek หรือหาข้อมูล ดังนั้นการทดสอบจึงมีความสำคัญยิ่งยวด ในการประเมิน. filesystem หรือฐานข้อมูล

2.2 RAM และอื่นๆ

RAM นั้นเยี่ยมยอดในการทำให้สิ่งต่างๆ ทำงานเร็วขึ้น แต่ความต้องการ RAM ของเรามักจะเพิ่มขึ้นเร็วกว่าความสามารถในการ scale ขนาดเพิ่มขึ้นให้ทันกับความต้องการ ดังนั้น การเลือกใช้ solution แบบ in-memory จึงไม่ใช่คำตอบสำหรับทุกอย่าง มันมีขีดจำกัดด้นการเติบโตและความเร็ว Disk, flash และ RAM ต่างก็มีบทบาทในระบบที่มีออกแบบอย่างดี คุณควรพิจารณาใช้เทคนิคการบีบอัดข้อมูลและการ optimize ความเร็วในการสแกนเพื่อเพิ่มความเร็วในการเข้าถึงหน่วยความจำแบบ disk-base ที่สามารถสเกลได้ ซึ่งจะช่วยให้คุณสามารถทำการ scaleapplication ได้อย่างรวดเร็วอย่างเพียงพอ

 3. สิ่งที่คนมักเข้าใจผิดเกี่ยวกับ IMC

3.1     IMC เพิ่มความสามารถในการแข่งขันได้ทันทีแบบแกะกล่อง

เราสามารถได้ความเร็วที่เพิ่มขึ้นของ analytical และ transactional process แต่ไม่ได้เป็นการเพิ่มความสามารถในการแข่งขันอย่างยั่งยืน การใช้ IMC เป็นตัวเพิ่มขีดความสามารถต้องอาศัยความสามารถในการระบุหา และตอบสนองความต้องการด้านข้อมูลเฉพาะของแต่ละธุรกิจ ซึ่งจะต้องการการจัดการปริมาณข้อมูลรวมถึง analytical และ transactional process อย่างมีประสิทธิภาพ

3.2     IMC แก้ปัญหาประสิทธิภาพในปัจจุบันและอนาคต

การคาดหวังว่า IMC จะช่วยลดข้อท้าทายทางประสิทธิภาพนั้นดูจะสมเหตุสมผล อย่างไรก็ดี การเติบโตของปริมาณข้อมูลอย่างต่อเนื่องแบบ exponential อาจจะทำให้ประสิทธิภาพที่เร็วขึ้นอาจจะตามไม่ทันในเวลาไม่ช้า โดยเฉพาะเมื่อเราเสียการทำงาน IMC ไปกับประเด็นด้านคุณภาพของข้อมูล รวมถึงการใช้ IMC อย่างไม่มีประสิทธิภาพ (เช่น การ query ที่มีการซับซ้อนโดยไม่จำเป็น หรือมีการคำนวณหรือ aggregation ข้อมูลอย่างซับซ้อน)

3.3     IMC ช่วยลดงานด้าน IT Governance

หากเราลดระดับความสนใจด้าน IT Governance ลง โดยมุ่งไปที่ประสิทธิภาพที่เพิ่มขึ้น จะส่งผลให้การเพิ่มขึ้นของความทับซ้อน (redundancies) ด้าน process ต่างๆ และความซับซ้อน รวมถึงการเพิ่มของปริมาณข้อมูลและงานด้านบำรุงรักษา ผลกระทบที่มีต่อประสิทธิภาพของ IMC จะมีมากหากปริมาณของข้อมูลและจำนวน database query เพิ่มขึ้นมากจาก IT Governance ที่แย่

 4.การสร้างมูลค่าจาก IMC

4.1 มิติที่แตกต่างของการสร้างมูลค่า IMC

การวางระบบ IT และธุรกิจอย่างสอดคล้องกันแนบแน่นภายในหน่วยงานต้องอาศัยแผนก IT สนับสนุนเป้าหมายทางธุรกิจอย่างมีประสิทธิภาพ การใช้ IMC เพื่อวัตถุประสงค์ด้านการวิเคราะห์ข้อมูลมีความเหมาะสมหรือไม่ต้องดูที่มูลค่าที่ IMC สร้างขึ้น รูปที่ 2 แสดงมิติทั้ง 4 ของการสร้างมูลค่า มิติต่างๆ เหล่านี้เป็นตัวช่วยยกระดับองค์กร

2

รูปที่ 2 มิติต่างๆ ของการสร้างมูลค่า 

4.1.1. ประสิทธิภาพ (Performance)

ระยะเวลาในการวิเคราะห์ข้อมูล ซึ่งรวมขั้นต่างๆ ตั้งแต่ข้อมูลดิบไปถึงผลการวิเคราะห์ขั้นสุดท้าย ถูกลดลงจากหลายชั่วโมงเป็นหลักนาทีหรือวินาที IMC จะใช้ประโยชน์จากข้อมูลล่าสุดเพื่อวัตถุประสงค์ด้านการวิเคราะห์ข้อมูลและตัดสินใจ

4.1.2. นวัตกรรมของ process (process innovation)

ประสิทธิภาพที่ดีขึ้นจะส่งเสริมศักยภาพให้กับ application ที่มีนวัตกรรมในการสร้างความแตกต่างให้เหนือคู่แข่ง ตัวอย่างเช่น อุตสาหกรรมการเงินที่พิจารณาความเสี่ยงได้จากการวิเคราะห์แบบใกล้เคียง real-time หรืออุตสาหกรรมการผลิตที่ใช้ข้อมูลล่าสุดในการพิจารณาการจัดตารางงานที่มีความซับซ้อน

4.1.3. การทำให้ง่ายขึ้น (Simplification)

จากการที่เรามีจำนวน layer ในการทำงานที่ลดลง (ไม่ต้องใช้ data mart) ความซับซ้อนของแบบจำลองข้อมูลก็จะลดลงอย่างมาก data model ที่ง่ายลง จะช่วยให้ทำงานเร็วขึ้น ใช้การทดสอบน้อยลง มีจุด restart น้อยลง และทำการ adaptation ได้ง่ายขึ้น ความซับซ้อนที่ลดลงยังช่วยลดความผิดพลาดที่อาจจะเกิดขึ้นด้วย

4.1.4. ความยืดหยุ่น (Flexibility)

การคำนวนผลการวิเคราะห์จากข้อมูลดิบได้อย่างใกล้เคียง real-time ช่วยเพิ่มความยืดหยุ่นใน 2 แง่ คือ การ integrate รวม data source เพิ่มเติม การปรับแต่ง (modification) การวิเคราะห์ เราสามารถ plug in data source เป็นแหล่งข้อมูลใหม่ได้อย่างง่ายเพราะทุกๆ การคำนวณจะเริ่มจากข้อมูลดิบ

มิติทางด้านความยืดหยุ่นและการทำให้ง่ายขึ้นช่วยลดต้นทุนในการเป็นเจ้าของระบบ (TCO : Total Costof Ownership) เป็นอย่างมาก เพราะช่วยลดงานในการพัฒนา data model ใหม่ รวมถึงลดงานด้านการบำรุงรักษาและการพัฒนา data model ที่มีอยู่

4.2 ขั้นตอน 4 ขั้นตอนในการใช้ประโยชน์จากการสร้างมูลค่า

สถาปัตยกรรม IT ที่ดีควรจะสะท้อนถึงความเข้าใจในวิธีที่ IT จะให้ค่าต่อธุรกิจ และการสร้างมูลค่าว่าจะแปลงไปเป็น application, data model และ IT ได้อย่างไร ในการที่จะสนับสนุนการสร้างมูลค่า IMC จะต้องอยู่ในสถาปัตยกรรมอย่างเหมาะสม ซึ่งค่อนข้างตรงไปตรงมาหากมีการจัดสร้างสถาปัตยกรรมอย่างชัดเจน จากรูปที่ 3 จะแสดงขั้นตอนทั้ง 4 ในการใช้ประโยชน์จากการสร้างมูลค่าจาก IMC 

3

รูปที่ 3 ขั้นตอนต่างๆ ในการประยุกต์ใช้ประโยชน์จาก IMC อย่างประสบผลสำเร็จ

การเลือกความสามารถ (capabilities) ของ application ควรได้รับการผลักดันจากคุณค่าทางธุรกิจที่เราต้องการ

ขั้นตอนแรก เราต้องกำหนดกระบวนการที่ชัดเจนและกรอบการทำงานที่มีการจัดลำดับความสำคัญ ในการนี้ ต้องมีการนิยามความสามารถ (capabilities) ที่มีความสำคัญสูงสุดตามคุณค่าทางธุรกิจ อย่างไรก็ดี เราควรจะมีการมองถึงแง่มุมที่กว้างไกลเกินกว่าเพียงประสิทธิภาพที่สูงขึ้น โดยพิจารณาถึงการเปลี่ยนแปลงใน process ด้วยเพื่อใช้ประโยขน์จากศักยภาพที่ไม่ได้คาดคิดมาก่อน ข้อได้เปรียบในเชิงแข่งขันที่แท้จริงจะเกิดขึ้นเมื่อการวิเคราะห์ที่มีความรวดเร็วกลายเป็นส่วนหนึ่งของ business process และ decision support

ขั้นที่สอง ต้องมีการหาการเปลี่ยนแปลงที่เกิดขึ้นกับสถาปัตยกรรม (enterprise architecture) ซึ่งจำเป็นต่อ application แต่ละด้าน การเปลี่ยนแปลงแบ่งเป็น 3 ประเภท คือ เทคโนโลยี data model และ process ตัวเลือกทางเทคโนโลยีจะกำหนด scope ของระดับการตอบรับ IMC ส่วนการเปลี่ยนแปลงใน data model และ process กำหนดระดับการ optimization ในการใช้ประโยชน์จากศักยภาพของทางเลือกทางเทคโนโลยี หากมองจากมุมมอง bottom-up ทางเลือกทางเทคโนโลยีจะกำหนดขอบเขตของข้อมูลดิบที่จะถูก integrate เข้าระบบ และเป็นตัวกำหนดว่า application แบบที่เป็น analytical และ operational จะสามารถ run อยู่บนข้อมูลแบบ IMC ได้

ในการใช้ศักยภาพของ IMC ให้ได้เต็มที่ application ต้องมีการปรับให้เข้ากับ infrastructure ไม่เช่นนั้นเราจะได้ประโยชน์เพียงจากประสิทธิภาพที่ดีขึ้นทางฮาร์ดแวร์ แต่ไม่สามารถใช้ประโยชน์จาก feature พิเศษทางซอฟต์แวร์ เช่น built-in calculation สำหรับในกรณีของการเปลี่ยนแปลงด้าน process แลลละ data model ก็จะเป็นในลักษณะเดียวกัน IMC จะมีศักยภาพมากที่สุดก็ต่อเมื่อมีการปรับ process และ data model ให้เหมาะสม

ขั้นตอนที่ 3 ต้องมีการกำหนดแผนการ migration ไปสู่ IMC อย่างดี ตัวอย่างเช่น หากต้องการปรับปรุงประสิทธิภาพอย่างรวดเร็ว ก็อาจเปลี่ยน data warehouse แบบเก่าให้เป็น data warehouse แบบ IMC อย่างไรก็ตาม หากเป้าหมายระยะยาวคือการลดต้นทุนการเป็นเจ้าของระบบ (TCO) โดยการทำให้ง่ายขึ้นและให้ได้ประสิทธิภาพมากที่สุด ต้องมีการ optimize data model และ application ให้เหมาะกับ IMC ในขั้นตอนที่ 2 ในที่สุดแล้ว แผนการ migration จะเป็นตัวกำหนดว่าจะทำให้เกิดการเปลี่ยนแปลงครั้งใหญ่หรือเป็นการเปลี่ยนถ่ายอย่างราบรื่นที่จะทำให้เกิดประโยชน์ตามที่ migration plan ได้วางไว้

ขั้นตอนที่ 4 หลังจากที่ได้กำหนดถึงประโยชน์และความพยายามในการนำ IMC มาใช้ เราควรจะเปรียบเทียบกับทางเลือกอื่นๆ ด้วยซึ่งแม้จะมีประโยชน์น้อยกว่าแต่ก็ใช้ต้นทุนที่ต่ำกว่าด้วย เช่นการ optimize ส่วนของ process, data model และขบวนการวิเคราะห์ข้อมูลที่มีอยู่ ยิ่งไปกว่านั้น การ update ฮาร์ดแวร์หรือซอฟต์แวร์ด้าน data warehouse ก็อาจเพียงพอที่จะให้ได้ประโยชน์ตามที่เราต้องการ

 5. สถานการณ์การใช้งาน IMC ในปัจจุบัน

5.1 ทัศนคติของภาคอุตสาหกรรมที่มีต่อ IMC

ผลจากการสำรวจผู้เชี่ยวชาญจากภาคอุตสาหกรรมกว่า 300 รายในเยอรมันนีที่จัดทำโดย Deloitte โดยครอบคลุมถึงภาคส่วนอุตสาหกรรมต่างๆ เช่น การค้าปลีก พลังงาน ยา เคมี การเงิน และการบิน โดยมีการสำรวจกับทั้งผุ้เล่นหลัก และ niche player ในภาคอุตสาหกรรม

ผู้ตอบแบบสอบถามได้ประเมินโครงการในการนำ IMC มาใช้ตามสถานะต่างๆ ตั้งแต่ Established, Live, Implementation, Pilot และ Evaluation โดยระดับการนำมาใช้จากมากไปน้อย ตั้งแต่ Established ไปจนถึง Pilot ส่วน Evaluation เป็นขั้นการพิจารณานำ IMC มาใช้

4

รูปที่ 4 การกระจายสถานะต่างๆ ของการนำ IMC มาใช้

โดยรวมแล้ว ผู้ตอบแบบสอบถามมีการนำ IMC มาใช้กว่าครึ่งหนึ่ง ซึ่งส่วนใหญ่จะอยู่ในขั้น Pilot (22%) มีเพียงราว 11% ที่มีการนำ IMC มาใช้อย่างเต็มตัว อีกเกินครึ่งยังอยู่เพียงในขั้น Evaluation 64% ของผู้ตอบระบุว่ามีการวางแผนจะนำ IMC มาใช้ภายใน 3 ปี อีก 15% จะนำมาใช้ใน 4 ปีและอีก 21% ยังไม่ตัดสินใจว่าจะใช้ IMC เมื่อไร ผลการสำรวจแสดงให้เห็นว่า IMC ยังไม่แพร่หลาย มีกลุ่มผู้ริเริ่มใช้ที่ฉวยปะโยชน์จากเทคโนโลยีดังกล่าว ผู้ที่เริ่มนำ IMC มาใช้กำลังสะสมประสบการณ์ในการใช้อยู่ ในขณะที่ส่วนใหญ่ยังอยู่ในขั้น pilot

5

รูปที่ 5 มิติด้านคุณค่าของ IMC ในระยะสั้น

6

รูปที่ 6 มิติด้านคุณค่าของ IMC ในระยะยาว

 5.2 ข้อพิจารณาด้านมิติด้านคุณค่าที่แตกต่างกัน

มิติด้านคุณค่าที่ต่างกันเป็นปัจจัยหลักในการประเมินประโยชน์จากการใช้งาน IMC รูป 5 และ 6 แสดงมิติด้านคุณค่าที่องค์กรต่างๆ ต้องการได้จาก IMC ทั้งนี้มีการเปรียบเทียบมุมมองระยะสั้นและระยะยาว ทั้งนี้ มิติด้าน performance จะเป็นตัวผลักดันหลักที่ทำให้เกิดประโยชน์ระยะสั้น ในขณะที่ process integration, การทำให้ง่าย (simplification) และความยืดหยุ่น ต้องการการเตรียมการที่มากกว่า แต่จะมีผลกระทบต่อธุรกิจที่มากกว่า

ส่วนการวิเคราะห์มิติด้านมูลค่าระยะยาว แสดงให้เห็นถึงมิติด้านคุณค่าที่ครอบคลุมหลายประเด็นกว่า ความแตกต่างระหว่างมุมมองระยะสั้นและระยะยาว แสดงให้เห็นว่าองค์การส่วนใหญ่จะตอบรับและนำ IMC มาใช้แบบค่อยเป็นค่อยไปมากกว่าเปลี่ยนแปลงครั้งใหญ่แบบทันที

ผลการสำรวจตอกย้ำถึงความจำเป็นในการเตรียม migration plan เพื่อให้เกิดคุณค่าที่ต้องการ เป็นที่น่าสนใจว่า องค์การที่ได้นำ IMC มาใช้แล้วมีการวางแผนเพื่อจะให้ได้มิติทางคุณค่าด้านต่างๆ จาก IMC ในระยะยาว นั่นแสดงให้เห็นว่า เรามักจะประเมินศักยภาพของ IMC ต่ำเกินไปก่อนทำการ implementation การลดต้นทุนของการเป็นเจ้าของระบบ (TCO) เป็นศักยภาพในระยะยาวของการนำ IMC มาใช้

5.3 การประเมิน implementation timeline ที่ต่ำเกินไป

องค์กรที่ยังไม่ได้นำ IMC มาใช้มักจะประเมินว่าต้องใช้เวลามากกว่าในการบรรลุเป้าหมายระยะสั้น รูปที่ 7 แสดงการประเมิน timeline ที่องค์กรต่างๆ คิดว่าจะใช้ประโยชน์ IMC เพื่อให้บรรลุเป้าหมายระยะสั้น ในที่นี้ ระยะสั้นนิยามไปถึงระยะเวลาตั้งแต่ 0-3 ปี สำหรับ timeline ในระยะยาวได้นิยามเป็นระยะเวลา 6 ปีดังแสดงในรูปที่ 8

องค์กรที่ยังไม่ได้นำ IMC มาใช้ มีแนวโน้มที่จะประเมินความพยายามที่ต้องใช้เพื่อบรรลุเป้าหมายต่ำเกินไป ดังที่กล่าวไว้ข้างต้น การตอบรับนำ IMC มาใช้และการบรรลุซึ่งคุณค่ามิติต่างๆ ของ IMC ไม่ใช่เรื่องง่าย ผลการสำรวจพบว่าผู้ที่นำ IMC มาใช้ต้องเจอข้อท้าทายด้านคุณภาพของข้อมูล การ integrate ของแหล่งข้อมูลต่างๆ การ integrate ของ application กับโครงสร้างพื้นฐาน การกำหนดขนาดของฮาร์ดแวร์ให้เหมาะสม

IMC จะไม่ก่อให้เกิดคุณค่าแบบยั่งยืนหากไม่มีความใส่ใจในการ implement ต้องมีการจัดการปริมาณข้อมูลและกระบวนการในการวิเคราะห์อย่างมีประสิทธิผล การเก็บและประเมินวิเคราะห์ข้อมูลที่ขาดการโฟกัสจะไม่ให้ผลลัพธ์ที่ทำให้เราเข้าใจในข้อมูลและไม่ได้เพิ่มขีดความสามารถในการแข่งขันของเราแต่อย่างใด

ผลการสำรวจ แสดงให้เห็นว่า 67% ขององค์กรจะใช้ถึงประมาณ 40% ของข้อมูลที่เก็บรวบรวมมาในการวิเคราะห์ ยิ่งไปกว่านั้น กว่า 81% ขององค์กรได้ประมาณว่า 40% ของกระบวนการการวิเคราะห์จะได้รับประโยชน์โดยตรงจากการเพิ่มความเร็วจาก IMC ดังนั้น องค์กรส่วนใหญ่จึงไม่ได้คาดว่า IMC จะมาแทนที่ระบบ data warehouse แบบเก่าโดยสิ้นเชิง IMC จึงถูกมองว่าเป็นเทคโนโลยีที่นำใช้กับกระบวนการวิเคราะห์ข้อมูลโดยเฉพาะ

7

รูปที่ 7 Timeline ในการใช้ประโยชน์จากคุณค่าของ IMC – มุมมองระยะสั้น

8

รูปที่ 8 Timeline ในการใช้ประโยชน์จากคุณค่าของ IMC – มุมมองระยะยาว

 5.4 ความจำเป็นในการมี action ขึ้นอยู่กับการตอบรับระบบ

องค์กรต่างๆ ต้องมี action เพื่อที่จะใช้ประโยชน์จากการใช้ศักยภาพของ IMC รูปที่ 9 แสดงความจำเป็นต่างๆ ที่จะต้องมี action ที่ผู้ตอบแบบสอบถามได้ระบุไว้ องค์กรที่ยังอยู่ในขั้น evaluation เพื่อพิจารณาการนำ IMC ใช้งานมักจะประเมินความพยายามที่ต้องใช้ใน ระบบในขั้นที่ถัดจากการเลือกเทคโนโลยีต่ำเกินไป ซึ่งความพยายามดังกล่าว รวมถึงความพยายามในการ implement การประเมินค่า (revaluation) ของ application portfolio รวมไปถึงการเปลี่ยนแปลงที่เกิดกับ IT Governance และการออกแบบ process redesign

9

รูปที่ 9 ความจำเป็นในการมี action เพื่อใช้ประโยชน์จากศักยภาพของเทคโนโลยี IMC 

5.5 ต้องใช้ความพยายามในการ implement มาก และศักยภาพมากที่จะตามมา

ก่อนที่จะการ implement โครงการ มีเพียงข้อดีด้าน performance ที่ได้เพิ่มขึ้นเท่านั้นที่ดูเหมือนจะเป็นประโยชน์ที่ได้ ปัจจัยและผลลัพธ์อื่นๆ ดูจะไม่เกี่ยวข้อง และเมื่อมีการ runIMC แล้ว performance ที่ดีขึ้นจะเห็นได้อย่างชัดเจน และในระหว่างการ implementation ก็เริ่มมีประเด็นอื่นเกิดขึ้น ตัวอย่างเช่น ด้าน integration scenario ในการ integrate เข้ากับระบบ BI (Business Intelligence) ที่มีอยู่และระบบในอนาคต ณ จุดนี้ ประเด็นด้าน TCO จะเริ่มมีความสำคัญมากขึ้น ในกรณีส่วนใหญ่แล้ว IMC จะช่วยลด TCO อย่างไรก็ดี เหตุการณ์ดังกล่าวมักจะเกิดขึ้นเมื่อเราเริ่มมี productivity ที่เพิ่มขึ้นเร็วกว่าต้นทุนที่เพิ่มขึ้น และเมื่อระบบและกระบวนการ (process) ได้ทำการ integrate กันแล้ว ผู้เชี่ยวชาญจะเริ่มนึกถึงศักยภาพข้อดีด้านอื่นของ IMC      โดยรวมแล้ว ผลการสำรวจได้ตอกย้ำให้เห็นถึงความจริง 2 ประการคือ

  1. ในระหว่างขั้นตอนการตัดสินใจ องค์กรต่างๆ มักจะประเมินความพยายามที่ต้องใช้หลังจากที่ได้ทำการเลือกเทคโนโลยีต่ำเกินไป

  2. ศักยภาพในการลดต้นทุนความเป็นเจ้าของระบบ TCO ได้รับการประเมินต่ำไปอย่างมาก

สรุปโดยภาพรวม IMC เป็นอนาคตของเทคโนโลยี computing แต่ต้องมีกลยุทธที่ชัดเจนในทุกขั้นตอนตั้งแต่การประเมินไปจนถึงการ implement ซึ่งรวมถึงการระบุหาและประเมินโอกาสในการใช้ IMC การพัฒนา business case การจัดการด้านการ implement รวมถึงการจัดการด้านการเรียนรู้และการเปลี่ยนแปลงในระบบแบบ pilot และที่ทำการ rollout จริง หากองค์กรได้พิจารณาถึงความจริงดังกล่าวและดำเนินการไปตามกลยุทธที่วางไว้อย่างชัดเจน IMC ก็จะก่อให้เกิดสักยภาพอย่างมหาศาลทั้งในการลดต้นทุนความเป็นเจ้าของระบบ TCO รวมถึงมิติด้านคุณค่าอื่นๆ เช่น performance นวัตกรรมของ process การทำให้ง่าย และความยืดหยุ่น

 

 

 

Leave a Comment

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>