ทำไมเรื่องแย่ๆจึงจำแม่นกันจัง
09/07/2019
กัญชาที่รู้ ชัวร์หรือมั่ว!
12/07/2019

อะไรๆ ก็ data (EP.1/2)

วันนี้ผู้เขียนได้อ่านบทความมาแล้วรู้สึกว่าน่าสนใจดี บวกกับหลายๆอย่างดูจะเป็นประโยชน์กับเพื่อนๆ พี่ๆ และน้องๆ หลายคนที่เป็น entrepreneurs ทีนี้ด้วยความอยากจะแชร์  จึงได้สรุปประเด็นสั้นๆ เผื่อมีคนสนใจและสามารถนำไปใช้ประโยชน์ได้ต่อไป
หลังๆ มานี้คนรู้จักหลายๆคนเริ่มตื่นตัวกับการประยุกต์ใช้ data analytic กับการแก้ปัญหาต่างๆ พูดง่ายๆคือ รู้นะว่าสำคัญ รู้นะว่าจะต้องเริ่มใช้แล้ว แต่ไม่รู้ว่าจะเริ่มยังไง ได้ยินสื่อและคนอีกหลายคนพูดถึงเยอะ ว่ามันสำคัญนะ ยุคนี้ต้องข้อมูลนะ ต้องเทคโนโลยีนะ ฯลฯ แต่ไม่มีใครบอกว่าแล้วไงต่อล่ะ ต้องเริ่มยังไง ต้องทำอะไรบ้าง ชั้นขายกล้วยทอดนะ ชั้นต้องไฮเทคขนาดไหนหรอ บ้าหรอ มีแค่อาลีเพย์ให้นักท่องเที่ยวจีนก็ไฮพอล่ะมั้ง

ส่วนตัวผู้เขียนมองว่าเรื่อง data analytic มันเป็นเรื่องของ thought process มากกว่าจะเป็นเรื่องทางเทคนิคสำหรับพวก data scientist เท่านั้น คือมันมีงานบางชนิด และบาง scale ที่จำเป็นต้องใช้ความรู้ทางเทคนิค แต่ก็มีงานอีกจำนวนมากที่ไม่จำเป็นต้องใช้ความรู้ทางเทคนิค ซึ่งวิธีการวิเคราะห์แบบ non-technical พวกนี้หลายๆอย่างก็มีสอนในวิชาพวก Marketing หรือวิชาแนว Business ทั่วไป แต่ว่าสำหรับชาว Millennials ไง ถ้าบอกว่าเราใช้แค่ความรู้ Marketing/Business เฉยๆมันไม่ค่อยคูล เราต้องบอกว่าเราไม่ธรรมดานะ เรา big นะนี่ (big data) ดังนั้นการรวมแนวคิดทางด้าน Business, Marketing กับ Data analytic คือทางของเรา (อันนี้พูดเล่น) คือจริงๆแล้วสาขาพวกนี้มันมีส่วน overlap กันมาแต่ไหนแต่ไรอยู่แล้ว เทคนิคต่างๆส่วนใหญ่ก็มีใช้กันมานาน แต่ใช้กันในเฉพาะบริษัทใหญ่ๆที่มีเงินทุนสูง ผมรู้สึกว่าสิ่งที่แตกต่างกันระหว่างยุคก่อนและยุคนี้คือ scale ของข้อมูลและเงินทุน (อันนี้ขอละเว้นปัจจัยทางเทคนิคเช่น computational efficiency และอื่นๆ) ซึ่งในยุคนี้บริษัทขนาดกลางและขนาดเล็กก็สามารถ access วิธีการเหล่านี้ได้ (ซึ่งก็คือการ democratizing knowledge นั่นเอง)

ปัจจัยที่สำคัญอีกอันนึงคือว่าด้วยยุคสมัยที่เปลี่ยนไป ขอบเขตของการขายสินค้าและบริการมันกว้างขึ้น กล้วยทอดป้าแมวไม่ได้ขายเฉพาะแค่คนในซอยอีกต่อไป มีการ advertise และมีคนขับรถไกลๆมาซื้อ ดังนั้นการเริ่มฝึกฝนวิธีคิดหรือ thought process นี้เป็นอะไรที่สำคัญ ระบบความคิดที่ว่านี้ควรจะ “เป็นระบบ” มากขึ้น ข้อมูลหลายๆอย่าง “ควร” ที่จะเริ่มมีการเก็บอย่างเป็นระเบียบ สำหรับหลายๆคนที่มีการเก็บข้อมูลอยู่แล้ว จะด้วยจาก point of sale (POS) หรือข้อมูลอื่นๆก็ตาม ควรที่จะต้องมองตัวแปรอื่นๆที่สำคัญที่ควรจะเก็บ (เริ่มยาวแฮะ เดี๋ยวจะแบ่งอธิบายให้เป็นหัวข้อๆต่อไปนะคะ)

ต้องเข้าใจก่อนว่าจริงๆแล้วผู้ประกอบการทุกคนมี data อยู่ในหัวอยู่แล้วจากการยืนขายนั่งขายของอยู่ทุกวัน ข้อมูลต่างๆเหล่านี้มันสะสมและถูกนำออกมาใช้ในลักษณะ เช่น สินค้าหรือบริการตัวไหนฮอทสุด คนพวกไหนชอบสินค้าเรา โวลุ่มการขายจะพีคสุดในช่วงไหน (และข้อมูลพื้นฐานทางด้าน demographic ต่างๆนาๆ) เพียงแค่ข้อมูลเหล่านี้มันไม่ concrete ไม่มีการเก็บบันทึก (หรือบันทึกไม่ดี) และเอาไป “ต่อยอด” ไม่ได้ ข้อมูลพวกนี้สุดท้ายมักจะถูกกลั่นกรองออกมาเป็น “ความรู้สึก” เช่น ช่วงนี้ขายดี เพราะนักท่องเที่ยวเยอะ ช่วงนี้ขายไม่ดี เพราะเศรษฐกิจไม่ค่อยดี (มั้ง) ซึ่งของพวกนี้มันวัดผลไม่ได้ และต่อยอดไม่ได้ หาความสัมพันธ์ของตัวแปรและปัจจัยต่างๆก็ไม่ได้ การใช้ data ที่เป็นความรู้สึกเลยมี limitation สูง

การเก็บข้อมูลนี้สำคัญมาก หลายคนอาจคิดว่าอือ เดี๋ยววันนึงถ้าต้องใช้พวก data analytic tools ต่างๆนาๆเราค่อยเริ่มศึกษาดูว่าจะใช้อะไร อีกหน่อยคงมี user interface แบบเข้าใจง่ายให้คนสามารถใช้ได้ง่ายมากขึ้น (ซึ่งตอนนี้ก็มีบ้างแล้ว) แต่ปัญหาคือเวลาที่จะเริ่มใช้แล้วไม่มีข้อมูลเลย (มีแต่ความรู้สึกในหัวว่าอะไรขายดี ใครคือกลุ่ม target) แบบนี้ถึงมี tools มีนักวิเคราะห์มาช่วยก็ทำอะไรไม่ได้ “เวลาส่วนใหญ่ของการวิเคราะห์ข้อมูลอยู่ที่การเก็บข้อมูล” จากนั้นถึงเป็นเรื่องการคลีนอัพข้อมูลและวิเคราะห์ ไม่ใช่ว่าเดือนหน้าจะใช้ก็มาเริ่มเก็บวันนี้ (อย่าทำเหมือนส่งการบ้าน ดองไว้แล้วมาทำก่อนส่งแปบเดียว) หรือเก็บ 3-4 เดือนก่อนใช้ ในขณะที่ business ตัวเองมีลักษณะเป็น Seasonal

สำหรับคนที่ยังไม่ได้เริ่มเก็บและไม่รู้ว่าจะต้องเริ่มยังไง แต่รู้ว่ามันสำคัญ ไม่ตอนนี้ก็ในอนาคตอันใกล้ ผมอยากแนะนำว่าสิ่งที่ง่ายและสำคัญที่สุดตอนนี้คือ “เริ่มเก็บข้อมูลให้สะอาดและเป็นระเบียบ ถึงเวลาแล้วจะได้ใช้ได้เลย” ปัญหาที่ปวดหัวที่สุดไม่ใช่ว่าจะใช้ model หรือ algorithm อะไรมาวิเคราะห์ แต่คือ (1) ไม่มีข้อมูลย้อนหลังอย่างเพียงพอ (หรือไม่มีเลยเลย) (2) ข้อมูลสะเปะสะปะ ขาดๆแหว่งๆ เก็บบ้างไม่เก็บบ้าง หรือ เก็บลวกๆ (error เพียบ)

ตั้งใจจะเขียนให้สั้นๆ สำหรับคนไม่ค่อยมีเวลาอ่านและคิดทบทวนนานๆ ไปๆมาๆกลายเป็นยาวไปซะหน่อย งั้นพักสายตา ขยับร่างกันซะหน่อย อย่าเพ่งจอนานๆ เดี๋ยวจะเสียสุขภาพกันไป เอาเป็นว่าเดี๋ยวจะแชร์ข้อมูลในครั้งหน้ากับปัญหาที่ว่า แล้วจะเก็บอะไรบ้าง ข้อมูลไหนจำเป็น ข้อมูลไหนไม่จำเป็น (ทำไมไม่เข้าเรื่องซักที น้ำอยู่นั่น ข้อเนื้อบ้าง ลูกชิ้นด้วย) สำหรับตอนนี้ สรุปสั้นๆคือ (1) เริ่มเก็บข้อมูลได้แล้ว (2) เก็บดีๆ เก็บให้สม่ำเสมอ และเก็บให้เป็นระเบียบ นะจ้ะ