การพัฒนา AI เพื่อ Trade หุ้นไทยด้วย Machine Learning

ปัจจุบันนั้น เทคโนโลยีทางด้าน AI หรือ Machine Learning กำลังเป็นที่สนใจในหลาย ๆ ธุรกิจ ที่จะนำมาพัฒนาเครื่องมือต่าง ๆ เพื่อช่วยเหลือการดำรงชีวิตของมนุษยเราให้สะดวกมากยิ่งขึ้น ในแวดวงของการลงทุน AI ก็เริ่มเข้ามามีบทบาทมาช่วงหนึ่งแล้ว ซึ่งเราจะได้เห็นโฆษณาต่าง ๆ ผ่านหน้าผ่านตากันมาบ้าง ว่ามีกองทุนที่พัฒนาโดย AI มาคอยช่วยเหลือการ trade

งานวิจัยหลาย ๆ งานที่ได้ตีพิมพ์ในต่างประเทศนั้น ก็มีความน่าสนใจ ในแง่ของผลของการทดลองที่นำ AI มาช่วยประมวลผล และช่วยเหลือในการ trade ตัวอย่าง การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว ที่ผมเคยเขียน blog ไปก่อนหน้านี้ก็เป็นงานที่น่าสนใจ ที่นำปัจจัยเรื่องข่าวมาช่วยประมวลผล เพื่อทำการทำนาย market trend ที่กำลังจะเกิดกับหุ้นชื่อดังอย่าง AAPL ของ บริษัท apple ซึ่งผลนั้นก็ได้ความแม่นยำในระดับสูงกว่า 80%  ซึ่งถือว่าเป็นผลที่น่าสนใจไม่ใช่น้อย

Support Vector Machine ก็เป็น algorithm หนึ่งที่น่าสนใจที่สามารถจำแนกและทำนายได้แม่นยำค่อนข้างสูงในหลาย ๆ case ตัวอย่างงานวิจัยที่ส่วนตัวเคยได้ทำ คือ Support Vector Machine กับการวิเคราะห์มะเร็งเต้านม  ซึ่งเป็นการจำแนกมะเร็งเต้านมจาก Mammogram Image ได้ ซึ่งได้ความแม่นยำค่อนข้างสูงกว่า 90%  แต่ปัจจัยหลักที่สำคัญสำหรับการจำแนกนั่นก็คือ Attribute หรือ Features ที่เป็นค่า input เพื่อให้ algorithm ทำการ train และ จำแนกนั้นก็เป็นปัจจัยสำคัญที่มีผลต่อความแม่นยำในการทำนายผล

ในวงการตลาดการเงิน หรือ commodity นั้นก็เริ่มมีการใช้โปรแกรมเข้ามาทำการช่วย trade มาเป็นเวลานานแล้ว ซึ่งจะเรียกว่า EA หรือ Expert Advisor ซึ่งมีหลายตัวที่น่าสนใจ และสามารถพัฒนาให้เทรดได้ดีกว่ามนุษย์ซึ่งในประเทศไทย ก็มีคนไทยได้พัฒนาอยู่มากมายในตลาด ด้วยการใช้ computer algorithm มาช่วยโดยผ่านการเขียนเงื่อนไขการทำงานแบบต่าง ๆ เพื่อทำตาม strategy การ trade ที่ตัวเองต้องการ ซึ่งสามารถใช้ภาษา mql4 ซึ่งเป็นภาษา Basic ที่สามารถเรียนรู้ได้ไม่ยาก และสามารถนำมาพัฒนา EA ได้ไม่ยาก

แต่ภาษา mql4 นั้นถูก design มาอย่างมีข้อจำกัดหลาย ๆ อย่าง ทำให้ไม่สามารถพัฒนาโปรแกรมที่ซับซ้อนได้มากเท่ากับ ภาษา mql5 ซึ่งเป็นภาษาที่ใหม่กว่า และมีการ design แบบลักษณะ Object-oriented programming สามารถที่จะเชื่อมต่อกับ interface ต่างๆ  ข้างนอกได้ง่ายกว่าทั้ง device ต่าง ๆ รวมถึง network หรือ ระบบ cloud รวมถึง รองรับ timeframe ที่มากกว่า และสามารถพัฒนาโปรแกรมที่เข้าถึงเชิงลึกของ  market ได้อย่างมีประสิทธิภาพมากกว่าภาษา mql4 โดยเฉพาะการทำงานด้าน AI ที่ใช้ Machine Learning ซึ่ง MT5 จะมี library มากกว่า

MT5 กับ ตลาดหุ้นไทย

โดยส่วนตัวก็คอยดูอยู่ว่า broker เจ้าไหนจะนำ MT5 มาใช้กับหุ้นไทยได้ซักที ซึ่งก็มีประกาศกันมานานแล้วเหมือนกัน โดยบอกว่าจะเริ่มใช้ได้กันตั้งแต่ปีที่แล้ว แต่ก็เลื่อนมาตลอด ซึ่งตอนนี้ก็มี applewealth ที่รองรับการใช้งาน MT5 และได้เปิดให้ trade จริงไปแล้วก่อนหน้านี้ แต่ที่โทรถามล่าสุดคือ ตอนนี้กลับมาปิดระบบอีกครั้ง ยังไม่มีกำหนดเปิดใหม่ แต่ส่วนของ demo นั้นเรายังสามารถนำมาทดสอบได้อยู่ ซึ่งผมก็จะมาแนะนำให้เตรียมตัวให้พร้อมสำหรับการสร้าง AI ด้วย algorithm Support Vector Machine เพื่อรอวันที่ตลาดหุ้นไทยเปิดให้ใช้อย่างเป็นทางการ

 

เข้า web site applewealth ส่วนของเครื่องมือการลงทุน->ทดลองใช้งานเพื่อ download MT5

 

ทำการ click Download : Installer MetaTrader 5 เพื่อทำการ download  MT5  มา install ลงเครื่องคอมพิวเตอร์

 

หลังจากนั้นก็ให้ทำการ install program ลงเครื่อง เมื่อ install เสร็จ ก็จะเข้าสู่ส่วนของการเลือก server ซึ่ง default ก็จะเป็น applewealth อยู่แล้ว ให้กด next และมาสู่ส่วนของการเลือก account ซึ่ง การทดสอบเราสามารถใช้ demo account ด้วยการเลือกที่ new demo account ได้

 

 

จากนั้นก็จะเข้าสู่ในส่วนของ Personal Details ซึ่งเราก็กรอกข้อมูลทั้งหมดเข้าไป account type ก็ทำการเลือก SET  ส่วน Deposit นั้นคือเงินที่จะใช้ในการทดสอบ ซึ่งคล้าย ๆ demo ของ streaming pro ซึ่งหลาย ๆ ท่านน่าจะคุ้นชินกันอยู่แล้ว หลังจากนั้นให้ทำการกด next

 

หลังจากเลือก new demo account เสร็จก็จะเข้าสู่หน้าจอ Main หลักของโปรแกรม ซึ่งจะประกอบด้วยส่วนต่าง ๆ ดังรูปข้างต้น ซึ่งจะประกอบไปด้วย ส่วนของ list รายการหุ้นไทยทั้งหมด ส่วนของ chart windows ซึ่งเราสามารถเลือกหุ้นที่ต้องการ monitor ได้ สามารถปรับ time frame รวมถึงรูปแบบของกราฟได้ และส่วนของ Navigator ซึ่งจะประกอบไปด้วย Indicators ต่าง ๆ รวมถึง Expert Advisors ซึ่งเป็นส่วนของ EA ที่จะใช้ในการ auto trade ซึ่งเราสามารถหา indicators รวมถึง EA ได้จาก Market ซึ่งมีให้เลือกใช้จำนวนมากมาย

 

สำหรับ Support Vector Machine Library นั้นเราจะสามารถซื้อได้จาก Buy from the Market ซึ่งจะเป็น online market ที่มีการจำหน่าย หรือ แจก indicators หรือ EA ต่าง ๆ ที่น่าสนใจอยู่มากมายตาม startegy การ trade ของท่านซึ่งท่านสามารถเลือกได้ตามใจชอบ เราสามารถที่จะนำตัว demo version เพื่อมาทดสอบดูผลการ trade ผ่าน strategy tester ได้ ซึ่งส่วนนี้ผมจะ focus ในการใช้ Machine Learning Library ของ Support Vector Machine เป็นหลัก

 

ให้เราเข้าในส่วนการค้นหาและพิมพ์คำว่า svm เข้าไป ก็จะได้ผลการค้นหาเป็น Library ของ Support Vector Machine ซึ่งขายอยู่ที่ราคา 20 USD ซึ่งหากเราอยากทดลองใช้เราก็สามารถเลือกที่ demo เพื่อนำมาทดสอบก่อนได้ แต่เนื่องจากผมได้ซื้อมาเป็นที่เรียบร้อยแล้ว จึงสามารถนำมาเขียน code และนำไปใช้งานใน graph จริง ๆ ได้

 

จากรูปข้างบน นั้นจะแสดงรายละเอียดของ Library Support Vector Machine ซึ่ง เราสามารถกดที่ปุมสีเหลืองด้านขวาบน เพื่อนำตัว demo มาทำการทดสอบผ่าน Strategy Tester ได้ แต่จะไม่สามารถนำไปใช้ทดลองใน graph จริง  ๆ ได้

 

สำหรับการใช้งาน EA ตัวอย่างสำหรับการใช้งาน Support Vector Machine นั้นผมได้ทำการสร้างตัวอย่างไว้ให้สามารถ download ได้จาก svm_thai_stock  ซึ่งประกอบด้วย 2 file คือ svm_thai_stock.ex5 และ svm_thai_stock.mq5  โดยสามารถ copy ไปยัง folder ของ Data Folder ซึ่งสามารถดูได้จากรูปด้านบน หรือเข้า menu File-> Open Data Folder และทำการ copy ทั้ง 2 file ไปยัง \MQL5\Experts ซึ่งจะเป็น folder ที่ใช้เก็บ EA ทั้งหมดเพื่อนำมาใช้งาน

 

Support Vector Machine คืออะไร

Support Vector Machine เป็นตัวแบบที่ใช้ในการระบุตัวบุคคลหรือ object  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์เป็นตัวแบบที่ใช้ในการระบุตัวบุคคล  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม

ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์ ตัวแบบของ SVM มีความคล้ายคลึงกับเพอร์เซฟตรอนซึ่งเป็นข่ายงานประสาทเทียมแบบง่ายมีหน่วยเดียวที่จำลองลักษณะของเซลล์ประสาท  ด้วยการใช้ Kernal Function

โดยใน paper ที่ตีพิมพ์เกี่ยวกับ SVM นั้นจะเรียกตัวแปรในการตัดสินใจว่า คุณสมบัติและตัวแปรที่เปลี่ยนแปลงใช้ในการกำหนดระนาบหลายมิติ ซึ่งเรียกว่า โครงสร้าง (feature)  ส่วนการเลือกที่มีความเหมาะสมที่สุดเรียกว่า โครงสร้างในการคัดเลือก (feature selection)  จำนวนเซตของโครงสร้างที่ใช้อธิบายในกรณีหนึ่ง (เช่น แถวของการค่าที่เราคาดการณ์)  เรียกว่า  เวกเตอร์ (vector)  ดังนั้นจุดมุ่งหมายของตัวแบบ SVM คือการประโยชน์สูงสุดจากระนาบหลายมิติที่แบ่งแยกกลุ่มของเวกเตอร์ในกรณีนี้ด้วยหนึ่งกลุ่มของตัวแปรเป้าหมายที่อยู่ข้างหนึ่งของระนาบ  และกรณีของกลุ่มอื่นที่อยู่ทางระนาบต่างกัน  ซึ่งเวกเตอร์ที่อยู่ข้างระนาบหลายมิติทั้งหมดนี้เราจะเรียกว่า  ซัพพอร์ตเวกเตอร์ (Support Vectors)

 

เราใช้ Support Vector Machine ในตลาดหุ้นอย่างไร

การวิเคราะห์ทางด้านเทคนิคนั้นอยู่บนพื้นฐานของการใช้ข้อมูลที่ผ่านมาเพื่อคาดการณ์การเคลื่อนไหวของราคาในอนาคต อย่างไรก็ดี ตลาดหุ้นนั้นมีความผันผวนมาก และ การใช้เพียงแค่ indicator อย่างเดียวนั้นอาจจะเกิดข้อผิดพลาดทางด้านสถิติได้ ซึ่งการนำ Machine Learning มาใช้งานร่วมกับ indicators ต่าง ๆ เหล่านี้นั้นทำให้เพิ่มในส่วนของการ training data เพื่อให้ SVM ได้ทำการเรียนรู้ และ ประเมินความแม่นยำของการเข้า trade ซึ่งการประเมินในเรื่องความแม่นยำในการ trade ผ่านการ training ก่อนนั้น ทำให้เราสามารถวิเคราะห์ได้ว่า ควรเข้า trade ใน strategy นั้น ๆ หรือไม่

สำหรับ process การทำงานของ SVM Library มีดังนี้

 

วิธีการ Generated Training Inputs

สำหรับตัว indicators หรือค่า Features ที่เราต้องการนำมาใช้เป็น input นั้น ใช้วิธีการ initial ค่าจาก period ที่คุณต้องการ

 

จากตัวอย่าง code แสดงค่า indicators  iBearsPower , iBullsPower , iATR , iMomentum , iMACD , iStochastic , iForce สำหรับเป็น input ที่ใช้ในการ training โดยจะใช้ function ตามตัวอย่าง code คือ genInputs(handleB)  สำหรับการ generate ค่าตั้งต้นของ indicators ต่าง ๆ ที่เราสนใจ

 

 

สำหรับค่า offset และ ค่า N_Datapoints นั้นจะแสดงตามตัวอย่างรูปข้างบน โดยจะพิจารณาตามแทงเทียนของ timeframe นั้น ๆ เช่น Offset = 4 คือ เราใช้ input ก่อนหน้าแท่งเทียนปัจจุบัน จำนวน 4 แท่งเทียน ส่วน N_Datapoints ตามตัวอย่างในรูป = 6 เราจะนำค่าจากแท่งเทียนอีก 6 แท่งเทียนก่อนหน้าค่า offset ไปทำการ generate input ซึ่งจำนวน N_Datapoints นั้นยิ่งมากก็จะใช้เวลาในการ training เพิ่มมากขึ้นไปด้วย ซึ่งจะมีผลต่อความแม่นยำหรือไม่นั้น ก็อาจจะตอบได้ทั้งสองคำตอบ คือ มี หรือ ไม่มีเลยก็ได้ ซึ่งเราต้องหาค่า N_Datapoints ที่เหมาะสมที่สุดสำหรับการ training เพื่อให้ความแม่นยำเกิดขึ้นสูงสุด

 

สำหรับส่วนของ onbar function นั้น คือ เมื่อเกิดแท่งเทียนใหม่ตาม timeframe ระบบก็จำค่า indicator ณ เวลานั้น ๆ มาทำการ classify หาว่าควรที่จะเข้าทำการซื้อหุ้น ณ ขณะนั้นหรือไม่ หาก Opn_B = true คือ ระบบ predict ให้ซื้อ

 

จาก onbar function หากระบบได้รับสัญญาณการเข้าซื้อก็จะเข้าสู่ function Open_Order เพื่อทำการซื้อผ่าน mt5 โดย Vol ก็คือจำนวนเงินที่จะใช้ในการเข้าซื้อ ซึ่งเราสามารถ set ในส่วนของ input data

 

สำหรับส่วนของ Insert_Stops นั้น เป็นการกำหนดจุด stopLoss และ จุดที่เราจะ takeProfit ซึ่ง จะมีหน่วยเป็น Pips  ซึ่งจะใช้กันในการ trade พวก currency หรือ commodity ซึ่งในหุ้นไทยนั้น ส่วนใหญ่จะหมายถึงการเคลื่อนของราคาที่ 0.01  ซึ่งหากเรา set ค่า takeProfit ไว้ที่ 100 pips คือ 0.01 * 100 = 1  ก็คือระบบจะปิดที่ ราคาปัจจุบัน + 1 บาท ถือเป็นจุด tp ของระบบ เช่นเดียวกับการ stoploss ก็ใช้หลักการเดียวกัน

 

ผลการทดสอบ

ผมได้ทำการทดสอบกับหุ้นไทยจำนวน 4 ตัวประกอบด้วย BDMS , BEAUTY , BH และ BMCL  ด้วย timeframe 15m  โดยใช้ offset ที่ 0 และ  N_DataPoints = 100 จุด takeprofit ที่ 100 pip และ stoploss ที่ 150 pip ด้วย indicators พื้นฐานตามที่ได้กล่าวข้างต้น ได้ผลการทดสอบดังนี้

1.BDMS

จากการ training นั้นได้ผลความแม่นยำที่ 78.0%

2.ฺBEAUTY

จากการ training ได้ผลความแม่นยำที่ 63.0%

3.ฺBMCL

จากการ training ได้ผลความแม่นยำที่ 50% ซึ่งถือว่าเทียบเท่าการโยนเหรียญ หัว-ก้อย

4.ฺBH

ถือว่าน่า surprise สำหรับ BH ที่ได้ค่าความแม่นยำจากการ training สูงถึง 87%

 

สรุป

จาก blog นี้นั้นเป็นการ guide ให้เห็นถึงแนวทางสำหรับการพัฒนา AI ที่ใช้ Machine Learning จริง ๆ เพื่อใช้ทดสอบความแม่นยำในการ prediction market trend ที่จะเกิดในอนาคต ซึ่ง จากตัวอย่างนั้นผมใช้เพียง indicators พื้นฐานเท่านั้นในการทดสอบความแม่นยำของ Support Vector Machine ซึ่งผลในหุ้นบางตัวอย่าง BH นั้นก็ถือว่าน่าสนใจไม่ใช่น้อยสำหรับควาแม่นยำที่สูงถึงระดับ 87% ซึ่ง ผมคิดว่าส่วนนี้เป็นแนวทางที่จะนำไปใช้พัฒนาต่อ สำหรับนักเทรดสายเทคนิคอล ที่มี strategy ที่ตัวเองนั้นถนัดอยู่แล้ว น่าจะลองมาใช้ machine learning เพื่อเพิ่มประสิทธิภาพในการ trade ดู ซึ่งผมคิดว่าน่าจะได้ผลที่ดีขึ้น

ซึ่งในส่วนของ Library ของ Support Vector Machine ใน MT5 นั้น ก็ได้ทำการปรับมาเพื่อใช้กับการ trade โดยเฉพาะ ทำให้สามารถใช้งานได้อย่างไม่ยาก แต่เราอาจจะ customise ได้ดั่งใจเราไม่มากเท่าที่ควร แต่หากต้องการการทำงานในระดับ Advance นั้นผมก็แนะนำให้ใช้เทคนิค การ call LIBSVM โดยอาจจะเรียกผ่าน Web Service หรือ http protocol  ซึ่งเราอาจจะสามารถ customise ได้มากกว่า และอาจจะให้ผลความแม่นยำที่สูงกว่า เหมือนงานวิจัยหลาย ๆ ชิ้นที่ผ่านมา

ส่วนค่า features หรือ input นั้น เราอาจจะไม่ได้ใช่แค่ indicators มาตรฐานมาใช้ในการ train เท่านั้น เราอาจจะสามารถกำหนด features ที่ต้องการเอง ตาม Strategy การเทรดของเรา ซึ่งคิดว่าหลาย ๆ ท่านนั้นก็น่าจะมี strategy การเทรดที่แตกต่างกัน หรือมีการพลิกแพลงค่าต่าง ๆ เช่นเส้น trend line หรือ เส้นแนวรับ แนวต้าน ก็เป็นสิ่งที่สามารถนำมาเป็น input ได้ ส่วนเรื่องข่าวก็เป็นสิ่งที่น่าสนใจที่จะสามารถนำมาใช้เป็น features ได้ ดังตัวอย่าง การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว ซึ่งผมคิดว่า AI ที่ใช้ Machine Learning นั้นจะมีบทบาทต่อวงการเทรดหุ้นของประเทศไทยอย่างแน่นอน อย่างที่หลาย ๆ บริษัทได้เริ่มพัฒนา AI ที่ใช้ในการ trade แล้ว ซึ่งต่อไปนั้น เราอาจจะไม่ได้แข่งกับแค่ ต่างชาติ หรือ นักลงทุนสถาบันเท่านั้น เหล่าเม่าตัวน้อย ๆ อย่างพวกเรา  อาจจะต้องสู้รบปรบมือกับกองทัพ AI ในเร็ววันนี้ก็เป็นไปได้

 

References : www.mql5.com,www.dailynews.co.th

 

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage : facebook.com/tharadhol.blog
Blockdit : blockdit.com/tharadhol.blog
Twitter : twitter.com/tharadhol
Instragram : instragram.com/tharadhol

Robots replacing Humans.The Evolution of Robots

ปัจจุบันหุ่นยนต์หรือ AI เริ่มเข้ามามีบทบาทสำคัญต่อการดำรงชีวิตของมนุษย์เราเป็นอย่างมาก โดยเป็นการเข้ามาแทกซึมวิถีชิวิตประจำวันของเราอย่างไม่รู้ตัว ทั้งการช่วยเหลืองานที่บ้าน รวมถึงการช่วยเหลือในการใช้ชีวิตประจำวันหลาย ๆ อย่างของเราก็มีการเปลี่ยนไป ซึ่งข้อได้เปรียบสำคัญของหุ่นยนต์หรือ AI คือทำงานโดยอัติโนมัติ และไม่มีการเหน็ดเหนื่อย และไม่มีภาวะทางด้านอารมณ์เข้ามาเกี่ยวข้อง ทำให้ช่วยมนุษย์เราให้ใช้ชีวิตได้อย่างง่ายขึ้น

หลาย ๆ ธุรกิจ หลาย ๆ องค์กร เริ่มมีการใช้ AI ในการสร้างความแตกต่างทางด้านธุรกิจ อย่างการเปิดตัว SIRI ของ apple  นั้นก็ถือเป็นจุดเริ่มต้นของการนำ AI เข้ามาช่วยเหลือ รวมถึงเพิ่มบทบาทต่อการดำรงชีวิตของมนุษย์ในปัจจุบัน เพราะมีการผูกกับมือถือ ซึ่งเราใช้ติดตัวอยู่เป็นประจำวันอยู่แล้ว ซึ่งต่างจากเมื่อก่อน ที่เราจะเห็นหุ่นยนต์ ในงาน scale ใหญ่ ๆ เช่น อุตสาหกรรม รถยนต์ การต่อเรือ หรือ หลาย ๆ อุตสาหกรรม ที่ใช้ robots ในการผลิต เพื่อเพิ่มกำลังการผลิตให้เพียงพอต่อความต้องการของมนุษย์

และเนื่องจากในยุคของ Information Revolution เป็นปัจจัยเร่งให้ AI เริ่มฉลาดขึ้น เพราะส่วนหนึ่งของ AI นั้นผ่านการ training จากข้อมูลมหาศาลในปัจจุบัน ที่เราใช้กันอยู่ องค์กรใหญ่ ๆ อย่าง facebook , google หรือ apple นั้นล้วนแล้วแต่ใช้ข้อมูลต่าง ๆ เหล่านี้เพื่อช่วยพัฒนา AI ให้มีความฉลาดได้อย่างรวดเร็วยิ่งขึ้นโดยการอาศัยการเก็บข้อมูลจากผู้ใช้ทั่วโลก

เราเคยสงสัยกันหรือไม่ว่าทำไม facebook หรือ google นั้นรู้ใจเรา หรือ เดาใจได้ ว่าเรากำลังต้องการอะไร หรือ ต้องการจะซื้ออะไร ซึ่งนี่ก็เป็นส่วนหนึ่งของความฉลาดจาก AI ที่อาศัยข้อมูลของเราไปวิเคราะห์ และทำนายความต้องการของเรา เราอาจจะมองได้สองมุม คือ อย่างแรกอาจจะเป็นตัวช่วยเราในการตัดสินใจต่าง ๆ ได้ง่ายขึ้น แต่ะ หากมองในแง่ร้าย นั้นก็คือภัยคุกคามความเป็นส่วนตัวของเราเหมือนกัน เพราะ ข้อมูลของเราทุกอย่างนั้นถุกนำไปวิเคราะห์ผ่าน AI  ซึ่งบางข้อมูลนั้นเป็นข้อมูลที่เป็นข้อมูลที่ sensitve มาก ๆ อย่างข้อมูลการ chat ซึ่งเรานั้นแทบจะไม่มีความลับใด ๆ ในการ chat กับคนที่เราไว้ใจ

แต่เราจะไว้ใจ platform ที่เราใช้ได้หรือไม่  ไม่ต้องแปลกใจว่าทำไม facebook ถึงได้ทุ่มเงินมหาศาลเพื่อซื้อ whatsapp ทั้งที่เป็นบริษัทที่ยังไม่สามารถทำกำไรได้ด้วยซ้ำ  ซึ่งเราอาจจะเล่น social เพื่อแสดงตัวตนอีกอย่างหนึ่งเพื่อให้เพื่อนๆ ได้รับรู้ อาจะโชว์แต่ข้อมูลที่ดี ๆ เรื่องร้าย ๆ เราก็คงไม่เอามาลง social กันหรอก แต่ต่างจากข้อมูล chat ที่เป็นข้อมูลทุกอย่างของเราเลยก็ว่าได้ แล้วเราจะไว้ใจ platform ต่าง ๆ เหล่านี้ได้อย่างไรว่าไม่นำข้อมูลเหล่านี้ไปหาประโยชน์ เนื่องจากเค้าก็ต้องใช้เงินมากมาย เพื่อให้ได้ข้อมูลเหล่านี้ไป

แล้วในยุคต่อไปในอนาคตอันใกล้นี้ อะไรจะเกิดขึ้นกับเรา ยิ่งข้อมูลมากมายมหาศาลถูกนำไปประมวลผลอย่างต่อเนื่องส่งผลให้ AI ฉลาดจนสามารถเก่งกว่ามนุษย์ได้ ซึ่งจะกระทบกับตำแหน่งการงานของหลายอาชีพอย่างแน่นอนในเร็ววันนี้ โดยเฉพาะอาชีพที่อาศัยการเรียนรู้และจดจำ เพื่อมาวิเคราะห์ ซึ่งเป็นรูปแบบเดียวกับ AI  ที่ส่วนนึงนั้นใช้ Machine Learning ในการเรียนรู้และจดจำ เพื่อให้สามารถคิดได้เหมือนกับมนุษย์ หรือใกล้เคียงกับมนุษย์เรามากที่สุด เราคงไม่ได้เห็น robots แบบในหนังที่เป็นหุ่นยนต์จริง ๆ มาทดแทนมนุษย์ แต่ จะเป็น AI ที่ใช้มันสมองมาทดแทนการทำงานของมนุษย์แทน

ปัจจุบันเราเริ่มเห็นการพัฒนาการที่น่าสนใจในหลาย ๆ Labs ที่วิจัยเกี่ยวกับหุ่นยนต์หรือ AI

โครงการ Robonaut เป็นงานวิจัยเทคโนโลยีหุ่นยนต์บนสถานีอวกาศนานาชาติ (ISS) ตั้งแต่ปีพ. ศ. 2555   โดยขณะที่ Robonaut 2 (R2) กำลังดำเนินการผ่านการทดสอบบนวงโคจร  ทีมงาน Robonaut ได้พัฒนาเทคโนโลยีที่จะช่วยให้การทดสอบหุ่นยนต์บนวงโคจรสามารถทำงานได้เต็มรูปแบบ

โดยใช้หุ่นยนต์ตัวเดียวกันกับที่ Johnson Space Center โดยเป้าหมายของงานนี้คือการสร้างแพลตฟอร์มการวิจัยหุ่นยนต์ที่มีคุณลักษณะครบถ้วนบนสถานี ISS เพื่อเพิ่มระดับความพร้อมด้านเทคโนโลยีของเทคโนโลยีที่จะช่วยในภารกิจสำรวจในอนาคตอันใกล้นี้

ข้อดีอย่างหนึ่งของการออกแบบรูปทรงให้เหมือนมนุษย์คือ Robonaut สามารถใช้งานง่าย ๆ ซ้ำ ๆ หรือ เข้าสู่สถานที่ที่เป็นอันตราย โดยเฉพาะอย่างยิ่งในสถานที่ต่างๆเช่นสถานีอวกาศนานาชาติ เนื่องจาก R2 กำลังเข้าใกล้ความชำนาญของมนุษย์ในงานต่างๆที่อยู่ในอวกาศ เช่นการเปลี่ยนตัวกรองอากาศซึ่งสามารถทำได้โดยไม่ต้องปรับเปลี่ยนการออกแบบที่มีอยู่เดิมเลยด้วยซ้ำ

ประโยชน์อีกอย่างหนึ่งก็คือในระหว่างภารกิจของหุ่นยนต์ R2 สามารถจะนำชุดเครื่องมือสำหรับภารกิจ precursor เช่นการตั้งค่าและการตรวจสอบทางธรณีวิทยา ไม่เพียง แต่จะช่วยเพิ่มประสิทธิภาพของเครื่องมือประเภทนี้เท่านั้น แต่ยังช่วยตัดความจำเป็นในการเชื่อมต่อกับหุ่นยนต์แบบพิเศษได้อีกด้วย

สำหรับบทบาทในวงการแพทย์นั้นต้องยอมรับว่าหุ่นยนต์เริ่มเข้ามามีบทบาทอย่างมากแล้วในปัจจุบัน โดยเฉพาะหุ่นยนต์ผ่าตัดซึ่งเป็นงานที่ใช้ความแม่นยำสูงมาก ๆ ศัลยแพทย์ที่เก่งๆ  นั้นต้องใช้ประสบการณ์ยาวนานในการผ่าตัด ซึ่งปัญหาที่พบคือพอประสบการณ์ยิ่งมาก ก็จะยิ่งเริ่มแก่ตัวลง และความนิ่งต่าง ๆ ก็จะลดลง ทำให้ผ่าตัดในงานที่ละเอียดมาก ๆ ไม่ค่อยได้ และประสิทธิภาพในการผ่าตัดก็ลดลงไป โดยเฉพาะงานที่ใช้ความละเอียดสูงอย่างการผ่าตัดหัวใจ หรือ ผ่าตัดสมอง เพราะมีโอกาสผิดพลาดได้น้อยมาก ๆ 

ซึ่งการเข้ามาของหุ่นยนต์ผ่าตัดนั้น ค่อนข้างทำได้มีประสิทธิภาพมากกว่า เพราะทุกอย่างผ่านการคำนวณมาอย่างดี สามารถเข้าไปในชิ้นส่วนของร่างกายที่เป็นข้อจำกัดของมนุษย์ได้มากกว่า เพราะอาศัยการคำนวณ เช่น ในช่องที่เล็ก ๆ ที่คนไม่สามารถเข้าถึงได้นั้น แต่ไม่ได้เป็นปัญหากับหุ่นยนต์แต่อย่างใด รวมถึงการพัฒนาของกล้องความละเอียดสูงในปัจจุบัน สามารถทำให้หุ่นยนต์ที่ใช้ผ่าตัดสามารถวิเคราะห์ได้ละเอียดเพิ่มยิ่งขึ้น ซึ่งก็ทำให้ลดสาเหตุการเสียชีวิตจากการผ่าตัดได้มากยิ่งขึ้น

ในวงการ logistics ก็เช่นเดียวกัน ปัญหาใหญ่ของวงการ logistics คือเรื่องต้นทุนแฝง ที่มีอยู่จำนวนมาก ส่วนใหญ่แล้วมาจากโครงสร้างพื้นฐานของรัฐ แต่ละที่ ซึ่งมีผลโดยตรงต่อต้นทุนทางด้าน logistics ซึ่งบริษัทยักษ์ใหญ่อย่าง Amazon ก็ได้เริ่มนำ drone เข้ามาช่วยขนส่งสินค้าผ่าน service Amazon PrimeAir ซึ่งสามารถที่จะการันตีเวลาในการขนส่งได้ในเวลาเพียง 30 นาที โดยการใช้ drone ขนส่งผ่านทางอากาศแทน ซึ่งหากนำมาใช้กันอย่างกว้างขวางจริง ๆ นั้นก็ต้องเรียกว่าเป็นการปฏิวัติระบบขนส่งในยุคใหม่เลยก็ว่าได้

สำหรับในวงการทหารนั้น ต้องบอกว่าเทคโนโลยีของ robots นั้นได้รุดหน้าไปเป็นอย่างมากในขณะนี้ ซึ่งนำโดย อเมริกา ที่หลาย ๆ labs ต่างนำเสนอ solution สำหรับการทหาร ตัวอย่างดังรูปข้างบนคือ  Foster-Miller SWORDS  ที่เริ่มใช้จริงในสงครามอิรักตั้งแต่ปี 2550  ซึ่งใช้ในการช่วยเหลือทหารในแนวหน้า โดยสามารถบรรจุอาวุธ เพื่อทำลายศัตรูได้ และสามารถจัดการได้แบบอัตโนมัติ ซึ่งในไม่ช้านี้เราจะอาจจะได้เห็นสงครามที่เป็นรูปแบบของ robots จริง ๆ เหมือนในหนังก็อาจจะเป็นไปได้

หรือว่าจะเป็น robots รุ่นคุณปู่อย่าง ASIMO จาก Honda ที่ในขณะนี้ได้พัฒนาความสามารถเพิ่มขึ้นหลายอย่างมาก สามารถรับรู้ การเคลื่อนที่ ท่าทาง รวมถึงสภาพแวดล้อมรอบข้าง และสามารถทำให้โต้ตอบกับมนุษย์จริงๆ  ได้แล้ว ซึ่งอาจจะเป็นต้นแบบของหุ่นยนต์ผู้ช่วยที่จะมีบทบาทสำคัญต่อสังคมสูงอายุของญี่ปุ่นในอนาคตอันใกล้นี้

สำหรับในโรงงานอุตสาหกรรมนั้น เราคงจะได้เห็นหุ่นยนต์เข้ามามีบทบาทนานแล้วในวงจรการผลิตสินค้าต่าง ๆ ที่สามารถทำได้ดีกว่ามนุษย์ และสามารถทำงานได้ 24 ชั่วโมงไม่มีหยุดพัก  แต่สำหรับ Baxter นั้นสามารถรองรับกับงานได้หลากหลายมากกว่า รวมถึงปริมาณที่ผลิตใน scale ที่ต่ำก็สามารถทำได้ ซึ่งมีความสามารถหลากหลายตั้งแต่ โหลดสาย การพ่นเครื่องบรรจุภัณฑ์ต่างๆ  รวมถึงการจัดการวัสดุ ซึ่งสามารถทำงานแทนมนุษย์ได้อย่างมีประสิทธิภาพกว่า

ต้องบอกว่าน่าทึ่งมาก ๆ สำหรับ video ใหม่ล่าสุดจาก Boston Dynamics ที่ได้ปล่อยหุ่นยนต์ตัวใหม่ออกมา ต้องถือว่าเป็นก้าวกระโดดครั้งสำคัญของวงการหุ่นยนต์เลยก็ว่าได้ เราอาจจะเคยเห็นแค่ในนวนิยาย sci-fi ตอนนี้มันเริ่มคล้ายมนุษย์จริง ๆ เข้าไปทุกที การกระโดดท่า backflips นั้นต้องถือว่าน่าสนใจเลยทีเดียวกับการพัฒนาเทคโนโลยีของหุ่นยนต์ในขณะนี้ มันอยู่ในจุดที่เราทุกคนต้องเริมกังวลแล้วแหละ ว่าอนาคตของหุ่นยนต์จะไปในทางไหน

จาก video เราได้เห็นถึงพัฒนาการของหุ่นยนต์สี่ขา ซึ่งเป็นหุ่นยนต์ที่มีความซับซ้อนสูงมาก และพัฒนาขึ้นมายากมาก แต่สำหรับ DARPA Legged Squad Support System (LS3) รุ่นล่าสุดนั้น แสดงให้เห็นว่าหุ่นยนต์ที่มีขาเทียมแบบกึ่งอิสระนั้นสามารถเคลื่อนที่ได้สูง และในเส้นทางที่ซับซ้อนได้มากขึ้น และสามารถรองรับน้ำหนักในการขนย้ายกว่า 400 ปอนด์ ซึ่งสามารถเข้าไปปฏิบัติงานในประเทศ ที่มีสมรภูมิ ที่ยากต่อการเข้าถึงได้ ซึ่งช่วยลดการสูญเสียของทหารได้ในการรบในบริเวณที่เสียเปรียบ

แม้กระทั่งกีฬาที่ใช้ความว่องไวสูงอย่าง ปิงปอง นั้น เราจะเห็นได้ว่า เทคโนโลยีทางด้านแขนหุ่นในปัจจุบันได้พัฒนาไปมากขนาดไหน จาก video KUKA Robot นั้นคงแค่สื่อให้เห็นถึงความเร็วในการทำงานของแขนหุ่นมากกว่า ที่จะนำมาใช้ในการแข่ง ปิงปอง จริง ๆ ที่คิดว่าคงไม่มีใครกล้าจะลงทุนซื้ออย่างแน่นอน แต่ถ้ามองถึงการผลิตในอุตสาหกรรมขนาดใหญ่นั้นความเร็วที่เป็นต่อในการผลิต ก็สามารถทำให้ได้เปรียบคู่แข่งได้ และอาจจะเป็นปัจจัยสำคัญในการสร้างศักยภาพในการแข่งขันในตลาดได้

ในปีที่แล้วข่าวใหญ่ของวงการเกมส์โกะ โลกคือ ภาพของการพ่ายแพ้อย่างหมดรูปของ lee sedol มือโกะ อันดับต้น ๆ ของโลกในการประลองกับ AI อย่าง Alphago ซึ่ง ถือว่าเป็นการก้าวกระโดดครั้งสำคัญของ AI ที่มาเล่นในเกมส์ที่ซับซ้อนมาก ๆ อย่างเกมส์โกะ  ซึ่งต้องใช้การประมวลผลทางความคิดอย่างซับซ้อนเป็นอย่างมากเมื่อเทียบกับ AI ในเกมส์กระดานเดิมๆ  อย่าง หมากรุก หรือ หมากฮอส ซึ่ง Alphago นั้นได้พัฒนาขีดความสามารถในการเรียนรู้ และการตัดสินใจ ที่ก้าวขีดจำกัดของมนุษย์ไปเป็นที่เรียบร้อยแล้ว

สุดท้ายนี้เราได้มีโอกาสเห็นบริษัทยักษ์ใหญ่อย่าง google พัฒนารถไร้คนขับมานานมากแล้ว ซึ่งตอนนี้คิดว่าเทคโนโลยีที่มีอยู่พร้อมสำหรับการที่จะนำไปใช้จริง อย่างที่บริษัทอย่าง Tesla ได้ทำมาแล้ว และประสบความสำเร็จอย่างสูง ในอดีตเราก็คงไม่เคยคิดว่า รถจะสามารถขับเองได้แบบอัตโนมัติ เหมือนในหนัง ซึ่งปัจจุบันถือว่าไม่ใช่เป็นเรื่องที่แปลกแต่อย่างใดสำหรับการมีรถที่ขับเคลื่อนได้แบบอัตโนมัติ เพราะข้อมูลจำนวนมหาศาล ตัวอย่างของ google คือ ข้อมูลจาก google map ที่มีจำนวนมหาศาลมีผู้ใช้งานอยู่ทั่วโลกนั้น ซึ่งก็ถูก google นำมาใช้ในการวิเคราะห์ เพื่อให้ AI ได้ทำการเรียนรู้ และนำมาพัฒนาเป็นรถยนต์ไร้คนขับอย่างที่เห็นในปัจจุบัน ซึ่งในอนาคตอันใกล้นี้เราอาจจะได้เห็นรถขับเคลื่อนเองอัติโนมัติในหลาย ๆ งาน เช่น บริการด้านแท็กซี่ อาจจะไม่จำเป็นต้องพึ่งพามนุษย์ในการขับรถให้ AI คงไม่มีการส่งรถหรือปฏิเสธผู้โดยสาร ให้ปวดใจอีกต่อไป หรือ งานด้านการขนส่งอื่น ๆ ที่ไม่ต้องพึ่งพาคนขับรถอีกต่อไป ทั้งขนสินค้า หรือ ขนคน ก็ใช้ระบบอัติโนมัติทั้งหมด  รวมถึงสุดท้ายแล้วมนุษย์เราทุกคนอาจจะไม่ต้องขับรถเองกันแล้วก็ได้ และอาจจะมีความปลอดภัยกว่าการขับเอง เพราะมั่นใจได้อย่างนึงว่า AI ไม่มีการเมาแล้วขับอย่างแน่นอน

References : 

  1.      https://robonaut.jsc.nasa.gov/R2/
  2.      http://www.popularmechanics.com/technology/gadgets/a2804/4258963
  3.      https://qz.com/639952/googles-ai-won-the-game-go-by-defying-millennia-of-basic-human-instinct/

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

Failed Startup ตอนที่ 1 : Napster the digital music revolution

ต้องบอกว่าเป็น startup รุ่นปู่เลยทีเกียวสำหรับ Napster ซึ่งหลาย ๆ คนอาจจะคิดว่า ipod เป็นจุดเริ่มต้นของ digital music แต่ถ้าถามถึงต้นตอจริง ๆ ของการปฏวัติอุตสาหกรรมดนตรี จาก analog ไปสู่ digital นั้น ต้องบอกว่า Napster ถือว่าเป็นจุดเริ่มต้นหนึ่งที่สำคัญต่อการปฏิวัติวงการดนตรีเลยก็ว่าได้

ประวัติ Napster

Napster นั้นถูกสร้างโดย Shawn Fanning , John Fanning  และ Sean Parker  ผู้โด่งดัง โดยใช้รูปแบบการ share แบบ peer-to-peer file sharing ซึ่งในสมัยนั้นถือว่าเป็นเรื่องที่ใหม่มากและคนค่อนข้างตื่นตะลึงกับการเกิดขึ้นของระบบ peer-to-peer อย่างสูง  โดย Napster นั้นเปิดให้บริการในช่วงปี 1999 ถึง ปี 2001  โดยรูปแบบการบริการคือให้ผู้ใช้งานทั่วไปสามารถ share เพลงในรูปแบบ mp3 ของตัวเองกับคนอื่นได้ผ่าน internet ซึ่งถ้ามองในยุคนี้ต้องบอกว่าเป็นเรื่องปรกติไปเสียแล้ว แต่ในยุคปี 1999 นั้นถือว่าเป็นเรื่องที่ใหม่มาก

ย้อนกลับไปในยุคนั้น IRC ถือว่าดังมาก ๆ

ย้อนกลับไปในยุคนั้น IRC ถือว่าดังมาก ๆ

ถึงแม้ว่าในยุคนั้นจะเริ่มรูปแบบการ share file ผ่าน internet เช่น IRC , Hotline หรือ Usenet แล้วนั้น แต่ความพิเศษของ Napster คือ พวกเค้า focus ที่ไฟล์ mp3 และทำให้ user interface ใช้งานง่ายมาก ๆ คนทั่วไปสามารถค้นหา หรือ download file มาใช้งานได้อย่างง่ายดาย ทำให้ Napster ดังเป็นพลุแตกในยุคนั้น  โดยในช่วงที่ขึ้นสู่จุดสูงสุดนั้น มีผู้ใช้งานที่เป็น registered user ถึง 80 ล้านคน ซึ่งถือว่าสูงมากในยุคนั้น

ความดังของ Napster ถึงกับทำให้เหล่าบรรดา network ในมหาลัยต่าง ๆ ของสหรัฐอเมริกา นั้นกว่า 60% ของ traffic มาจากการ share file mp3 ทำให้หลาย ๆ มหาลัยทำการ block service ของ Napster เพราะกังวลเกี่ยวกับปัญหาการละเมิดลิขสิทธิ์ที่จะเกิดขึ้น  ซึ่งทำให้กล่าวได้ว่าศิลปินในขณะนั้นได้เริ่มเลิกการออกอัลบั้มเต็ม เปลี่ยนมาเป็นออก single แทนเลยทีเดียว

Macintosh Version

เริ่มต้นนั้น Napster สร้างโดยใช้งานได้เพียงระบบปฏิบัติการ windows เป็นหลัก อย่างไรก็ดีในปี 2000 ได้มีการสร้างบริการเลียนแบบ ชื่อ Macster บนระบบปฏิบัติการ Macintosh ด้วยความดังทำให้ Napster ตัดสินใจเข้า takeover  Macster และรวมเป็นบริการ “Napster for Mac”  และในภายหลังได้มีการปล่อย source ของ Macster เพื่อให้บริการที่เป็น 3rd-party นั้นสามารถเรียกใช้ได้จากทุกระบบปฏิบัติการ โดยใช้รูปแบบของการโฆษณาเพื่อหารายได้แทน

ความท้าทายทางด้านกฏหมาย

อย่างที่รู้กันว่าบริการลักษณะนี้เริ่มเกิดขึ้นมากมายในช่วงนั้น ซึ่งล้วนแล้วแต่เป็นการ share file ที่ผิดกฏหมายทั้งสิ้น  ซึ่งในตอนนั้นวง Metallica ได้ออก demo single ในเพลง “I Disappear”  แต่ก็ถูกทำการนำไปปล่อย share อย่างผิดกฏหมาย ก่อนที่จะทำการออก Release อย่างเป็นทางการ

ทำให้หลาย ๆ คลื่นวิทยุ สามารถนำเพลงมาออกอากาศก่อนที่วงจะปล่อยออกมาอย่างเป็นทางการ ทำให้ในปี 2000 ทางวงเริ่มมีการตั้งทนายเพื่อทำการฟ้องร้อง Napster และหลังจากนั้นไม่นาน rapper ชื่อดังอย่าง Dr.Dre ก็เข้าร่วมในการฟ้องร้องครั้งนี้ด้วย หลังจาก Napster ปฏิเสธที่จะนำงานเพลงของพวกเขาออกจากบริการ Napster

วงชื่อดังอย่าง Metallica ใช้การฟ้องศาลเพื่อหยุดการเผยแพร่

วงชื่อดังอย่าง Metallica ใช้การฟ้องศาลเพื่อหยุดการเผยแพร่

ซึ่งหลายๆ  ศิลปินก็โดนผลกระทบในรูปแบบเดียวกัน single “Music” ของ Madonna ก็ถูกปล่อยออกมาผ่านทาง Napster ก่อนวันที่จะ Release อย่างเป็นทางการ ซึ่งส่งผลเสียหายต่อรายได้ ของศิลปินในขณะนั้นอยู่มาก  การต่อสู้บนชั้นศาลก็เริ่มขึ้น โดยในปี 2000 ค่ายเพลงต่าง  ๆ ได้รวมตัวกันเพื่อทำการฟ้องร้อง Napster ในข้อหาการละเมิดลิขสิทธิ์ ซึ่ง Napster ก็ได้ต่อสู้ แม้จะแพ้ในศาลชั้นตั้น ก็ทำการอุทรณ์เพื่อสู้ต่อไปให้ถึงที่สุด

พลังแห่งการโปรโมต

รูปแบบ peer to peer ทำให้ traffic โตขึ้นอย่างรวดเร็ว

รูปแบบ peer to peer ทำให้ traffic โตขึ้นอย่างรวดเร็ว

ถึงแม้ว่าพลังของ Napster ที่ให้บริการ free นั้นจะได้ทำลายอุตสาหกรรมดนตรี รวมถึงทำให้ยอดขาย album นั้นตกลงไปเป็นอย่างมาก แต่ก็เกิดปรากฏการณ์บางอย่างในทางตรงกันข้ามขึ้นกับวง Rock Radiohead’s จากอังกฤษ  ในปี 2000 พวกเขาได้ออกอัลบั้ม Kid A ซึ่งก็เหมือนเคย อัลบั้มถูกปล่อยออกไปทาง Napster ก่อนที่จะ Release อย่างเป็นทางการถึง 3 เดือน  แต่ผลของ Radiohead’s นั้นแตกต่างจาก Madonna  , Dr. Dre หรือ Metallica วง Radiohead นั้นไม่เคยแม้จะติด top 20 ของ chart ในสหรัฐอเมริกา พวกเค้าถูกเผยแพร่ผ่าน Napster รวมถึงคลื่นวิทยุเล็ก ๆ อย่าง radio airplay

Radiohead ใช้ Napster เป็นสื่อโปรโมตให้เค้าดังอย่างรวดเร็วได้เช่นกัน

Radiohead ใช้ Napster เป็นสื่อโปรโมตให้เค้าดังอย่างรวดเร็วได้เช่นกัน

ในช่วงที่ออก Release อัลบั้มอย่างเป็นทางการนั้น เพลงของพวกเค้า ได้ถูก download ผ่านบริการ share ไฟล์ ไปกว่า 1 ล้านครั้ง ทั่วโลก  ทำให้ในเดือนตุลาคม ปี 2000 นั้น อัลบั้ม Kid A ของพวกเค้าเข้าไปติดใน Billboard200 sales chart ได้เป็นครั้งแรก ซึ่งมาจาก effect ของการโปรโมตผ่านบริการอย่าง Napster ทำให้สามารถเพิ่มยอดขายจากวงที่ตอนนั้นไม่ดังมาก และไม่ถูกคาดหวัง แต่สามารถประสบความสำเร็จได้ ผ่านการ promote จากบริการของ Napster นั่นเอง

ซึ่งตั้งแต่ปี 2000 ศิลปินหลาย ๆ คนก็เริ่มที่จะไม่เซ็นสัญญากับค่ายเพลงใหญ่ ๆ และไม่จำเป็นต้องทำการ promote ผ่าน mass media อย่างรายการทีวีหรือวิทยุชื่อดัง แต่หันมาใช้ Napster ในการ promote แทน ด้วยกระแสปากต่อปาก ทำให้สุดท้ายแล้วนั้นสามารถเพิ่มยอดขายอัลบั้มในระยะยาวได้ ซึ่งหนึ่งในศิลปินที่ช่วยปกป้อง Napster ในยุคนั้นคือ Dj xealot รวมถึง Chuck D และ Public Enemy ก็ได้ประกาศอย่างเป็นทางการว่าพวกเค้า support Napster

สุดท้ายก็ต้องปิดบริการ

แต่ด้วยปัญหากับค่ายเพลงยักษ์ใหญ่ ในเดือนกรกฎาคม ปี 2001 ต้องให้หยุดให้บริการของพวกเค้าชั่วคราว และต้องจ่ายค่าปรับจากการฟ้องร้องของค่ายเพลงกว่า 26 ล้านเหรียญรวมถึงต้องจ่ายค่า licensing ที่จะเกิดขึ้นในอนาคตอีกกว่า 10 ล้านเหรียญหากดื้อด้านที่จะเปิดให้บริการต่อไป ทางทีมงานจึงพยายามปรับตัวเองจากบริการใช้ฟรี เป็นแบบ subscription model เพื่อหารายได้ เพื่อมาจ่ายค่า license เหล่านี้

อย่างไรก็ดีหลังจากนั้น traffic ของ Napster ก็ตกลงอย่างมหาศาล ซึ่ง Prototype ของบริการแบบใหม่ subscription model นั้นได้ถูกนำมาทดสอบเริ่มใช้ในปี 2002 ในชื่อ “Napster 3.0 Alpha” ซึ่งจะเปลี่ยน file ไปเป็น .nap  ซึ่งเป็นการเข้ารหัสเพื่อป้องกันการละเมิดลิขสิทธิ์ แต่เมื่อจะเปิดใช้บริการจริง ก็ต้องพบกับปัญหาในเรื่องค่า license สำหรับศิลปินชื่อดังต่าง ๆ ทำให้ในเดือน พฤษภาคมปี 2002 นั้น Napster ได้ประกาศขายกิจการให้กับ Bertelsmann บริษัททางด้าน media จากประเทศเยอรมัน ในมูลค่ากว่า 85 ล้านเหรียญสหรัฐ ซึ่งมีเป้าหมายในการปรับรูปแบบของ Napster ให้เป้น online music subscription service

แต่อย่างไรก็ดี สุดท้ายการซื้อขายก็ไม่ได้เกิดขึ้น เมื่อ Napster ถูกศาลล้มละลายกลางสหรัฐ blocked ไม่ให้ขายให้กับ Bertelsmann และทำการบังคับเพื่อยึดทรัพย์สินทั้งหมดของ Napster และเข้าสู่กระบวนการล้มละลายเป็นอันสิ้นสุดยุคของ Napster อย่างเป็นทางการ

สรุป

สำหรับ Napster นั้นได้ทำการแจ้งเกิดได้ถูกที่ ถูกเวลา ในช่วงที่ internet กำลังพัฒนาเรื่อง speed จนสามารถเกิดบริการในรูปแบบ file sharing ขึ้นมาได้ idea ของ Napster นั้นต้องบอกว่าเจ๋งมากในขณะนั้น ผู้ใช้งานต่างยกย่องบริการอย่าง Napster เพื่อมาช่วยเหลือในเรื่องการฟังดนตรี ที่สามารถเข้าถึง single หรือ album ดัง ๆ ได้อย่างง่ายดายขึ้น ผู้คนไม่ต้องไปซื้อ CD ตามร้านอีกต่อไป แต่ ปัญหาหลักใหญ่ของ ระบบแบบนี้คือ ปัญหาการละเมิดลิขสิทธิ์

ซึ่งกลุ่มที่เสียหายคือ ค่ายเพลงรายใหญ่จำนวนมาก ซึ่งถือว่าเป็นคู่ต่อสู้ที่ไม่น่าไปสู้ด้วยแต่อย่างใด ถึงแม้ว่าบริการนี้จะถูกใจผู้ใช้งานเพียงใด แต่สุดท้ายแล้วมันก็เป็นสิ่งกฏหมาย ซึ่ง การที่เราสร้าง startup ที่เสี่ยงที่จะถูกฟ้องร้องในภายหลังนั้น ก็ไม่น่าจะควรทำมาตั้งแต่แรก ดังตัวอย่างของ Napster ที่ถึงกับล้มละลาย เพราะไม่มีเงินไปเสียค่าปรับต่างๆ  จากการฟ้องร้อง แม้จะพยายามที่จะปรับตัว แต่ user นั้นชินกับการบริการแบบฟรีไปแล้ว หากมาเปลี่ยนรูปแบบ ก็ทำให้ user หนีไปยังบริการชนิดอื่นได้อย่างง่ายดายเช่นกัน ซึ่งสุดท้ายธุรกิจก็ไปไม่รอดอยู่ดี

 

 

Blog Series : Failed Startup Stories

 

Reference : en.wikipedia.org,godisageek.com

Tencent กับมูลค่าที่ก้าวข้ามผ่าน facebook

ต้องยอมรับกันก่อนว่า บริษัททางด้านเทคโนโลยีจาก silicon valley ที่คิดจะเข้าไปเจาะตลาดจีนนั้นเป็นเรื่องไม่ง่าย เนื่องมาจากปัจจัยหลายประการ ทั้งทางด้านวัฒนธรรม รวมถึง รูปแบบการปกครอง และ นโยบายของรัฐจีนนั้น ค่อนข้างกีดกัน บริษัทจากทางฝั่งตะวันตก

มีบริษัทน้อยรายที่ประสบความสำเร็จในตลาดจีนได้เช่น apple แต่มีบริษัทมากมายที่ต้องมาตกม้าตายที่ตลาดจีน ทั้ง google ,ebay , amazon หรือรายล่าสุดอย่าง Uber ที่ต้องถอยทัพหนีจากตลาดจีนไปเมื่อไม่นานมานี้

ทำให้บริษัทเจ้าถิ่นสามารถที่จะสร้างตัวขึ้นมาได้อย่างรวดเร็วในทศวรรษหลัง ทั้ง ยักษ์ใหญ่อย่าง Alibaba ที่นำโดย Jack Ma , Baidu เจ้าพ่อ search engine จากจีน รวมถึงบริษัทที่เราจะกล่าวถึงใน blog นี้อย่าง Tencent ซึ่งแม้จะมีข่าวน้อย แต่ก็ทำรายได้เป็นอันดับหนึ่งในจีน แซงหน้า Alibaba ไปเป็นที่เรียบร้อยแล้ว

ถ้าพูดถึง Tencent ก็ต้องกล่าวถึง Wechat บริการด้านการ chat ที่ครอบครองตลาดจีนได้อย่างเบ็ดเสร็จ ซึ่งเป็นต้นทางของบริการหลาย ๆ อย่างของ Tencent ทั้งระบบ E payment หรือ เกมส์ ที่เป็นรายได้หลักของบริษัทในขณะนี้ และลงทุนในบริษัททางด้านเทคโนโลยีต่าง ๆ ทั้งในและต่างประเทศอีกมากมาย

ซึ่งผมก็เคยเขียน blog เกี่ยวกับ tencent ไว้ก่อนหน้านี้ ซึ่งตอนนี้นั้น มูลค่าของ tencent ได้มีมูลค่า Market Value แซง facebook ยักษ์ใหญ่ทางด้าน social network จากอเมริกาเป็นที่เรียบร้อยแล้ว โดยมูลค่าล่าสุดนั้นสูงถึง 528,000 ล้านดอลล่าร์  มากกว่า มูลค่า facebook ณ ปัจจุบันอยู่ 6 พันล้านดอลล่าร์

อาจจะเป็นการแซงเพียงชั่วคราวจากมูลค่าหุ้นที่เพิ่มขึ้นมา แต่ก็เป็นสิ่งที่น่าสนใจไม่น้อย เพราะบริษัทที่ติด Top Ten ของโลกนั้น ล้วนเป็นบริษัทใน silicon valley ซะเป็นส่วนมาก แต่การเข้ามาของ tencent นั้นสามารถเบียดบริษัทจากชาติตะวันตกขึ้นมาเป็นบริษัทที่มูลค่าติดอันดับต้น ๆ ของโลกได้

ซึ่งมีโอกาสสูงที่บริษัทอื่น ๆ เช่น Alibaba หรือ Baidu นั้นก็มีโอกาสที่จะขึ้นมาทาบรัศมีของบริษัทจาก silicon valley เช่นกันในอนาคตอันใกล้นี้ เนื่องจากการเติบโตของผู้ใช้งาน internet ในประเทศจีน รวมถึงการเกิดขึ้นของชนชั้นกลางอีกจำนวนมากในประเทศจีน ทำให้สามารถสร้างกำลังซื้อ รวมถึงการใช้บริการต่าง ๆ ที่บริษัทเทคโนโลยีของจีนเหล่านี้ให้บริการอยู่ ก็มีโอกาสที่จะทำให้บริษัทเหล่านี้รายได้เพิ่มสูงขึ้นไปอีกในอนาคตอันใกล้นี้

เราคนไทยก็ต้องหันมามองจีนใหม่ ตอนนี้จีนนั้นได้พัฒนาทางด้านเทคโนโลยี โดยเฉพาะด้าน internet ไปไกลแล้ว บริการต่าง ๆ ของจีนทั้ง e-commerce  ระบบ payment นั้นต้องยอมรับว่ามีการพัฒนา และใช้งานกันในชีวิตประจำวันของคนจีนเป็นปรกติแล้ว ซึ่งบางอย่างนั้นได้ก้าวล้ำกว่าชาติตะวันตกไปอีกด้วย

ซึ่งสิ่งเหล่านี้นั้นล้วนมาจากพื้นฐานทางด้านงาน R&D ของจีน ซึ่งวิศวกรชาวจีนนั้นก็ไม่ได้มีความสามารถด้อยไปกว่าชาวตะวันตกเลยด้วยซ้ำ จะเห็นได้ว่า paper ทางวิชาการต่าง ๆ ในปัจจุบันนั้น ส่วนใหญ่เป็นของชาวจีนมากกว่าทางตะวันตกแล้ว ซึ่งงานวิจัยเหล่านี้บ่งบอกได้ถึงแนวโน้มของเทคโนโลยีต่าง ๆ โดยเฉพาะด้านคอมพิวเตอร์นั้น มีโอกาสสูงที่บริษัทจากจีนนั้นจะมีนวัตกรรมที่แซงหน้าบริษัทจากตะวันตกไปได้อย่างแน่นอน

Image Ref : news.abs-cbn.com

 

 

 

การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว

ผมชอบอ่านงานวิจัยของต่างประเทศ ที่เกี่ยวข้องกับ Machine Learning หรือ AI เนื่องจากเคยผ่านงานด้านนี้มาบ้างดังที่ได้เคยเขียน blog Support Vector Machine กับการวิเคราะห์มะเร็งเต้านม  ซึ่ง AI น่าจะมีบทบาทมาก ๆ ในหลายๆ  ธุรกิจในอนาคตอันใกล้นี้

ซึ่ง Machine Learning นั้นก็ต้องส่วนหนึ่งของการพัฒนา AI ในปัจจุบัน ที่พัฒนาความสามารถให้มีความฉลาดเพิ่มมากยิ่งขึ้นจากการเรียนรู้ข้อมูล ที่มีจำนวนมหาศาลในปัจจุบัน ในวงการ trading ก็เป็นวงการหนึ่งที่คิดว่า AI น่าจะมีบทบาทสำคัญมาซักพักหนึ่งแล้ว ซึ่งหลาย ๆ คนอาจจะยังไม่ทราบว่าทุกวันนี้ เราไม่ได้ trade แข่งกับมนุษย์เท่านั้น เรายังต่อสู้กับ AI อีกจำนวนมาก ซึ่งทำให้เราเสียเปรียบเป็นอย่างมาก

งานวิจัยหลาย ๆ ปีก่อนหน้านี้นั้น เน้นไปที่การนำ Technical indicator ต่าง ๆ มาประมวลผล โดยใช้ Machine learning และทำการ prediction อนาคต  ซึ่ง หลาย ๆ งาน  ก็ได้ผลที่น่าสนใจเป็นอย่างยิ่ง แต่ความแม่นยำนั้นต้องบอกว่าถ้านำไปเทียบกับอย่างอื่น ถือว่าความแม่นยำนั้นยังน้อยอยู่มาก เนื่องจาก ภาวะตลาดมีความผันผวนสูง มีผู้เล่นมากหน้าหลายตา ทั้งกองทุนต่าง ๆ รวมถึงรายย่อย ทำให้ AI ไม่สามารถสร้างความแม่นยำในการ trade ได้

แต่ช่วง 2-3 ปีมานี้ เริ่มมีการวิจัยโดยใช้ทฤษฎีใหม่ ซึ่งนำเรื่องของการวิเคราะห์ข่าวสารมาเป็นปัจจัยหลักแทน เพราะ ข่าวสารนั้นมีผลกระทบต่อจิตวิทยาการเทรดของนักลงทุน โดยตรง นัก trade หลาย ๆ คนซื้อตามข่าว ขายตามข่าว ทำให้ข่าวค่อนข้างมีปัจจัยสำคัญต่อราคาหุ้น เป็นอย่างมาก

แต่การวิเคราะห์เรื่องข่าวนั้น ไม่ได้เป็นสิ่งที่ง่ายเลย เผอิญ ผมได้ไปเจองานที่น่าสนใจ คือ Stock Trend Prediction Using News Sentiment Analysis  ซึ่งเป็นการศึกษาที่ใช้รูปแบบของ News Sentiment Analysis หรือการวิเคราะห์ข่าวเป็นปัจจัยที่จะส่งผลต่อการทำนายราคาขึ้นลงของหุ้นในวันถัดไป ซึ่งปัจจุบันนั้น นักลงทุนมีรูปแบบการทำนาย Market Trends ของตลาดในสองรูปแบบหลักคือ การวิเคราะห์ทางด้านเทคนิคอล โดยใช้ indicator ข้อมูลต่าง ๆ ส่วนอีกรูปแบบคือ การวิเคราะห์ปัจจัยพื้นฐานของหุ้น

โดยในงานวิจัยนี้ จะ follow ตามรูปแบบของการวิเคราะห์ปัจจัยพื้นฐาน ในการทำนาย future trend ของหุ้นนั้น ๆ โดยจะพิจารณาจาก ข่าวที่มีผลกระทบต่อหุ้นตัวนั้น ๆ เป็นหลัก และ ใช้ computer algorithm ในการแบ่งประเภทของข่าว ว่าเป็นข่าวที่ดี หรือ ข่าวที่แย่ ต่อหุ้นนั้น ๆ โดยนำเสนอว่า หาก เป็นข่าวดี ก็จะมีโอกาสทำให้หุ้นตัวนั้นขึ้น แต่หากในทางตรงกันข้ามที่เป็นข่าวแย่ ๆ ก็จะทำให้หุ้นตัวนั้นลง ตรงนี้ฟังดูเหมือนจะง่าย แต่การทำจริงนั้นยาก ๆ มาก ๆ เพราะ ข่าวมาจากหลายแหล่งหลายข่าวสาร รวมถึง วิธีการวิเคราะห์เนื้อหาของข่าวนั้นก็เป็นปัจจัยหลักที่จะแบ่งแยกว่าเป็นข่าวดีหรือข่าวร้าย ซึ่งการใช้คนอ่านนั้น ก็อาจจะไม่ยากเท่าไหร่ แต่สำหรับ AI นั้นเราจะทำอย่างไรในการแยกข้อมูลเหล่านี้ที่มีอยู่จำนวนมหาศาล

 

System Design

งานวิจัยได้แบ่งการ design เป็น 3 phases โดยใน phase แรกนั้นจะเป็นส่วนของการวิเคราะห์ข่าว เพื่อหา Polarity Score เพื่อเป็น input ให้กับ phase 2 โดยที่ ใน phase 2 นั้นจะนำ document มา converted เป็น tf-idf vector space เพื่อให้สามารถทำการจำแนกข้อมูลได้   โดยจะใช้ เทคนิคในการทำจำแนกข้อมูล 3 แบบคือ Random Forest , Naive Bayes  และ SVM หรือ Support Vectore Machine ที่ผมเคยกล่าวถึงใน blog ก่อนหน้านั่นเอง การใช้ถึง 3 เทคนิค นั้นก็เพื่อวัด performance ว่าเทคนิคไหนจะให้ความแม่นยำสูงสุด

ส่วน phase สุดท้ายนั้น จะทำการเช็คความสัมพันธ์ระหว่าง ข่าว และ ราคาหุ้น โดยจะใช้การ plot ข้อมูลทั้งสองโดยจะใช้ภาษา R

News Collection

ผู้วิจัยได้ใช้ข้อมูลของ บริษัท Apple โดยจะเก็บข้อมูลย้อนหลัง 3 ปี ตั้งแต่ 1 กุมภาพันธ์ ปี 2013 ถึง 2 เมษายน ปี 2016  โดยข้อมูลนั้นจะรวมถึง ข่าวจาก events หลัก ๆ ทั้งหมดของ apple รวมถึงราคาหุ้นของ AAPL ในช่วงเวลาเดียวกัน  โดยข้อมูลของหุ้นนั้นจะประกอบด้วย 6 ข้อมูลหลัก คือ Open , High , Low , Close , Adjusted Close และ Volume  โดยข้อมูลของข่าวหลัก ๆ นั้นจะมาจากหลาย ๆ สื่อที่เป็นข้อมูล online เช่น  news.google.com , reuters.com finance.yahoo.com

Pre Processing

ซึ่งจากข้อมูลของข่าว ที่เป็น text data นั้นจะเป็นข้อมูลที่ไม่มีโครงสร้าง จึงไม่สามารถที่จะนำเอาข้อมูลดิบเหล่านี้ไปทำการจำแนกได้  ซึ่งข้อมูลดิบเหล่านี้นั้นจะประกอบไปด้วยข้อความขยะเป็นจำนวนมาก งานวิจัยนี้จึงต้องทำการตัดข้อความที่เป็นขยะเหล่านี้ออก เพราะจะไม่มีผลต่อการจำแนก โดยงานวิจัยจะนำเฉพาะส่วนของข้อความจากข่าวที่มีความเกี่ยวข้องกับข้อมูลทางด้านการเงิน

โดยใช้ข้อมูลอ้างอิงจาก  McDonald’s research  ซึ่งได้ทำการวิจัยข้อมูลที่เกี่ยวข้องกับ finance ไว้เป็นทีเรียบร้อยแล้ว ซึ่งจะตัดเหลือข้อมูลที่เกี่ยวข้องกับหุ้นจริง ๆ เช่น  วันที่ ตัวเลข ต่าง ๆ รวมถึง สกุลเงิน  และเพื่อหลีกเลี่ยง คำบางคำ ที่มีความหมายเดียวแต่ใช้ในหลายเหตุการณ์ เช่น คำว่า ‘developed’ , ‘development’ , ‘developing’ นั้นจะถูกทำให้กลายเป็นคำ ๆ เดียวคือ ‘develop’

Sentiment Detection Algorithm

สำหรับการวิเคราะห์ว่าข่าวใดจะเป็นข่าวดี หรือ ข่าวร้าย ให้ได้แบบอัตโนมัติ หรือ sentiment detection นั้น ทางงานวิจัยนั้นใช้ dictionary จากงานวิจัยของ J.Bean ที่เคยทำการวิเคราะห์โดยนำข้อมูลจาก twitter มาใช้ในการวิเคราะห์ทรรศนะคติที่มีต่อสายการบินผ่านข้อมูลจาก feed ใน twitter

ซึ่งการที่จะวิเคราะห์ว่าข่าวจาก article ไหนเป็นข่าวดีหรือข่าวร้ายนั้น ต้องแบ่งคำเป็น 2 ประเภท คือ positive words และ negative words  และทำการนับรวมคำทั้งสองประเภท เพื่อทำการคำนวณ score จากข่าวนั้น ๆ ซึ่งจากข้อมูลของ McDonald’s research ทางผู้วิจัยได้สร้าง dictionary ที่มีคำที่เป็น positive words จำนวน 2360 คำ และ คำที่เป็น negative words จำนวน 7383 คำ โดยการคำนวน score นั้นก็จะนำเอา ผลรวมของ positive words ลบด้วย ผลรวมของ negatives words ในข่าวนั้น ๆ ซึ่ง หาก score มากกว่า 0 นั้น ก็สามารถ assume ได้ว่าข่าวนั้นเป็นข่าวดี  แต่หาก score น้อยกว่า 0 ก็สามารถ assume ได้ว่า ข่าวนั้น ๆ เป็นข่าวร้ายหุ้นที่เราทดสอบ (AAPL)

Classifier Learning

งานวิจัยนี้ได้ใช้ 3 เทคนิค ตามที่ได้กล่าวข้างต้นคือ Support Vector Machine , Random Forest และ Naive Bayes เป็นเทคนิคในการใช้จำแนก ซึ่ง การใช้ 3 เทคนิค ก็เพื่อทำการวัด performance ว่าเทคนิคไหนได้ความแม่นยำสูงที่สุด เมื่อทำการทดสอบกับข้อมูลใหม่

EVALUATION

งานวิจัยนี้ได้ทำการทดสอบ model ด้วยเทคนิคการทดสอบหลาย ๆ แบบ และในหลายเงื่อนไข เพื่อเปรียบเทียบผล โดยประกอบไปด้วย

  • 5-fold cross validation
  • 10-fold cross validation
  • 15-fold cross validation
  • 70% Data split
  • 80% Data split
  • New testing data

 

Figure1 three classifiers against different test options

Figure2 result with new data

 

Figure3 news sentiment score vs stock price

CONCLUSION

การที่จะทำนาย Market Trend ของราคาหุ้นนั้น เป็นสิ่งที่ยากมาก ๆ เพราะขึ้นอยู่กับหลายปัจจัย ซึ่งงานวิจัยนี้ได้สำเสนอในส่วนของปัจจัยพื้นฐานด้านข่าวที่มีผลกระทบต่อราคาหุ้น  ซึ่งจากผลการทดสอบนั้นจะพบว่าปัจจัยเรื่องข่าวนั้นเป็นปัจจัยที่สำคัญอย่างนึง ในการขึ้นลงของหุ้น  ซึ่งข่าวที่ดี หรือ แย่ นั้น การใช้ AI ในการแยกแบบ Automatic นั้นสามารถทำได้ โดยใช้เทคนิค ตามที่กล่าวข้างต้น  ข่าวที่ดีนั้นมีโอกาสสูงที่จะทำให้หุ้นราคาขึ้น ซึ่งตรงข้ามหากเป็นข่าวที่แย่ นั้นก็มีโอกาสสูงเช่นกันที่จะทำให้หุ้นราคาตก

สิ่งสำคัญอีกอย่างนึงที่จะวัดว่าเป็นข่าวดีหรือข่าวแย่ นั้น ข้อมูลจาก dictionary ตามงานวิจัยข้างต้นนั้นก็เป็นสิ่งสำคัญ การใช้ reference ของงานวิจัยที่ผ่านการทดสอบมาแล้วนั้น ทำให้ผลการทดสอบนี้มีประสิทธิภาพมากยิ่งขึ้น รวมถึงการลบข้อความที่เป็นขยะ ออกจากข่าว ซึ่ง มีผลกระทบต่อความแม่นยำในการจำแนกให้มีประสิทธิภาพ เพราะฉะนั้น ต้องใช้หลาย ๆ งานวิจัยที่เกี่ยวข้องร่วมกันเพื่อให้ผลการจำแนกดีที่สุด และผลจากการทดลองการจำแนกโดยใช้ 3 เทคนิค นั้น เทคนิค Random Forest สามารถจำแนกได้ผลแม่นยำสูงสุดในทุก test case โดยมีความแม่นยำสูงถึงระดับ 88% – 92%  โดยอันดับ 2 คือ Support Vector Machine ที่ให้ความแม่นยำประมาณ 86%  ส่วนเทคนิค Naive Bayes นั้นให้ความแม่นยำอยู่ที่ประมาณ 83%

แต่พอมาลอง test กับข้อมูลชุดใหม่นั้น จะพบว่า Support Vector Machine นั้นให้ความแม่นยำสูงถึง 90%  ตามมาด้วย Random Forest ที่ 80% และรั้งท้ายที่ Naive Bayes ที่ 75%  ซึ่ง โดยสรุปนั้นเราก็สามารถสรุปได้ว่า ข่าว เป็นปัจจัยหลัก ปัจจัยนึง ที่มีผลกระทบต่อราคาหุ้น อย่างแน่นอน ซึ่งเราสามารถนำข้อมูลเหล่านี้มาทำการวิเคราะห์และทำนาย Trend ที่จะเกิดขึ้นกับราคาหุ้น ๆ ที่เราสนใจได้ ซึ่งหากเราจะนำมาปรับใช้กับหุ้นไทยนั้น ก็คงจะต้องปรับกันพอสมควรโดยเฉพาะหากข่าวที่เป็นภาษาไทย ซึ่งไม่สามารถที่จะใช้การทดลองแบบนี้ได้แน่นอน แต่หากข่าวที่เป็นภาษาอังกฤษ นั้น คิดว่าผลน่าจะได้ใกล้ ๆ เคียงกัน ซึ่งก็เป็นสิ่งที่น่าสนใจที่จะมาทดสอบกับหุ้นไทยเหมือนกัน เพราะ เทคนิคต่าง ๆ ที่กล่าวในงานวิจัยนั้น สามารถนำมาใช้ได้ เพราะมีการ open ทั้งหมด ทั้ง เทคนิคการจำแนกอย่าง Support Vector Machine ก็สามารถโหลดมาใช้ได้ รวมถึง การใช้ Sentiment Detection Algorithm นั้นเราก็สามารถนำมันมา implement กับหุ้นไทยเพื่อทดสอบ model ข้างต้นได้

 

References :   arxiv.orgmotherboard.vice.com