Failed Startup Stories : Yik Yak Connect with the people around you

ต้องบอกว่ามาด้วย concept ง่าย ๆ เลยสำหรับ social network น้องใหม่ในขณะนั้นอย่าง Yik Yak โดยใช้ concept ง่าย ๆ คือ “a location-based social network that helps you connect with the people around you” ซึ่งในกระแสที่ social network เจ้าใหญ่ได้ยึดครองตลาดไปแทบจะหมดแล้ว ก็ได้เกิดบริการที่ simple คือ ช่วยคุณติดต่อคนรอบกายคุณ ซึ่งเหมือนจะ idea ที่ดีนะ เพราะ facebook ก็เน้นไปในแนว social ขนาดใหญ่ ทั้งครอบครัว เพื่อน เพื่อนร่วมงาน ซึ่งเป็นสังคมใหญ่รอบตัวเรามากกว่า แต่ Yik Yak focus ที่ community ขนาดเล็ก ๆ แต่อยู่ใกล้ตัวเราจริง  ๆ ผ่าน location based

ประวัติ Yik Yak

Yik Yak นั้นเริ่มต้นด้วย co-founders สองคนคือ Tyler Droll และ Brooks Buffington ทั้งสองนั้นจบการศึกษาจาก Furman University ใน South Carolina ทั้งคู่เริ่มรู้จักกันตอนเรียน class ที่เกี่ยวข้องกับการเขียนโปรแกรมบนระบบ IOS

หลังจากได้จบการศึกษา ทั้งคู่ได้ตัดสินใจที่จะเริ่ม project Yik Yak แบบ full time โดยที่ Droll นั้นได้ลาออกจาก medical school ก่อนที่โปรเจคนี้จะเริ่มต้นขึ้น ส่วน Buffington นั้นก็หยุดเส้นทางอาชีพด้านการเงินของเค้าไว้ก่อนเพื่อมา focus project นี้ และได้เพื่อนร่วมทีมเพิ่มอีก 1 คนคือ Will Jamieson  โดยพวกเค้าได้ทำ app เสร็จและทำการ Release ใน เดือนพฤษจิกายน ปี 2013

หลังจากนั้นเพียง 12 เดือน Yik Yak ก็ขึ้นสู่อันดับ 9 ของหมวด social media app ในสหรัฐอเมริกา ซึ่งผลตอบรับในช่วงแรกนั้นเป็นไปอย่างน่าพอใจ และได้ทำการพัฒนา features มาอย่างต่อเนื่อง แต่ก็มีกระแสของการทำให้เกิด “cyberbullying” ขึ้นใน apps ก็ได้พัฒนาปรับปรุง features เพื่อลดทอนคำวิจารณ์ของ app เหล่านี้

Funding

Yik Yak นั้นได้รับการลงทุนครั้งแรกโดย Atlanta Ventures ซึ่งมี office อยู่ใน Atlanta Tech Village ในเดือนเมษายนปี 2014 นั้นทางบริษัทได้ประกาศว่าได้รับทุนมูลค่ากว่า 1.5 ล้านเหรียญสหรัฐจาก หลายบริษัทด้านการลงทุน เช่น Vaizra Investments , DCM , Kevin Colleran และ Azure Capital Partners ซึ่งใช้เวลาเพียง 5 เดือนหลังการ Release ของ Yik Yak  ซึ่งในขณะนั้นมีความตั้งใจที่จะขายตลาดไปทั่วทั้งสหรัฐ และ ทั่วโลก เนื่องจาก apps เริ่มมีกระแสปากต่อปาก ทำให้ยอดดาวน์โหลดสูงมาก

ซึ่งหลังจากนั้นเพียง 2 เดือนหลังจากได้รับเงินทุนรอบก่อน Yik Yak ก็ได้รับเงินทุนเพิ่มเพื่อไปขยายธุรกิจ รวมถึงพัฒนา features จำนวนกว่า 10 ล้านเหรียญสหรัฐ จากนักลงทุนกลุ่มเดิม และเพิ่มด้วยนักลงทุนกลุ่มใหม่คือ Renren Lianhe Holdings และ Tim Draper ที่เริ่มมั่นใจว่าจะสามารถแจ้งเกิดกับบริการ social media น้องใหม่นี้ได้อย่างแน่นอน

ด้วยการเติบโตอย่างก้าวกระโดด ในปี 2014 ก็ได้รับความสนใจจาก บริษัทด้านการลงทุนยักษ์ใหญ่อย่าง Sequoia Capital ที่ให้เงินลงทุนจำนวนถึง 60 ล้านเหรียญสหรัฐ ทำให้มูลค่ารวมของ Yik Yak พุ่งสูงขึ้นถึง 350 ล้านเหรียญสหรัฐ หลังจากเพิ่ง launch product มาได้แค่ปีเดียวเท่านั้น

Features เด่น ๆ ของ Yik Yak

  • Yakarma : Yakarma นั้นเป็น score เพื่อใช้วัด ความสำเร็จของ user โดยรูปแบบของ score โดยจะมีการขึ้นลงขึ้นอยู่กับการตอบรับจาก users คนอื่น ๆ ซึ่งการเปลี่ยนค่าของ Yakarma นั้นขึ้นกับ จำนวน upvotes , downvotes จำนวนของ replies รวมถึง comments ที่เกิดขึ้นจาก post ของ user
  • Upvote/Downvote :  Upvote และ Downvote นั้นจะมีผลกระทบต่อ rating ของ user ที่มีการให้ Yak ซึ่ง post ของ user จะได้ความนิยมก็ต่อเมื่อได้รับ upvote มากกว่า downvote ซึ่งจะมี score ขึ้นด้านข้างของ vote และหาก score มีค่าถึง -5 คือ downvote มากกว่า upvote เยอะเกิน 5 post นั้นๆ  ก็จะถูกลบอย่างถาวร
  • Peek :  function “peek” นั้นจะอนุญาติให้ user สามารถมองเห็น commutiny feed ของ Yik Yak อื่นได้  โดยในค่าตั้งต้นนั้น user สามารถ peek ได้เพียงใน สหรัฐ และ International Colleges เท่านั้น  แต่หลังจากได้มีการ update version ในเดือนตุลาคม ปี 2014 user ก็สามารถที่จะ peek ไปยังทุก colleges  หรือ ทุก ๆ เมืองในโลกได้ เป็นการปลดล็อกในที่สุด  แต่จะไม่สามารถ vote หรือ post ใน community นั้นๆ  ได้ user จะสามารถ post ใน local community ได้เท่านั้น
  • Photos : สำหรับ Features นี้นั้น จะให้ user ได้ใส่รูปภาพลงใน Yaks Community ของตนเองได้ ซึ่งได้จำกัดรูปโดยรูปต้องไม่ผิดกฏหมาย หรือ มีเนื้อหาของรูปที่ไม่เหมาะสม และ รูปที่แสดงใบหน้านั้นจะแสดงใน local feed เท่านั้น  และมีในส่วนของ  photo collections ซึ่งจะโชว์ รูปยอดนิยม ที่อัพโหลดจากผู้ใช้ใน location นั้น ๆ 
  • Hidden Features : Yik Yak จะมี features ของการกรองคำที่มีเนื้อหาไม่เหมาะสม และจะมีการเตือนไปยัง user ก่อน แต่หาก user ยังยืนยันที่จะทำการ post ข้อความที่ไม่เหมาะสมเหล่านั้น ก็จะถูกลบออกโดย moderators ของระบบ  และ post ที่มีเบอร์ มือถือ นั้นจะไม่สามารถ post ได้

สุดท้ายก็ต้องปิดบริการ

ปัญหาใหญ่ที่สุดของหลาย social network คือ ปัญหา “cyberbullying” ซึ่ง Yik Yak เป็น social media ที่ based on location ทำให้ปัญหานี้ยิ่งรุนแรงขึ้นไปอีก หลาย  ๆ โรงเรียนทำการ แบน app Yik Yak

ในเดือนพฤษภาคม ปี 2015 Father Michael Engh ประธานของ Santa Clara University ได้ทำการออกแถลงการณ์ หลังจากพบปัญหาการเหยียดผิวมากมายบน app Yik Yak ซึ่งเขาได้กล่าวในแถลงการณ์ไว้ว่า “คำพูดที่แสดงความเกลียดชัง หรือ Hate Speech นั้น ไม่ควรที่จะสับสนกับ Free Speech ใน santa clara university เพราะเป็นการละเมิดศักดิ์ศรีในชุมชมของชาว santa clara ซึ่งความเห็นที่เป็นอันตรายต่อบุคคล หรือ กลุ่มบุคคลใดนั้น จะก่อให้เกิดความแตกแยก ความหวาดระแวง และความสงสัยกัน”  ซึ่งข้อสรุปนี้เป็นการโต้เถียงเรื่องปัญหา “cyberbullying” รวมถึงปัญหาการเหยียดผิวภายใน app social media ดังกล่าว

และในเดือนตุลาคุม ปี 204 สำนักพิมพ์ online ชื่อดังอย่าง The Huffington Post นั้นได้ทำการเสนอบทความโดย Ryan Chapin ว่าด้วยเรื่องของ “ทำไมมหาลัยของคุณถึงต้องทำการ Ban app Yik Yak”  ซึ่งในบทความได้อ้างการส่งข้อความที่ไม่ระบุตัวตนของ Yik Yak นั้น เป็นแหล่งที่มาของบทสนทนา ที่ไม่เป็นประโยชน์หรืออาจเป็นอันตรายต่อชุมชม และเป็นสิ่งที่น่ารังเกียจถึงที่สุด

ซึ่งทาง Yik Yak ก็ไม่ได้เฉยเมยต่อปัญหาดังกล่าว ที่เริ่มเกิดขึ้นทั่วประเทศ โดย Droll และ Buffington ได้พัฒนาส่วนของ Geofence โดยทำงานใน backgroud เพื่อแก้ปัญหาดังกล่าว และได้รับความช่วยเหลือจากบริษัท Maponics ในการกำหนดขอบเขตในการเล่น ซึ่ง บริษัท Maponics นั้นมีฐานข้อมูลของแผนที่กว่า 85% ของโรงเรียนมัธยมของประเทศ ซึ่งทำให้สามารถป้องกันการเข้าถึง app Yik Yak ในพื้นที่เหล่านั้นได้

ซึ่งหากมีการเปิดใช้งาน app Yik Yak ในพื้นที่เหล่านั้น จะมีข้อความเตือนขึ้นมาว่า “คุณกำลังพยายามใช้ Yik Yak ในโรงเรียนมัธยม หรือ บริเวรณโรงเรียนมัธยม”  โดย Yik Yak นั้นจะเหมาะสำหรับผู้ที่เรียนมหาลัยขึ้นไป ซึ่งการเปิดเผยจากสื่อนั้น ทำให้กระทบต่อจำนวนผู้ใช้งานของ app จำนวนมาก ทำให้เริ่มมีคนใช้ลดลง และพ่อแม่ผู้ปกครองก็เริ่มกันห้ามลูกเล่น app Yik Yak

ถึงจะมีภาพลบเป็นส่วนมาก แต่ก็มีส่วนดี ๆ ของ Yik Yak เช่นกัน มีงานวิจัยที่ระบุว่า Yik Yak นั้นสามารถใช้ในทางที่ดีได้คือ ไว้ค้นหาความแตกต่าง ทางชาติพันธ์ หรือ อัตลักษณ์ต่าง ๆ เพื่อสร้างความรู้สึกร่วมในชุมชน หรือ ในมหาลัยวิทยาลัยให้เกิดขึ้นได้ Yik Yak นั้นให้สิทธิ์ ให้เสียงกับกลุ่มนักเรียน นักศึกษา ให้บทบาทในมหาลัยหรือชุมชนมากยิ่งขึ้น

และในปี 2015 นั้น Yik Yak ยังได้รับความสนใจในการช่วยป้องกันเหตุฆ่าตัวตายที่มหาวิทยาลัย William and Mary ซึ่ง Yik Yak ได้รับการยกย่องเกี่ยวกับการช่วยป้องกันเหตุฆ่าตัวตาย ซึ่งหนึ่งในนั้นคือ การช่วยผู้คนในชุมชนนั้นได้ share ความช่วยเหลือ รวมถึงในหลาย ๆ case ก็ได้รับความสนับสนุนในการขอความช่วยเหลือผ่านทาง app Yik Yak เพื่อไม่ให้ฆ่าตัวตาย

จากปัญหาที่รุมเร้าเข้ามามากมาย  ในช่วงปี 2016 จำนวนผู้ใช้ของ Yik Yak นั้นลดลงถึง 76% จากผู้ใช้งานในปี 2015  และในเดือนธันวาคม ของปี 2016 นั้น Yik Yak ได้ปลดพนักงานออกไปกว่า 60% ทีมงานด้าน community , การตลาด , designer รวมถึง ทีมงานที่เป็น engineer ที่ทำตัว production ของ app นั้น ได้รับผลกระทบจากการ lay-off พนักงานแทบจะทั้งหมด ซึ่งปัญหาหลักที่สื่อหลาย ๆ แห่งรายงานตรงกันคือ social network ใด ๆ ที่ไม่มีการเปิดเผยผู้ใช้งานจริง เช่นเดียวกับ Yik Yak นั้นจะมีศักยภาพในการทำให้เกิดปัญหา “cyberbullying” ซึ่งเป็นปัญหาใหญ่ของหลายๆ  ชุมชนในปัจจุบัน

ซึ่งสุดท้ายแล้วในเดือนเมษายน ปี 2017 นั้น Yik Yak ก็ต้องประกาศปิดอย่างเป็นทางการ ซึ่งหลังจากมีการออกข่าวไป ก็ทำให้มีผู้ใช้งานอย่างลดลง และ แอป ก็ได้หยุดทำงานจริง ๆ ในวันที่ 5 พฤษภาคม 2017 ซึ่งถือเป็นจุดสิ้นสุดของ Yik Yak ในตลาด social network

สรุป

จะเห็นได้ว่าตัวอย่างของ Yik Yak นั้นเป็น app ที่มี idea ที่เจ๋งมาก ๆ และสามารถพัฒนาจนคนใช้ติดได้สำเร็จ และเริ่มมีการเติบโตของผู้ใช้อย่างรวดเร็วในเวลาเพียง 1 ปี หลังจากทำการ Release ซึ่งปัญหาที่ตามมานั้นเหล่า co-founder ก็ไม่ได้นิ่งนอนใจ คอยแก้ไขปัญหา เพื่อให้ user กลับมาใช้งานได้สะดวกใจอีกครั้ง แต่ปัญหาอย่าง Cyberbullying หรือ การเหยียดผิวนั้น เป็นปัญหาที่ร้ายแรง ซึ่งหาก app นั้นถูกมองในแง่ลบแล้วนั้นก็ยากที่จะกู้ชื่อเสียงคืนมา ซึ่งการที่จะทำ app ให้คนใช้ติดนั้นไม่ยากอย่างที่ Yik Yak ทำได้ แต่การที่ไม่คิดถึงปัญหาที่ครอบคลุมกับสิ่งที่จะเกิดขึ้นกับ Features ที่มีใน app  ก็ทำให้ Yik Yak ก็ต้องจบเส้นทางของธุรกิจไปอย่างรวดเร็วได้เช่นกัน

References : en.wikipedia.org,startuphook.com,hyunjinp.wordpress.com,www.wyff4.com,www.slideshare.net

Blog Series : Failed Startup Stories

จากกระแสของ Startup ในช่วงที่ผ่านมานั้น ถือว่าทำให้คนรุ่นใหม่เริ่มสนใจจะมาทำ startup กันมากขึ้น หลาย ๆ คนเพิ่งเรียนจบมาใหม่ มาพร้อม idea ที่เจ๋ง ๆ  แต่ยังไม่เคยผ่านประสบการณ์ทำงานจริงใด ๆ แต่ก็สามารถระดมทุนเพื่อไปสร้างธุรกิจได้

ซึ่งส่วนนึงก็ทำได้สำเร็จจริง ๆ แต่ส่วนใหญ่นั้นล้มเหลวไม่เป็นท่า  ซึ่งหลาย ๆ คนอาจจะไม่รู้ว่า มี startup เพียง 10% ที่จะสามารถอยู่รอดในตลาด และสามารถที่จะทำให้มันกลายเป็นธุรกิจที่สร้างกำไรจริง ๆ ได้

ยิ่งในตลาดเล็ก ๆ อย่างประเทศไทย หากเป็น startup ที่คิดเพียงแค่ scale ในประเทศไทยนั้น โอกาสยิ่งเหลือน้อยที่จะอยู่รอดในตลาด ซึ่งในตอนนี้นั้นคนส่วนใหญ่พูดถึงแค่ 10% เหล่านี้ ที่เป็น idol หรือ ความหวังของคนหลาย ๆ คน พูดแต่ด้านที่ดีของ startup แต่น้อยคนนักที่จะพูดถึงเหล่า startup อีก 90% ที่ต้องปิดกิจการหรือเจ๊งไป

Blog Series ชุดนี้จะมาตามรอย เหล่า startup ดัง  ๆ ทั้งหลาย ที่แม้จะเคยพุ่งขึ้นสู่จุดสูงสุด ได้รับเงินจากนักลงทุนมามากมาย แต่สุดท้ายก็ต้องปิดกิจการ เรามาดูกันซิว่าเกิดอะไรขึ้น กับพวกเขาเหล่านั้น

ตอนที่ 1 : Napster the digital music revolution

Credit Image : alleywatch.com

การพัฒนา AI เพื่อ Trade หุ้นไทยด้วย Machine Learning

ปัจจุบันนั้น เทคโนโลยีทางด้าน AI หรือ Machine Learning กำลังเป็นที่สนใจในหลาย ๆ ธุรกิจ ที่จะนำมาพัฒนาเครื่องมือต่าง ๆ เพื่อช่วยเหลือการดำรงชีวิตของมนุษยเราให้สะดวกมากยิ่งขึ้น ในแวดวงของการลงทุน AI ก็เริ่มเข้ามามีบทบาทมาช่วงหนึ่งแล้ว ซึ่งเราจะได้เห็นโฆษณาต่าง ๆ ผ่านหน้าผ่านตากันมาบ้าง ว่ามีกองทุนที่พัฒนาโดย AI มาคอยช่วยเหลือการ trade

งานวิจัยหลาย ๆ งานที่ได้ตีพิมพ์ในต่างประเทศนั้น ก็มีความน่าสนใจ ในแง่ของผลของการทดลองที่นำ AI มาช่วยประมวลผล และช่วยเหลือในการ trade ตัวอย่าง การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว ที่ผมเคยเขียน blog ไปก่อนหน้านี้ก็เป็นงานที่น่าสนใจ ที่นำปัจจัยเรื่องข่าวมาช่วยประมวลผล เพื่อทำการทำนาย market trend ที่กำลังจะเกิดกับหุ้นชื่อดังอย่าง AAPL ของ บริษัท apple ซึ่งผลนั้นก็ได้ความแม่นยำในระดับสูงกว่า 80%  ซึ่งถือว่าเป็นผลที่น่าสนใจไม่ใช่น้อย

Support Vector Machine ก็เป็น algorithm หนึ่งที่น่าสนใจที่สามารถจำแนกและทำนายได้แม่นยำค่อนข้างสูงในหลาย ๆ case ตัวอย่างงานวิจัยที่ส่วนตัวเคยได้ทำ คือ Support Vector Machine กับการวิเคราะห์มะเร็งเต้านม  ซึ่งเป็นการจำแนกมะเร็งเต้านมจาก Mammogram Image ได้ ซึ่งได้ความแม่นยำค่อนข้างสูงกว่า 90%  แต่ปัจจัยหลักที่สำคัญสำหรับการจำแนกนั่นก็คือ Attribute หรือ Features ที่เป็นค่า input เพื่อให้ algorithm ทำการ train และ จำแนกนั้นก็เป็นปัจจัยสำคัญที่มีผลต่อความแม่นยำในการทำนายผล

ในวงการตลาดการเงิน หรือ commodity นั้นก็เริ่มมีการใช้โปรแกรมเข้ามาทำการช่วย trade มาเป็นเวลานานแล้ว ซึ่งจะเรียกว่า EA หรือ Expert Advisor ซึ่งมีหลายตัวที่น่าสนใจ และสามารถพัฒนาให้เทรดได้ดีกว่ามนุษย์ซึ่งในประเทศไทย ก็มีคนไทยได้พัฒนาอยู่มากมายในตลาด ด้วยการใช้ computer algorithm มาช่วยโดยผ่านการเขียนเงื่อนไขการทำงานแบบต่าง ๆ เพื่อทำตาม strategy การ trade ที่ตัวเองต้องการ ซึ่งสามารถใช้ภาษา mql4 ซึ่งเป็นภาษา Basic ที่สามารถเรียนรู้ได้ไม่ยาก และสามารถนำมาพัฒนา EA ได้ไม่ยาก

แต่ภาษา mql4 นั้นถูก design มาอย่างมีข้อจำกัดหลาย ๆ อย่าง ทำให้ไม่สามารถพัฒนาโปรแกรมที่ซับซ้อนได้มากเท่ากับ ภาษา mql5 ซึ่งเป็นภาษาที่ใหม่กว่า และมีการ design แบบลักษณะ Object-oriented programming สามารถที่จะเชื่อมต่อกับ interface ต่างๆ  ข้างนอกได้ง่ายกว่าทั้ง device ต่าง ๆ รวมถึง network หรือ ระบบ cloud รวมถึง รองรับ timeframe ที่มากกว่า และสามารถพัฒนาโปรแกรมที่เข้าถึงเชิงลึกของ  market ได้อย่างมีประสิทธิภาพมากกว่าภาษา mql4 โดยเฉพาะการทำงานด้าน AI ที่ใช้ Machine Learning ซึ่ง MT5 จะมี library มากกว่า

MT5 กับ ตลาดหุ้นไทย

โดยส่วนตัวก็คอยดูอยู่ว่า broker เจ้าไหนจะนำ MT5 มาใช้กับหุ้นไทยได้ซักที ซึ่งก็มีประกาศกันมานานแล้วเหมือนกัน โดยบอกว่าจะเริ่มใช้ได้กันตั้งแต่ปีที่แล้ว แต่ก็เลื่อนมาตลอด ซึ่งตอนนี้ก็มี applewealth ที่รองรับการใช้งาน MT5 และได้เปิดให้ trade จริงไปแล้วก่อนหน้านี้ แต่ที่โทรถามล่าสุดคือ ตอนนี้กลับมาปิดระบบอีกครั้ง ยังไม่มีกำหนดเปิดใหม่ แต่ส่วนของ demo นั้นเรายังสามารถนำมาทดสอบได้อยู่ ซึ่งผมก็จะมาแนะนำให้เตรียมตัวให้พร้อมสำหรับการสร้าง AI ด้วย algorithm Support Vector Machine เพื่อรอวันที่ตลาดหุ้นไทยเปิดให้ใช้อย่างเป็นทางการ

 

เข้า web site applewealth ส่วนของเครื่องมือการลงทุน->ทดลองใช้งานเพื่อ download MT5

 

ทำการ click Download : Installer MetaTrader 5 เพื่อทำการ download  MT5  มา install ลงเครื่องคอมพิวเตอร์

 

หลังจากนั้นก็ให้ทำการ install program ลงเครื่อง เมื่อ install เสร็จ ก็จะเข้าสู่ส่วนของการเลือก server ซึ่ง default ก็จะเป็น applewealth อยู่แล้ว ให้กด next และมาสู่ส่วนของการเลือก account ซึ่ง การทดสอบเราสามารถใช้ demo account ด้วยการเลือกที่ new demo account ได้

 

 

จากนั้นก็จะเข้าสู่ในส่วนของ Personal Details ซึ่งเราก็กรอกข้อมูลทั้งหมดเข้าไป account type ก็ทำการเลือก SET  ส่วน Deposit นั้นคือเงินที่จะใช้ในการทดสอบ ซึ่งคล้าย ๆ demo ของ streaming pro ซึ่งหลาย ๆ ท่านน่าจะคุ้นชินกันอยู่แล้ว หลังจากนั้นให้ทำการกด next

 

หลังจากเลือก new demo account เสร็จก็จะเข้าสู่หน้าจอ Main หลักของโปรแกรม ซึ่งจะประกอบด้วยส่วนต่าง ๆ ดังรูปข้างต้น ซึ่งจะประกอบไปด้วย ส่วนของ list รายการหุ้นไทยทั้งหมด ส่วนของ chart windows ซึ่งเราสามารถเลือกหุ้นที่ต้องการ monitor ได้ สามารถปรับ time frame รวมถึงรูปแบบของกราฟได้ และส่วนของ Navigator ซึ่งจะประกอบไปด้วย Indicators ต่าง ๆ รวมถึง Expert Advisors ซึ่งเป็นส่วนของ EA ที่จะใช้ในการ auto trade ซึ่งเราสามารถหา indicators รวมถึง EA ได้จาก Market ซึ่งมีให้เลือกใช้จำนวนมากมาย

 

สำหรับ Support Vector Machine Library นั้นเราจะสามารถซื้อได้จาก Buy from the Market ซึ่งจะเป็น online market ที่มีการจำหน่าย หรือ แจก indicators หรือ EA ต่าง ๆ ที่น่าสนใจอยู่มากมายตาม startegy การ trade ของท่านซึ่งท่านสามารถเลือกได้ตามใจชอบ เราสามารถที่จะนำตัว demo version เพื่อมาทดสอบดูผลการ trade ผ่าน strategy tester ได้ ซึ่งส่วนนี้ผมจะ focus ในการใช้ Machine Learning Library ของ Support Vector Machine เป็นหลัก

 

ให้เราเข้าในส่วนการค้นหาและพิมพ์คำว่า svm เข้าไป ก็จะได้ผลการค้นหาเป็น Library ของ Support Vector Machine ซึ่งขายอยู่ที่ราคา 20 USD ซึ่งหากเราอยากทดลองใช้เราก็สามารถเลือกที่ demo เพื่อนำมาทดสอบก่อนได้ แต่เนื่องจากผมได้ซื้อมาเป็นที่เรียบร้อยแล้ว จึงสามารถนำมาเขียน code และนำไปใช้งานใน graph จริง ๆ ได้

 

จากรูปข้างบน นั้นจะแสดงรายละเอียดของ Library Support Vector Machine ซึ่ง เราสามารถกดที่ปุมสีเหลืองด้านขวาบน เพื่อนำตัว demo มาทำการทดสอบผ่าน Strategy Tester ได้ แต่จะไม่สามารถนำไปใช้ทดลองใน graph จริง  ๆ ได้

 

สำหรับการใช้งาน EA ตัวอย่างสำหรับการใช้งาน Support Vector Machine นั้นผมได้ทำการสร้างตัวอย่างไว้ให้สามารถ download ได้จาก svm_thai_stock  ซึ่งประกอบด้วย 2 file คือ svm_thai_stock.ex5 และ svm_thai_stock.mq5  โดยสามารถ copy ไปยัง folder ของ Data Folder ซึ่งสามารถดูได้จากรูปด้านบน หรือเข้า menu File-> Open Data Folder และทำการ copy ทั้ง 2 file ไปยัง \MQL5\Experts ซึ่งจะเป็น folder ที่ใช้เก็บ EA ทั้งหมดเพื่อนำมาใช้งาน

 

Support Vector Machine คืออะไร

Support Vector Machine เป็นตัวแบบที่ใช้ในการระบุตัวบุคคลหรือ object  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์เป็นตัวแบบที่ใช้ในการระบุตัวบุคคล  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม

ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์ ตัวแบบของ SVM มีความคล้ายคลึงกับเพอร์เซฟตรอนซึ่งเป็นข่ายงานประสาทเทียมแบบง่ายมีหน่วยเดียวที่จำลองลักษณะของเซลล์ประสาท  ด้วยการใช้ Kernal Function

โดยใน paper ที่ตีพิมพ์เกี่ยวกับ SVM นั้นจะเรียกตัวแปรในการตัดสินใจว่า คุณสมบัติและตัวแปรที่เปลี่ยนแปลงใช้ในการกำหนดระนาบหลายมิติ ซึ่งเรียกว่า โครงสร้าง (feature)  ส่วนการเลือกที่มีความเหมาะสมที่สุดเรียกว่า โครงสร้างในการคัดเลือก (feature selection)  จำนวนเซตของโครงสร้างที่ใช้อธิบายในกรณีหนึ่ง (เช่น แถวของการค่าที่เราคาดการณ์)  เรียกว่า  เวกเตอร์ (vector)  ดังนั้นจุดมุ่งหมายของตัวแบบ SVM คือการประโยชน์สูงสุดจากระนาบหลายมิติที่แบ่งแยกกลุ่มของเวกเตอร์ในกรณีนี้ด้วยหนึ่งกลุ่มของตัวแปรเป้าหมายที่อยู่ข้างหนึ่งของระนาบ  และกรณีของกลุ่มอื่นที่อยู่ทางระนาบต่างกัน  ซึ่งเวกเตอร์ที่อยู่ข้างระนาบหลายมิติทั้งหมดนี้เราจะเรียกว่า  ซัพพอร์ตเวกเตอร์ (Support Vectors)

 

เราใช้ Support Vector Machine ในตลาดหุ้นอย่างไร

การวิเคราะห์ทางด้านเทคนิคนั้นอยู่บนพื้นฐานของการใช้ข้อมูลที่ผ่านมาเพื่อคาดการณ์การเคลื่อนไหวของราคาในอนาคต อย่างไรก็ดี ตลาดหุ้นนั้นมีความผันผวนมาก และ การใช้เพียงแค่ indicator อย่างเดียวนั้นอาจจะเกิดข้อผิดพลาดทางด้านสถิติได้ ซึ่งการนำ Machine Learning มาใช้งานร่วมกับ indicators ต่าง ๆ เหล่านี้นั้นทำให้เพิ่มในส่วนของการ training data เพื่อให้ SVM ได้ทำการเรียนรู้ และ ประเมินความแม่นยำของการเข้า trade ซึ่งการประเมินในเรื่องความแม่นยำในการ trade ผ่านการ training ก่อนนั้น ทำให้เราสามารถวิเคราะห์ได้ว่า ควรเข้า trade ใน strategy นั้น ๆ หรือไม่

สำหรับ process การทำงานของ SVM Library มีดังนี้

 

วิธีการ Generated Training Inputs

สำหรับตัว indicators หรือค่า Features ที่เราต้องการนำมาใช้เป็น input นั้น ใช้วิธีการ initial ค่าจาก period ที่คุณต้องการ

 

จากตัวอย่าง code แสดงค่า indicators  iBearsPower , iBullsPower , iATR , iMomentum , iMACD , iStochastic , iForce สำหรับเป็น input ที่ใช้ในการ training โดยจะใช้ function ตามตัวอย่าง code คือ genInputs(handleB)  สำหรับการ generate ค่าตั้งต้นของ indicators ต่าง ๆ ที่เราสนใจ

 

 

สำหรับค่า offset และ ค่า N_Datapoints นั้นจะแสดงตามตัวอย่างรูปข้างบน โดยจะพิจารณาตามแทงเทียนของ timeframe นั้น ๆ เช่น Offset = 4 คือ เราใช้ input ก่อนหน้าแท่งเทียนปัจจุบัน จำนวน 4 แท่งเทียน ส่วน N_Datapoints ตามตัวอย่างในรูป = 6 เราจะนำค่าจากแท่งเทียนอีก 6 แท่งเทียนก่อนหน้าค่า offset ไปทำการ generate input ซึ่งจำนวน N_Datapoints นั้นยิ่งมากก็จะใช้เวลาในการ training เพิ่มมากขึ้นไปด้วย ซึ่งจะมีผลต่อความแม่นยำหรือไม่นั้น ก็อาจจะตอบได้ทั้งสองคำตอบ คือ มี หรือ ไม่มีเลยก็ได้ ซึ่งเราต้องหาค่า N_Datapoints ที่เหมาะสมที่สุดสำหรับการ training เพื่อให้ความแม่นยำเกิดขึ้นสูงสุด

 

สำหรับส่วนของ onbar function นั้น คือ เมื่อเกิดแท่งเทียนใหม่ตาม timeframe ระบบก็จำค่า indicator ณ เวลานั้น ๆ มาทำการ classify หาว่าควรที่จะเข้าทำการซื้อหุ้น ณ ขณะนั้นหรือไม่ หาก Opn_B = true คือ ระบบ predict ให้ซื้อ

 

จาก onbar function หากระบบได้รับสัญญาณการเข้าซื้อก็จะเข้าสู่ function Open_Order เพื่อทำการซื้อผ่าน mt5 โดย Vol ก็คือจำนวนเงินที่จะใช้ในการเข้าซื้อ ซึ่งเราสามารถ set ในส่วนของ input data

 

สำหรับส่วนของ Insert_Stops นั้น เป็นการกำหนดจุด stopLoss และ จุดที่เราจะ takeProfit ซึ่ง จะมีหน่วยเป็น Pips  ซึ่งจะใช้กันในการ trade พวก currency หรือ commodity ซึ่งในหุ้นไทยนั้น ส่วนใหญ่จะหมายถึงการเคลื่อนของราคาที่ 0.01  ซึ่งหากเรา set ค่า takeProfit ไว้ที่ 100 pips คือ 0.01 * 100 = 1  ก็คือระบบจะปิดที่ ราคาปัจจุบัน + 1 บาท ถือเป็นจุด tp ของระบบ เช่นเดียวกับการ stoploss ก็ใช้หลักการเดียวกัน

 

ผลการทดสอบ

ผมได้ทำการทดสอบกับหุ้นไทยจำนวน 4 ตัวประกอบด้วย BDMS , BEAUTY , BH และ BMCL  ด้วย timeframe 15m  โดยใช้ offset ที่ 0 และ  N_DataPoints = 100 จุด takeprofit ที่ 100 pip และ stoploss ที่ 150 pip ด้วย indicators พื้นฐานตามที่ได้กล่าวข้างต้น ได้ผลการทดสอบดังนี้

1.BDMS

จากการ training นั้นได้ผลความแม่นยำที่ 78.0%

2.ฺBEAUTY

จากการ training ได้ผลความแม่นยำที่ 63.0%

3.ฺBMCL

จากการ training ได้ผลความแม่นยำที่ 50% ซึ่งถือว่าเทียบเท่าการโยนเหรียญ หัว-ก้อย

4.ฺBH

ถือว่าน่า surprise สำหรับ BH ที่ได้ค่าความแม่นยำจากการ training สูงถึง 87%

 

สรุป

จาก blog นี้นั้นเป็นการ guide ให้เห็นถึงแนวทางสำหรับการพัฒนา AI ที่ใช้ Machine Learning จริง ๆ เพื่อใช้ทดสอบความแม่นยำในการ prediction market trend ที่จะเกิดในอนาคต ซึ่ง จากตัวอย่างนั้นผมใช้เพียง indicators พื้นฐานเท่านั้นในการทดสอบความแม่นยำของ Support Vector Machine ซึ่งผลในหุ้นบางตัวอย่าง BH นั้นก็ถือว่าน่าสนใจไม่ใช่น้อยสำหรับควาแม่นยำที่สูงถึงระดับ 87% ซึ่ง ผมคิดว่าส่วนนี้เป็นแนวทางที่จะนำไปใช้พัฒนาต่อ สำหรับนักเทรดสายเทคนิคอล ที่มี strategy ที่ตัวเองนั้นถนัดอยู่แล้ว น่าจะลองมาใช้ machine learning เพื่อเพิ่มประสิทธิภาพในการ trade ดู ซึ่งผมคิดว่าน่าจะได้ผลที่ดีขึ้น

ซึ่งในส่วนของ Library ของ Support Vector Machine ใน MT5 นั้น ก็ได้ทำการปรับมาเพื่อใช้กับการ trade โดยเฉพาะ ทำให้สามารถใช้งานได้อย่างไม่ยาก แต่เราอาจจะ customise ได้ดั่งใจเราไม่มากเท่าที่ควร แต่หากต้องการการทำงานในระดับ Advance นั้นผมก็แนะนำให้ใช้เทคนิค การ call LIBSVM โดยอาจจะเรียกผ่าน Web Service หรือ http protocol  ซึ่งเราอาจจะสามารถ customise ได้มากกว่า และอาจจะให้ผลความแม่นยำที่สูงกว่า เหมือนงานวิจัยหลาย ๆ ชิ้นที่ผ่านมา

ส่วนค่า features หรือ input นั้น เราอาจจะไม่ได้ใช่แค่ indicators มาตรฐานมาใช้ในการ train เท่านั้น เราอาจจะสามารถกำหนด features ที่ต้องการเอง ตาม Strategy การเทรดของเรา ซึ่งคิดว่าหลาย ๆ ท่านนั้นก็น่าจะมี strategy การเทรดที่แตกต่างกัน หรือมีการพลิกแพลงค่าต่าง ๆ เช่นเส้น trend line หรือ เส้นแนวรับ แนวต้าน ก็เป็นสิ่งที่สามารถนำมาเป็น input ได้ ส่วนเรื่องข่าวก็เป็นสิ่งที่น่าสนใจที่จะสามารถนำมาใช้เป็น features ได้ ดังตัวอย่าง การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว ซึ่งผมคิดว่า AI ที่ใช้ Machine Learning นั้นจะมีบทบาทต่อวงการเทรดหุ้นของประเทศไทยอย่างแน่นอน อย่างที่หลาย ๆ บริษัทได้เริ่มพัฒนา AI ที่ใช้ในการ trade แล้ว ซึ่งต่อไปนั้น เราอาจจะไม่ได้แข่งกับแค่ ต่างชาติ หรือ นักลงทุนสถาบันเท่านั้น เหล่าเม่าตัวน้อย ๆ อย่างพวกเรา  อาจจะต้องสู้รบปรบมือกับกองทัพ AI ในเร็ววันนี้ก็เป็นไปได้

 

References : www.mql5.com,www.dailynews.co.th

 

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage : facebook.com/tharadhol.blog
Blockdit : blockdit.com/tharadhol.blog
Twitter : twitter.com/tharadhol
Instragram : instragram.com/tharadhol

Tencent กับมูลค่าที่ก้าวข้ามผ่าน facebook

ต้องยอมรับกันก่อนว่า บริษัททางด้านเทคโนโลยีจาก silicon valley ที่คิดจะเข้าไปเจาะตลาดจีนนั้นเป็นเรื่องไม่ง่าย เนื่องมาจากปัจจัยหลายประการ ทั้งทางด้านวัฒนธรรม รวมถึง รูปแบบการปกครอง และ นโยบายของรัฐจีนนั้น ค่อนข้างกีดกัน บริษัทจากทางฝั่งตะวันตก

มีบริษัทน้อยรายที่ประสบความสำเร็จในตลาดจีนได้เช่น apple แต่มีบริษัทมากมายที่ต้องมาตกม้าตายที่ตลาดจีน ทั้ง google ,ebay , amazon หรือรายล่าสุดอย่าง Uber ที่ต้องถอยทัพหนีจากตลาดจีนไปเมื่อไม่นานมานี้

ทำให้บริษัทเจ้าถิ่นสามารถที่จะสร้างตัวขึ้นมาได้อย่างรวดเร็วในทศวรรษหลัง ทั้ง ยักษ์ใหญ่อย่าง Alibaba ที่นำโดย Jack Ma , Baidu เจ้าพ่อ search engine จากจีน รวมถึงบริษัทที่เราจะกล่าวถึงใน blog นี้อย่าง Tencent ซึ่งแม้จะมีข่าวน้อย แต่ก็ทำรายได้เป็นอันดับหนึ่งในจีน แซงหน้า Alibaba ไปเป็นที่เรียบร้อยแล้ว

ถ้าพูดถึง Tencent ก็ต้องกล่าวถึง Wechat บริการด้านการ chat ที่ครอบครองตลาดจีนได้อย่างเบ็ดเสร็จ ซึ่งเป็นต้นทางของบริการหลาย ๆ อย่างของ Tencent ทั้งระบบ E payment หรือ เกมส์ ที่เป็นรายได้หลักของบริษัทในขณะนี้ และลงทุนในบริษัททางด้านเทคโนโลยีต่าง ๆ ทั้งในและต่างประเทศอีกมากมาย

ซึ่งผมก็เคยเขียน blog เกี่ยวกับ tencent ไว้ก่อนหน้านี้ ซึ่งตอนนี้นั้น มูลค่าของ tencent ได้มีมูลค่า Market Value แซง facebook ยักษ์ใหญ่ทางด้าน social network จากอเมริกาเป็นที่เรียบร้อยแล้ว โดยมูลค่าล่าสุดนั้นสูงถึง 528,000 ล้านดอลล่าร์  มากกว่า มูลค่า facebook ณ ปัจจุบันอยู่ 6 พันล้านดอลล่าร์

อาจจะเป็นการแซงเพียงชั่วคราวจากมูลค่าหุ้นที่เพิ่มขึ้นมา แต่ก็เป็นสิ่งที่น่าสนใจไม่น้อย เพราะบริษัทที่ติด Top Ten ของโลกนั้น ล้วนเป็นบริษัทใน silicon valley ซะเป็นส่วนมาก แต่การเข้ามาของ tencent นั้นสามารถเบียดบริษัทจากชาติตะวันตกขึ้นมาเป็นบริษัทที่มูลค่าติดอันดับต้น ๆ ของโลกได้

ซึ่งมีโอกาสสูงที่บริษัทอื่น ๆ เช่น Alibaba หรือ Baidu นั้นก็มีโอกาสที่จะขึ้นมาทาบรัศมีของบริษัทจาก silicon valley เช่นกันในอนาคตอันใกล้นี้ เนื่องจากการเติบโตของผู้ใช้งาน internet ในประเทศจีน รวมถึงการเกิดขึ้นของชนชั้นกลางอีกจำนวนมากในประเทศจีน ทำให้สามารถสร้างกำลังซื้อ รวมถึงการใช้บริการต่าง ๆ ที่บริษัทเทคโนโลยีของจีนเหล่านี้ให้บริการอยู่ ก็มีโอกาสที่จะทำให้บริษัทเหล่านี้รายได้เพิ่มสูงขึ้นไปอีกในอนาคตอันใกล้นี้

เราคนไทยก็ต้องหันมามองจีนใหม่ ตอนนี้จีนนั้นได้พัฒนาทางด้านเทคโนโลยี โดยเฉพาะด้าน internet ไปไกลแล้ว บริการต่าง ๆ ของจีนทั้ง e-commerce  ระบบ payment นั้นต้องยอมรับว่ามีการพัฒนา และใช้งานกันในชีวิตประจำวันของคนจีนเป็นปรกติแล้ว ซึ่งบางอย่างนั้นได้ก้าวล้ำกว่าชาติตะวันตกไปอีกด้วย

ซึ่งสิ่งเหล่านี้นั้นล้วนมาจากพื้นฐานทางด้านงาน R&D ของจีน ซึ่งวิศวกรชาวจีนนั้นก็ไม่ได้มีความสามารถด้อยไปกว่าชาวตะวันตกเลยด้วยซ้ำ จะเห็นได้ว่า paper ทางวิชาการต่าง ๆ ในปัจจุบันนั้น ส่วนใหญ่เป็นของชาวจีนมากกว่าทางตะวันตกแล้ว ซึ่งงานวิจัยเหล่านี้บ่งบอกได้ถึงแนวโน้มของเทคโนโลยีต่าง ๆ โดยเฉพาะด้านคอมพิวเตอร์นั้น มีโอกาสสูงที่บริษัทจากจีนนั้นจะมีนวัตกรรมที่แซงหน้าบริษัทจากตะวันตกไปได้อย่างแน่นอน

Image Ref : news.abs-cbn.com

 

 

 

การวิเคราะห์ Market Trend ของหุ้น โดยใช้ปัจจัยพื้นฐานด้านข่าว

ผมชอบอ่านงานวิจัยของต่างประเทศ ที่เกี่ยวข้องกับ Machine Learning หรือ AI เนื่องจากเคยผ่านงานด้านนี้มาบ้างดังที่ได้เคยเขียน blog Support Vector Machine กับการวิเคราะห์มะเร็งเต้านม  ซึ่ง AI น่าจะมีบทบาทมาก ๆ ในหลายๆ  ธุรกิจในอนาคตอันใกล้นี้

ซึ่ง Machine Learning นั้นก็ต้องส่วนหนึ่งของการพัฒนา AI ในปัจจุบัน ที่พัฒนาความสามารถให้มีความฉลาดเพิ่มมากยิ่งขึ้นจากการเรียนรู้ข้อมูล ที่มีจำนวนมหาศาลในปัจจุบัน ในวงการ trading ก็เป็นวงการหนึ่งที่คิดว่า AI น่าจะมีบทบาทสำคัญมาซักพักหนึ่งแล้ว ซึ่งหลาย ๆ คนอาจจะยังไม่ทราบว่าทุกวันนี้ เราไม่ได้ trade แข่งกับมนุษย์เท่านั้น เรายังต่อสู้กับ AI อีกจำนวนมาก ซึ่งทำให้เราเสียเปรียบเป็นอย่างมาก

งานวิจัยหลาย ๆ ปีก่อนหน้านี้นั้น เน้นไปที่การนำ Technical indicator ต่าง ๆ มาประมวลผล โดยใช้ Machine learning และทำการ prediction อนาคต  ซึ่ง หลาย ๆ งาน  ก็ได้ผลที่น่าสนใจเป็นอย่างยิ่ง แต่ความแม่นยำนั้นต้องบอกว่าถ้านำไปเทียบกับอย่างอื่น ถือว่าความแม่นยำนั้นยังน้อยอยู่มาก เนื่องจาก ภาวะตลาดมีความผันผวนสูง มีผู้เล่นมากหน้าหลายตา ทั้งกองทุนต่าง ๆ รวมถึงรายย่อย ทำให้ AI ไม่สามารถสร้างความแม่นยำในการ trade ได้

แต่ช่วง 2-3 ปีมานี้ เริ่มมีการวิจัยโดยใช้ทฤษฎีใหม่ ซึ่งนำเรื่องของการวิเคราะห์ข่าวสารมาเป็นปัจจัยหลักแทน เพราะ ข่าวสารนั้นมีผลกระทบต่อจิตวิทยาการเทรดของนักลงทุน โดยตรง นัก trade หลาย ๆ คนซื้อตามข่าว ขายตามข่าว ทำให้ข่าวค่อนข้างมีปัจจัยสำคัญต่อราคาหุ้น เป็นอย่างมาก

แต่การวิเคราะห์เรื่องข่าวนั้น ไม่ได้เป็นสิ่งที่ง่ายเลย เผอิญ ผมได้ไปเจองานที่น่าสนใจ คือ Stock Trend Prediction Using News Sentiment Analysis  ซึ่งเป็นการศึกษาที่ใช้รูปแบบของ News Sentiment Analysis หรือการวิเคราะห์ข่าวเป็นปัจจัยที่จะส่งผลต่อการทำนายราคาขึ้นลงของหุ้นในวันถัดไป ซึ่งปัจจุบันนั้น นักลงทุนมีรูปแบบการทำนาย Market Trends ของตลาดในสองรูปแบบหลักคือ การวิเคราะห์ทางด้านเทคนิคอล โดยใช้ indicator ข้อมูลต่าง ๆ ส่วนอีกรูปแบบคือ การวิเคราะห์ปัจจัยพื้นฐานของหุ้น

โดยในงานวิจัยนี้ จะ follow ตามรูปแบบของการวิเคราะห์ปัจจัยพื้นฐาน ในการทำนาย future trend ของหุ้นนั้น ๆ โดยจะพิจารณาจาก ข่าวที่มีผลกระทบต่อหุ้นตัวนั้น ๆ เป็นหลัก และ ใช้ computer algorithm ในการแบ่งประเภทของข่าว ว่าเป็นข่าวที่ดี หรือ ข่าวที่แย่ ต่อหุ้นนั้น ๆ โดยนำเสนอว่า หาก เป็นข่าวดี ก็จะมีโอกาสทำให้หุ้นตัวนั้นขึ้น แต่หากในทางตรงกันข้ามที่เป็นข่าวแย่ ๆ ก็จะทำให้หุ้นตัวนั้นลง ตรงนี้ฟังดูเหมือนจะง่าย แต่การทำจริงนั้นยาก ๆ มาก ๆ เพราะ ข่าวมาจากหลายแหล่งหลายข่าวสาร รวมถึง วิธีการวิเคราะห์เนื้อหาของข่าวนั้นก็เป็นปัจจัยหลักที่จะแบ่งแยกว่าเป็นข่าวดีหรือข่าวร้าย ซึ่งการใช้คนอ่านนั้น ก็อาจจะไม่ยากเท่าไหร่ แต่สำหรับ AI นั้นเราจะทำอย่างไรในการแยกข้อมูลเหล่านี้ที่มีอยู่จำนวนมหาศาล

 

System Design

งานวิจัยได้แบ่งการ design เป็น 3 phases โดยใน phase แรกนั้นจะเป็นส่วนของการวิเคราะห์ข่าว เพื่อหา Polarity Score เพื่อเป็น input ให้กับ phase 2 โดยที่ ใน phase 2 นั้นจะนำ document มา converted เป็น tf-idf vector space เพื่อให้สามารถทำการจำแนกข้อมูลได้   โดยจะใช้ เทคนิคในการทำจำแนกข้อมูล 3 แบบคือ Random Forest , Naive Bayes  และ SVM หรือ Support Vectore Machine ที่ผมเคยกล่าวถึงใน blog ก่อนหน้านั่นเอง การใช้ถึง 3 เทคนิค นั้นก็เพื่อวัด performance ว่าเทคนิคไหนจะให้ความแม่นยำสูงสุด

ส่วน phase สุดท้ายนั้น จะทำการเช็คความสัมพันธ์ระหว่าง ข่าว และ ราคาหุ้น โดยจะใช้การ plot ข้อมูลทั้งสองโดยจะใช้ภาษา R

News Collection

ผู้วิจัยได้ใช้ข้อมูลของ บริษัท Apple โดยจะเก็บข้อมูลย้อนหลัง 3 ปี ตั้งแต่ 1 กุมภาพันธ์ ปี 2013 ถึง 2 เมษายน ปี 2016  โดยข้อมูลนั้นจะรวมถึง ข่าวจาก events หลัก ๆ ทั้งหมดของ apple รวมถึงราคาหุ้นของ AAPL ในช่วงเวลาเดียวกัน  โดยข้อมูลของหุ้นนั้นจะประกอบด้วย 6 ข้อมูลหลัก คือ Open , High , Low , Close , Adjusted Close และ Volume  โดยข้อมูลของข่าวหลัก ๆ นั้นจะมาจากหลาย ๆ สื่อที่เป็นข้อมูล online เช่น  news.google.com , reuters.com finance.yahoo.com

Pre Processing

ซึ่งจากข้อมูลของข่าว ที่เป็น text data นั้นจะเป็นข้อมูลที่ไม่มีโครงสร้าง จึงไม่สามารถที่จะนำเอาข้อมูลดิบเหล่านี้ไปทำการจำแนกได้  ซึ่งข้อมูลดิบเหล่านี้นั้นจะประกอบไปด้วยข้อความขยะเป็นจำนวนมาก งานวิจัยนี้จึงต้องทำการตัดข้อความที่เป็นขยะเหล่านี้ออก เพราะจะไม่มีผลต่อการจำแนก โดยงานวิจัยจะนำเฉพาะส่วนของข้อความจากข่าวที่มีความเกี่ยวข้องกับข้อมูลทางด้านการเงิน

โดยใช้ข้อมูลอ้างอิงจาก  McDonald’s research  ซึ่งได้ทำการวิจัยข้อมูลที่เกี่ยวข้องกับ finance ไว้เป็นทีเรียบร้อยแล้ว ซึ่งจะตัดเหลือข้อมูลที่เกี่ยวข้องกับหุ้นจริง ๆ เช่น  วันที่ ตัวเลข ต่าง ๆ รวมถึง สกุลเงิน  และเพื่อหลีกเลี่ยง คำบางคำ ที่มีความหมายเดียวแต่ใช้ในหลายเหตุการณ์ เช่น คำว่า ‘developed’ , ‘development’ , ‘developing’ นั้นจะถูกทำให้กลายเป็นคำ ๆ เดียวคือ ‘develop’

Sentiment Detection Algorithm

สำหรับการวิเคราะห์ว่าข่าวใดจะเป็นข่าวดี หรือ ข่าวร้าย ให้ได้แบบอัตโนมัติ หรือ sentiment detection นั้น ทางงานวิจัยนั้นใช้ dictionary จากงานวิจัยของ J.Bean ที่เคยทำการวิเคราะห์โดยนำข้อมูลจาก twitter มาใช้ในการวิเคราะห์ทรรศนะคติที่มีต่อสายการบินผ่านข้อมูลจาก feed ใน twitter

ซึ่งการที่จะวิเคราะห์ว่าข่าวจาก article ไหนเป็นข่าวดีหรือข่าวร้ายนั้น ต้องแบ่งคำเป็น 2 ประเภท คือ positive words และ negative words  และทำการนับรวมคำทั้งสองประเภท เพื่อทำการคำนวณ score จากข่าวนั้น ๆ ซึ่งจากข้อมูลของ McDonald’s research ทางผู้วิจัยได้สร้าง dictionary ที่มีคำที่เป็น positive words จำนวน 2360 คำ และ คำที่เป็น negative words จำนวน 7383 คำ โดยการคำนวน score นั้นก็จะนำเอา ผลรวมของ positive words ลบด้วย ผลรวมของ negatives words ในข่าวนั้น ๆ ซึ่ง หาก score มากกว่า 0 นั้น ก็สามารถ assume ได้ว่าข่าวนั้นเป็นข่าวดี  แต่หาก score น้อยกว่า 0 ก็สามารถ assume ได้ว่า ข่าวนั้น ๆ เป็นข่าวร้ายหุ้นที่เราทดสอบ (AAPL)

Classifier Learning

งานวิจัยนี้ได้ใช้ 3 เทคนิค ตามที่ได้กล่าวข้างต้นคือ Support Vector Machine , Random Forest และ Naive Bayes เป็นเทคนิคในการใช้จำแนก ซึ่ง การใช้ 3 เทคนิค ก็เพื่อทำการวัด performance ว่าเทคนิคไหนได้ความแม่นยำสูงที่สุด เมื่อทำการทดสอบกับข้อมูลใหม่

EVALUATION

งานวิจัยนี้ได้ทำการทดสอบ model ด้วยเทคนิคการทดสอบหลาย ๆ แบบ และในหลายเงื่อนไข เพื่อเปรียบเทียบผล โดยประกอบไปด้วย

  • 5-fold cross validation
  • 10-fold cross validation
  • 15-fold cross validation
  • 70% Data split
  • 80% Data split
  • New testing data

 

Figure1 three classifiers against different test options

Figure2 result with new data

 

Figure3 news sentiment score vs stock price

CONCLUSION

การที่จะทำนาย Market Trend ของราคาหุ้นนั้น เป็นสิ่งที่ยากมาก ๆ เพราะขึ้นอยู่กับหลายปัจจัย ซึ่งงานวิจัยนี้ได้สำเสนอในส่วนของปัจจัยพื้นฐานด้านข่าวที่มีผลกระทบต่อราคาหุ้น  ซึ่งจากผลการทดสอบนั้นจะพบว่าปัจจัยเรื่องข่าวนั้นเป็นปัจจัยที่สำคัญอย่างนึง ในการขึ้นลงของหุ้น  ซึ่งข่าวที่ดี หรือ แย่ นั้น การใช้ AI ในการแยกแบบ Automatic นั้นสามารถทำได้ โดยใช้เทคนิค ตามที่กล่าวข้างต้น  ข่าวที่ดีนั้นมีโอกาสสูงที่จะทำให้หุ้นราคาขึ้น ซึ่งตรงข้ามหากเป็นข่าวที่แย่ นั้นก็มีโอกาสสูงเช่นกันที่จะทำให้หุ้นราคาตก

สิ่งสำคัญอีกอย่างนึงที่จะวัดว่าเป็นข่าวดีหรือข่าวแย่ นั้น ข้อมูลจาก dictionary ตามงานวิจัยข้างต้นนั้นก็เป็นสิ่งสำคัญ การใช้ reference ของงานวิจัยที่ผ่านการทดสอบมาแล้วนั้น ทำให้ผลการทดสอบนี้มีประสิทธิภาพมากยิ่งขึ้น รวมถึงการลบข้อความที่เป็นขยะ ออกจากข่าว ซึ่ง มีผลกระทบต่อความแม่นยำในการจำแนกให้มีประสิทธิภาพ เพราะฉะนั้น ต้องใช้หลาย ๆ งานวิจัยที่เกี่ยวข้องร่วมกันเพื่อให้ผลการจำแนกดีที่สุด และผลจากการทดลองการจำแนกโดยใช้ 3 เทคนิค นั้น เทคนิค Random Forest สามารถจำแนกได้ผลแม่นยำสูงสุดในทุก test case โดยมีความแม่นยำสูงถึงระดับ 88% – 92%  โดยอันดับ 2 คือ Support Vector Machine ที่ให้ความแม่นยำประมาณ 86%  ส่วนเทคนิค Naive Bayes นั้นให้ความแม่นยำอยู่ที่ประมาณ 83%

แต่พอมาลอง test กับข้อมูลชุดใหม่นั้น จะพบว่า Support Vector Machine นั้นให้ความแม่นยำสูงถึง 90%  ตามมาด้วย Random Forest ที่ 80% และรั้งท้ายที่ Naive Bayes ที่ 75%  ซึ่ง โดยสรุปนั้นเราก็สามารถสรุปได้ว่า ข่าว เป็นปัจจัยหลัก ปัจจัยนึง ที่มีผลกระทบต่อราคาหุ้น อย่างแน่นอน ซึ่งเราสามารถนำข้อมูลเหล่านี้มาทำการวิเคราะห์และทำนาย Trend ที่จะเกิดขึ้นกับราคาหุ้น ๆ ที่เราสนใจได้ ซึ่งหากเราจะนำมาปรับใช้กับหุ้นไทยนั้น ก็คงจะต้องปรับกันพอสมควรโดยเฉพาะหากข่าวที่เป็นภาษาไทย ซึ่งไม่สามารถที่จะใช้การทดลองแบบนี้ได้แน่นอน แต่หากข่าวที่เป็นภาษาอังกฤษ นั้น คิดว่าผลน่าจะได้ใกล้ ๆ เคียงกัน ซึ่งก็เป็นสิ่งที่น่าสนใจที่จะมาทดสอบกับหุ้นไทยเหมือนกัน เพราะ เทคนิคต่าง ๆ ที่กล่าวในงานวิจัยนั้น สามารถนำมาใช้ได้ เพราะมีการ open ทั้งหมด ทั้ง เทคนิคการจำแนกอย่าง Support Vector Machine ก็สามารถโหลดมาใช้ได้ รวมถึง การใช้ Sentiment Detection Algorithm นั้นเราก็สามารถนำมันมา implement กับหุ้นไทยเพื่อทดสอบ model ข้างต้นได้

 

References :   arxiv.orgmotherboard.vice.com