เมื่อ AI เข้ามาเปลี่ยนสนามรบ ยูเครนใช้ AI ต่อสู้กับรัสเซียอย่างไร

ความน่าสนใจของสงครามยุคใหม่ที่กำลังบังเกิดขึ้นทั่วโลกในขณะนี้ คงหลีกหนีไม่พ้นเทคโนโลยีใหม่ ๆ ที่กำลังเข้ามาบทบาทมากยิ่งขึ้นโดยเฉพาะเทคโนโลยีด้าน AI

เราได้เห็นภาพความเปลี่ยนแปลงที่ชัดเจนเริ่มขึ้นในสงครามระหว่างยูเครนและรัสเซียที่ดูเหมือนจะยืดเยื้อมานาน หรือสิ่งที่เกิดขึ้นในสถานการณ์การสู้รบในพม่าในตอนนี้ เรากำลังเห็นภาพโลกสงครามในอนาคตว่าผู้ที่มีกำลังทหารที่เยอะกว่าไม่ได้หมายถึงว่าจะชนะในการรบยุคใหม่เสมอไป

มันกลายเป็นว่าจุดชี้ขาดชี้เป็นชี้ตายของสงครามวัดกันด้วยเทคโนโลยีล้วน ๆ ที่ทำให้ทุกอย่างมันมีความแม่นยำมากยิ่งขึ้น โดยใช้กำลังพลหรืออาวุธยุทโธปกรณ์ที่น้องลง

ในช่วงก่อนที่ยูเครนจะโจมตีด้วยจรวดเข้าใส่สะพานอันโตนอฟสกี้ ซึ่งเป็นสะพานสำคัญที่เชื่อมต่อระหว่างเมืองเคอร์ซอนที่ถูกรัสเซียยึดครองไปยังฝั่งตะวันออกของแม่น้ำดนีปโร

เจ้าหน้าที่ด้านความมั่นคงของยูเครนได้ศึกษารายงานพิเศษอย่างรอบคอบ ในช่วงฤดูร้อนของปี 2022 ในขณะที่รัสเซียพึ่งพาสะพานนี้เป็นอย่างมากในการเติมสเบียงและกองหนุนให้กับกำลังทหารฝั่งตะวันตกของแม่น้ำดนีปโร

สะพานอันโตนอฟสกี้ ซึ่งเป็นสะพานสำคัญที่เชื่อมต่อระหว่างเมืองเคอร์ซอนที่ถูกรัสเซียยึดครองไปยังฝั่งตะวันออกของแม่น้ำดนีปโร (CR:Structurae)
สะพานอันโตนอฟสกี้ ซึ่งเป็นสะพานสำคัญที่เชื่อมต่อระหว่างเมืองเคอร์ซอนที่ถูกรัสเซียยึดครองไปยังฝั่งตะวันออกของแม่น้ำดนีปโร (CR:Structurae)

โดยรายงานดังกล่าวนี้ศึกษาถึงสองเรื่องที่สำคัญก็คือ : การทำลายสะพานจะทำให้ทหารรัสเซียขวัญเสียหรือไม่ ? และที่สำคัญกว่านั้นรัฐบาลยูเครนจะทำอย่างไรเพื่อให้แผนการนี้ส่งผลกระทบอย่างรุนแรงต่อขวัญและกำลังใจของศัตรูอย่างรัสเซีย ?

และนั่นคือวิธีที่ Sviatoslav Hnizdovsky ผู้ก่อตั้ง Open Minds Institute (OMI) ในกรุงเคียฟ อธิบายถึงงานวิจัยที่หน่วยงานของเขาได้ทำมา

พวกเขาใช้การประเมินสิ่งต่าง ๆ ผ่านเทคโนโลยี AI ซึ่งอัลกอริธึมได้ทำการค้นหาข้อมูลจำวนมหาศาลในโลกโซเชียลมีเดียของรัสเซีย หรือแม้กระทั่งข้อมูลทางด้านเศรษฐกิจ ตั้งแต่การบริโภคแอลกอฮอล์และการเคลื่อนย้ายประชากรไปจนถึงการค้นหาบนโลกออนไลน์

AI จะเชื่อมโยงการเปลี่ยนแปลงดังกล่าวกับความรู้สึกที่เปลี่ยนไปของชาวรัสเซียต่อความทุกข์ยากที่เกิดขึ้นกับทหารแนวหน้าของพวกเขา

ต้องบอกว่างานวิจัยชิ้นนี้มีความสำคัญมาก ๆ ต่อยุทธศาสตร์การรบของยูเครน ซึ่งการโจมตีสะพานเคิร์ชที่เป็นเส้นทางลำเลียงทางบกเพียงเส้นทางเดียวระหว่างรัสเซียและไครเมีย

และสิ่งที่น่าสนใจก็คือเทคโนโลยีที่กำลัง hot hit อย่าง ChatGPT เองมันก็กำลังถูกใช้ในแวดวงสงครามแบบเต็มตัวเช่นเดียวกัน

ยูเครนซึ่งถ้าเทียบด้านสรรพกำลังทั้งทางอาวุธและกองกำลังทหารนั้นมีความเสียเปรียบรัสเซียอยู่มาก

พวกเขาจึงมองหาช่องทางการใช้ AI ในรูปแบบต่าง ๆ โดยทหารยูเครนที่เกี่ยวข้องกับการพัฒนาอาวุธได้กล่าวว่า ผู้ออกแบบโดรนมักจะใช้ ChatGPT เป็นจุดเริ่มต้นในการหาแนวคิด เช่น เทคนิคใหม่ ๆ เพื่อลดศักยภาพของทางฝั่งรัสเซีย

การใช้ AI อีกรูปแบบหนึ่งของทหารยูเครนคือการกำหนดเป้าหมาย ในขณะที่เหล่าทหารและบล็อกเกอร์ด้านทหารมีความระมัดระวังมากขึ้นในการโพสต์สิ่งต่าง ๆ เกี่ยวกับสงคราม

การใช้ ChatGPT กับโดรนเพื่ออกแบบวิธีใหม่ ๆ (CR:Analytic Insight)
การใช้ ChatGPT กับโดรนเพื่ออกแบบวิธีใหม่ ๆ (CR:Analytic Insight)

และด้วยการที่มีการนำเข้าภาพและข้อความจำนวนมากผ่านโลกออนไลน์ ทำให้ AI สามารถค้นพบเบาะแสที่อาจเป็นไปได้ และนำมาวิเคราะห์ตำแหน่งที่ตั้งของระบบอาวุธและกองกำลังของรัสเซีย

Molfar บริษัทด้านข่าวกรอง ซึ่งมีสำนักงานในเมืองดนีโปรและกรุงเคียฟสามารถค้นพบเป้าหมายทางการทหาร 2-3 เป้าหมายต่อวัน และส่งข่าวสารไปให้กองทัพยูเครนอย่างรวดเร็ว ทำให้บางเป้าหมายได้ถูกทำลายลงไป

การระบุเป้าหมายยังได้รับการช่วยเหลือจาก AI ในรูปแบบอื่น ๆ SemanticForce บริษัทที่มีสำนักงานอยู่ในกรุงเคียฟและเมืองเทอร์โนพิล พัฒนาแบบจำลองที่สามารถตรวจสอบข้อความและรูปภาพออนไลน์ คล้ายกับบริการด้าน Social Listening

เดิมทีระบบดังกล่าวใช้สำหรับลูกค้าองค์กรธุรกิจเพื่อเฝ้าระวังและคอย monitor ความรู้สึกของสาธารณะชนที่มีต่อแบรนด์ของตน

ในขณะที่ Molfar ใช้แบบจำลองดังกล่าวเพื่อกำหนดพื้นที่ที่กำลังทหารของรัสเซียน่าจะมีขวัญและกำลังใจตกต่ำ ซึ่ง AI จะทำการค้นหาเบาะแสต่าง ๆ จากภาพซึ่งรวมถึงจากกล้องของโดรนและจากข้อความของทหารรัสเซียที่ทำการบ่นบนโซเชียลมีเดีย

Molfar ใช้ AI ของ SemanticForce เพื่อคอย monitor เกี่ยวกับกิจกรรมของกลุ่มอาสาสมัครรัสเซียที่คอยระดมทุนและเตรียมเครื่องไม้เครื่องมือต่าง ๆ สำหรับแนวหน้าของสงครามที่กำลังขาดแคลน

บางครั้งทีมวิเคราะห์ก็ใช้ซอฟต์แวร์ที่ปลอมแปลงเสียงเพื่อโทรหากลุ่มอาสาสมัครเหล่านี้ และแสร้งเป็นคนรัสเซียที่ต้องการบริจาค

มีการใช้ AI ของบริษัทจากอเมริกาอย่าง Palantir ของ Peter Thiel ที่เป็นการวิเคราะห์ข่าวกรองเชิงลึก ที่สามารถหาความเชื่อมโยงจากชุดข้อมูลที่แตกต่างกัน เช่น ข้อมูลของชายผู้หย่าร้างที่มีหนี้สิน และเสี่ยงที่จะเสียบ้านและสิทธิในการเลี้ยงดูบุตร เขาได้เปิดบัญชีธนาคารในต่างประเทศ และถูกพบว่าสัญญาณโทรศัพท์อยู่ใกล้แหล่งที่มีการโจมตีด้วยจรวดในภายหลัง

Palantir ของ Peter Thiel นักลงทุนชื่อดังของ silicon valley (CR:WSJ)
Palantir ของ Peter Thiel นักลงทุนชื่อดังของ silicon valley (CR:WSJ)

นอกจากนี้ยังมีการเชื่อมโยงส่วนต่าง ๆ AI จะทำการวิเคราะห์เครือข่ายทางสังคม หากชายคนนั้นมีความสัมพันธ์ส่วนตัวที่ใกล้ชิดกับรัสเซีย และเริ่มรับสายจากบุคคลที่มี Profile ที่สูงกว่า AI ก็จะเพิ่มระดับความเสี่ยงให้กับชายคนดังกล่าวทันที

ต้องบอกว่าการใช้เทคโนโลยี AI ของยูเครนนั้นมีการพัฒนามาอย่างต่อเนื่อง Volodymyr Zelensky ประธานาธิบดีของยูเครนได้สั่งลุยให้มีการพัฒนาการใช้เทคโนโลยีในด้านความมั่นคงแห่งชาติในเดือนพฤศจิกายน 2019

ผลที่ได้คือ แบบจำลองการรบที่มีกลยุทธ์ ซึ่งถูกสร้างและใช้งานโดยกลุ่มผู้นำทางด้านการทหารตัวจริงเสียงจริงผ่านทางศูนย์ที่เรียกว่า ศูนย์ปฏิบัติการประเมินภัยคุกคามแห่งชาติ (COTA) ซึ่งจะได้รับข้อมูลต่าง ๆ ไม่ว่าจะเป็น ข้อความ สถิติ ภาพถ่าย และวีดีโอ ซึ่งข้อมูลบางส่วนอาจจะได้จากการโจรกรรมข้อมูลมา

ผู้ที่ควบคุมศูนย์ COTA จะเรียกแบบจำลองทางข้อมูลเหล่านี้ว่า “constructor” และยังได้รับแบบจำลองจากแหล่งอื่น ๆ เช่น ซอฟต์แวร์ของ Plantir และ Delta ซึ่งเป็นซอฟต์แวร์ในสนามรบที่ช่วยสนับสนุนการตัดสินใจในการเคลื่อนทัพของกองทัพยูเครน

มันทำกองทัพยูเครนมองเห็นภาพใหญ่ที่ชัดเจนของสงคราม ซึ่ง ข้อมูลจาก COTA นั้นจะให้คำแนะนำแก่เจ้าหน้าที่ระดับสูงในประเด็นที่อาจมีความอ่อนไหว เช่น เรื่องการระดมพลเพิ่มเติม

Zelensky ประธานาธิบดีของยูเครนได้รับคำแนะนำจาก COTA มากกว่า 30 ครั้ง ซึ่งครั้งล่าสุดเป็นวันที่รัสเซียบุกโจมตีอย่างเต็มรูปแบบ

ความพยายามด้าน AI ของยูเครนได้รับประโยชน์จากการมีส่วนร่วมในสังคมที่มีการสนับสนุนข้อมูลเพื่อการสงคราม เหล่าพลเมืองพร้อมใจกันอัปโหลดภาพที่มีค่าพิกัดทางภูมิศาสตร์ ซึ่งอาจเป็นประโยชน์ต่อการป้องกันประเทศของพวกเขาลงในแอปพลิเคชันที่มีชื่อว่า Diia หรือฟากฝั่งธุรกิจเองก็มีการส่งข้อมูลการดำเนินงานต่าง ๆ ที่เกี่ยวข้องไปให้กับ Mantis Analytics บริษัทในเมืองลวิฟ

สุดท้ายก็ต้องมาดูผลลัพธ์เมื่อตอนจบสงครามว่าการใช้เทคโนโลยีทั้งหมดเหล่านี้ที่ยูเครนกำลังผลักดันสงครามยุคใหม่ มันจะมีประสิทธิภาพเหนือรูปแบบทางการทหารเก่า ๆ ได้จริงแท้แค่ไหน

เพราะมีข้อโต้แย้งจากบางหน่วยงานเช่น Evan Platt จาก Zero Line องค์กรไม่แสวงหาผลกำไรในกรุงเคียฟที่ทำการจัดหายุทโธปกรณ์ให้กับเหล่าทหารเช่นเดียวกัน และใช้เวลาอยู่แนวหน้าเพื่อศึกษาประสิทธิภาพในการใช้ AI ช่วยเหลือในการรบครั้งนี้

เขาอธิบายการใช้ AI ของยูเครนว่าเหมือนเป็นเทคโนโลยีที่ช่วยจุดประกายความหวังให้กับยูเครนแม้จะดูมีสรรพกำลังที่ห่างชั้นจากรัสเซียก็ตาม แต่ก็มีข้อกังวลบางอย่าง หนึ่งในนั้นคือ การผลักดันเทคโนโลยี AI มากจนเกินไปอาจทำให้มีการจัดสรรทรัพยากรด้านอื่น ๆ ที่ดูเหมือนจะคุ้มค่ากว่าถูกตัดทิ้งไป

ความเชื่อมั่นมากเกินไปใน AI ก็ถือเป็นความเสี่ยง และแบบจำลองที่ได้จากการประมวลผลด้วยเทคโนโลยี AI บางอย่างนั้นให้ข้อมูลที่หลอกลวงอย่างแน่นอน ซึ่งอาจจะส่งผลในแง่ลบต่อประสิทธิภาพการรบของยูเครนได้เช่นเดียวกัน

References :
https://time.com/6691662/ai-ukraine-war-palantir/
https://www.economist.com/science-and-technology/2024/04/08/how-ukraine-is-using-ai-to-fight-russia
https://www.globalgovernance.eu/publications/how-ukraine-uses-ai-to-fight-russian-information-operations

Amazon Echo จากฝันสู่ความเป็นจริงในการสร้างคอมพิวเตอร์ Star Trek ของ Jeff Bezos

เฉกเช่นเดียวกับโปรเจกต์อื่น ๆ อีกหลายโปรเจกต์ที่ Amazon ได้ทำการสร้างสรรค์ออกมา ต้นกำเนิดของโปรเจกต์ Doppler (ชื่อแรกของ Echo) ต้องย้อนกลับไปที่การพูดคุยระหว่าง Jeff Bezos และทีมที่ปรึกษาทางด้านเทคนิคของเขา

และชายที่ปรึกษาคนสำคัญของ Bezos ในช่วงระหว่างปี 2009 ถึง 2011 คือ Greg Hart ผู้บริหารของ Amazon ซึ่งมีประสบการณ์ในธุรกิจค้าปลีกช่วงแรก ๆ ของการก่อตั้งบริษัท

Hart ได้พูดคุยกับ Bezos เกี่ยวกับเทคโนโลยี speech recognition ในช่วงปลายปี 2010 ที่ Blue Moon Burgers ในซีแอตเทิล

Hart ได้โชว์ศักยภาพของเทคโนโลยีการค้นหาด้วยเสียงของ Google บนโทรศัพท์ Android ให้ Bezos ดู แต่ตัวของ Bezos ยังสงสัยในเทคโนโลยีดังกล่าวนี้ว่ามันจะ work บนมือถือจริง ๆ หรือ

ในช่วงเวลาเดียวกันนั้นธุรกิจคลาวด์ของ Amazon กำลังเติบโตแบบฉุดไม่อยู่ Bezos เองก็พยายามสรรหาวิธีว่าจะทำอะไรเพื่อช่วยเหลือเทคโนโลยี AWS (บริการคลาวด์ของ Amazon) ได้บ้าง

ด้วยแรงบันดาลใจในการสนทนากับ Hart และคนอื่น ๆ เกี่ยวกับเรื่องเทคโนโลยี speech recognition ตัว Bezos เองก็เริ่มปิ๊งไอเดียโดยได้ส่งอีเมลไปยังทีมผู้บริหารระดับสูงของบริษัทในหัวข้อที่ว่า

“เราควรสร้างอุปกรณ์ราคา 20 เหรียญสหรัฐที่มีสมองอยู่ในนั้น ระบบคลาวด์ที่ถูกควบคุมด้วยเสียงมันจะ perfect มาก!!!”

Bezos และเหล่าพนักงานหัวกะทิของเขาถกเถียงเรื่องนี้กันอย่างเมามันใน mailing list ยิ่งคุยกันไอเดียมันก็เริ่มพรั่งพรู ถึงขั้นที่ว่า Bezos ต้องจดไอเดียของตัวเขาเองไว้บนไวท์บอร์ด

เกณฑ์ปรกติที่ Bezos มักจะใช้ในการประเมินโอกาสทางธุรกิจใหม่ ๆ ประกอบด้วย : มันจะเติบโตกลายเป็นธุรกิจขนาดใหญ่ได้หรือไม่? , ถ้าเราไม่รีบชิงโอกาสทำซะตอนนี้จะพลาดไหม?

ในที่สุด Bezos และ Hart ก็ขีดฆ่ารายการทั้งหมด ยกเว้นเพียงสิ่งเดียวตามแนวคิดของ Bezos นั่นก็คือ “คอมพิวเตอร์คลาวด์ที่สั่งงานด้วยเสียง”

และก่อนที่พวกเขาจะแยกย้าย Bezos ได้แสดงแนวคิดของเขาเกี่ยวกับคอมพิวเตอร์เสียงแบบไร้หน้าจอบนไวท์บอร์ด

มันฉายภาพให้เห็นอุปกรณ์ Alexa เป็นครั้งแรก ประกอบด้วยลำโพง ไมโครโฟน และปุ่มปิดเสียง โดย Hart ได้ถ่ายรูปวาดของต้นแบบด้วยโทรศัพท์ของเขา

และตัว Hart เองก็ได้กลายมาเป็นผู้ดูแลทีมหลัก ซึ่งทีมลับใหม่นี้จะอยู่ฝั่งตรงข้ามถนนจากสำนักงานของ Bezos ในอาคาร Fiona

Greg Hart ผู้ที่ต้องมาสานฝันของ Bezos ให้สำเร็จ (CR:The Wrap)
Greg Hart ผู้ที่ต้องมาสานฝันของ Bezos ให้สำเร็จ (CR:The Wrap)

ในไม่กี่เดือน Hart ได้จ้างกลุ่มคนเล็ก ๆ จากในและนอกบริษัท โดยส่งอีเมลไปยังผู้สนใจโดยมีหัวข้อที่มีความลึกลับว่า “มาเข้าร่วมภารกิจลับกับฉันไหม?”

ส่วนคำถามที่ใช้ในการสัมภาษณ์ เช่น “คุณจะออกแบบ Kindle สำหรับคนตาบอดอย่างไร” Hart เรียกได้ว่าหมกมุ่นอยู่กับความลับไม่ต่างจาก Boss ของเขา

ผู้มาสัมภาษณ์คนหนึ่งเล่าถึงการเดาของเขาว่าโปรเจกต์ลับนี้คงจะเป็นสมาร์ทโฟนที่มีข่าวลืออย่างหนาหูภาายใน Amazon แต่ Hart ได้ตอบกลับมาว่า “มีอีกทีมหนึ่งที่สร้างโทรศัพท์อยู่แล้ว แต่สิ่งที่เราจะทำมันน่าจะสนใจกว่ามาก”

ทีมงาน Alexa รุ่นแรก ๆ ทำงานด้วยความเร่งรีบเนื่องจากเจ้านายของเขาอย่าง Bezos นั้นมีความอดทนต่ำมาก ๆ โดยต้องการที่จะเปิดตัวอุปกรณ์ใหม่ตัวนี้ภายใน 6-12 เดือน

ข่าวร้ายสำหรับทีมงานครั้งแรกปรากฎขึ้นเมื่อวันที่ 4 ตุลาคม 2011 เมื่อ Apple ได้เปิดตัวผู้ช่วยเสมือนจริงอย่าง Siri ใน iPhone 4S ซึ่งถือได้ว่าเป็นโปรเจกต์สุดท้ายที่ Steve Jobs เข้ามาคลุกคลีก่อนที่จะเสียชีวิต

Apple ได้เปิดตัวผู้ช่วยเสมือนจริงอย่าง Siri ใน iPhone 4S (CR:AnandTech)
Apple ได้เปิดตัวผู้ช่วยเสมือนจริงอย่าง Siri ใน iPhone 4S (CR:AnandTech)

และเพื่อเร่งการพัฒนาสู่สปีดขั้นสุดเพื่อให้บรรลุเป้าหมายของ Bezos ทาง Hart และทีมงานของเขาเริ่มมองหาสตาร์ทอัพที่จะเข้าซื้อกิจการ

โดยบริษัทแรกที่ Amazon เข้าซื้อคือ Yap ซึ่งเป็นสตาร์ทอัพขนาดเล็กมีพนักงานประมาณ 20 คนในเมืองชาร์ลอตต์ รัฐนอร์ทแคโรไลนา ที่สร้างเทคโนโลยีในการแปลคำพูดของมนุษย์ เช่น เปลี่ยนเสียงพูดเป็นข้อความโดยอัตโนมัติ

หลังจากการซื้อกิจการสิ้นสุดลงด้วยมูลค่าประมาณ 25 ล้านดอลลาร์ Amazon ก็ไล่ผู้ก่อตั้งบริษัทออก แต่ยังคงกลุ่มทีมงานหัวกะทิไว้ในเมืองเคมบริดจ์ รัฐแมสซาชูเซตส์ และสร้างสำนักงาน R&D แห่งใหม่ขึ้นใน Kendall Square ใกล้กับมหาวิทยาลัย MIT

และเพียงไม่กี่เดือนหลังจากการซื้อ Yap สำเร็จ Hart และเพื่อนร่วมงานของเขาก็สามารถแก้ไขปริศนา Doppler ได้อีกอย่างหนึ่ง โดยมันเป็นสิ่งตรงข้ามกับเทคโนโลยีของ Yap ซึ่งจะแปลงคำพูดเป็นข้อความ

Ivona สตาร์ทอัพสัญชาติโปแลนด์ทำการสร้างคำพูดที่สังเคราะห์ด้วยคอมพิวเตอร์ซึ่งมีลักษณะคล้ายเสียงของมนุษย์

Ivona ที่ก่อตั้งขึ้นในปี 2011 โดย Lukasz Osowski นักศึกษาสาขาวิทยาการคอมพิวเตอร์ที่ Gdan´sk University of Technology โดย Osowski มีแนวคิดที่เรียกว่า ““text to speech” หรือ TTS ซึ่งสามารถอ่านออกเสียงข้อความดิจิทัลด้วยเสียงที่เป็นธรรมชาติ

Osowski รู้ว่าเทคโนโลยีของเขาทรงพลังมากเพียงใด เขาได้จ่ายเงินให้กับนักแสดงชื่อดังชาวโปแลนด์ชื่อ Jacek Labijak เพื่อนำเอาเสียงพูดมาเป็นฐานข้อมูลเสียงสำหรับซอฟต์แวร์ของเขา

ผลลัพธ์ที่ได้คือผลิตภัณฑ์แรกของพวกเขาอย่าง Spiker ซึ่งกลายเป็นเสียงคอมพิวเตอร์ที่มียอดขายสูงที่สุดในโปแลนด์อย่างรวดเร็ว และมีการใช้กันอย่างแพร่หลายทั้งในรถไฟใต้ดิน ลิฟต์ หรือที่อื่นๆ อีกมากมาย

การซื้อกิจการครั้งนี้ Amazon ได้จ่ายเงินไปกว่า 30 ล้านดอลลาร์ และดีลเสร็จสิ้นในปี 2012 แต่ถูกเก็บไว้เป็นความลับราวๆ หนึ่งปี โดย Amazon ได้สร้างศูนย์ R&D แห่งใหม่ที่ Gdan´sk ซึ่งได้รับมอบหมายให้รับผิดชอบในการสร้างเสียงของ Doppler

ในขณะที่ทีม Doppler จ้างวิศวกรและเข้าซื้อสตาร์ทอัพหลายแห่ง ก็มีการถกเถียงกันอย่างถึงพริกถึงขิงในสำนักงานของ Amazon ที่ซีแอตเทิลว่าอุปกรณ์ดังกล่าวควรจะไปในทิศทางใด

Hart มองว่าการนำมาเล่นเพลงน่าจะเป็นคุณสมบัติที่เข้าท่า มีตลาดใหญ่รองรับ และสามารถทำการตลาดได้ง่าย

แต่ Bezos นั้นมีความคิดที่ทะเยอทะยานกว่านั้น โดยเริ่มพูดคุยเกี่ยวกับ “คอมพิวเตอร์ Star Trek” ซึ่งเป็นเทคโนโลยีปัญญาประดิษฐ์ที่สามารถจัดการกับคำถามใด ๆ และทำหน้าที่เป็นผู้ช่วยส่วนตัวได้

ด้วยความหลงใหลในนิยายวิทยาศาสตร์ Bezos บังคับให้ทีมของเขาคิดให้ใหญ่ขึ้นและผลักดันขอบเขตของเทคโนโลยีที่มีอยู่ กลับกัน Hart ต้องเผชิญกับแรงกดดันที่จะต้องผลักดันวิสัยทัศน์ดังกล่าวให้กลายเป็นความจริง เขาต้องการแค่ฟีเจอร์พื้นฐานที่เชื่อว่าจะทำได้ เช่น การรายงานสภาพอากาศ การตั้งเวลาและการเตือน เป็นต้น

สิ่งที่ถกเถียงกันอีกเรื่องนึงก็คือการปลุกให้อุปกรณ์นี้มันเริ่มทำงานจะเรียกมันว่าอะไร? ทางฝั่ง Bezos ต้องการคำที่ไพเราะ มีการแนะนำคำเรียกต่าง ๆ เช่น “Finch” ชื่อนวนิยายนักสืบแฟนตาซีโดย Jeff VanderMeer , “Friday” ตามชื่อผู้ช่วยส่วนตัวในนวนิยายของโรบินสัน ครูโซ และ “Samantha” แม่มดที่สามารถกระพริบตาและทำภารกิจใด ๆ ในรายการทีวีชื่อดังอย่าง Bewitched หรือแม้กระทั่งยังเสนอชื่อเรียกง่าย ๆ ว่า “Amazon” ไปซะเลย

ผู้นำทีม Doppler ถกเถียงกันอย่างหนักว่าจะเอาชื่ออะไรกันแน่ แต่มีคำแนะนำหนึ่งจาก Bezos ที่ทุกคนต่างสนใจ “Alexa” ซึ่งเป็นการแสดงความเคารพต่อห้องสมุดโบราณแห่งอเล็กซานเดรีย ซึ่งถือเป็นเมืองหลวงแห่งความรู้

หลังจากมีการถกเถียงและทดสอบในห้องปฏิบัติการชื่ออย่าง “Alexa” และ “Amazon” ดูเหมือนจะเข้าท่าที่สุด ซึ่งกลายมาเป็นตัวเลือกอันดับต้น ๆ

อุปกรณ์เริ่มถูกทดลองแบบจำกัดเฉพาะในบ้านของพนักงาน Amazon ในช่วงต้นปี 2013 ซึ่งอุปกรณ์รุ่นนี้ เหล่าพนักงานมองว่ามันไม่ฉลาดเอาซะเลย โดยรวมแล้วถือว่าช้าและแทบจะเป็นใบ้

แม้กระทั่งการทดลองด้วยตนเองโดย Bezos ที่นำอุปกรณ์มาติดตั้งที่บ้านในซีแอตเทิลของเขา ด้วยความหงุดหงิดและไม่ค่อยเข้าใจฟังก์ชันการทำงานของมัน เขาถึงกับบอกให้ Alexa ไปยิงหัวตัวเองซะ

มันแสดงให้เห็นอย่างชัดเจนว่าสิ่งที่ Bezos ฝันหวานไว้นั้น ไม่ได้เป็นเรื่องง่ายที่จะสร้างมันขึ้นมา และ Alexa ต้องได้รับการปลูกถ่ายสมองครั้งใหญ่เพื่อให้มันฉลาดขึ้น

และมันนำไปสู่การซื้อกิจการครั้งที่สาม ซึ่งเป็นบริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ในเคมบริดจ์ ประเทศอังกฤษ ชื่อ Evi โดยผู้ประกอบการชาวอังกฤษ William Tunstall-Pedoe ซึ่งดีลนี้ Amazon ทุ่มเงินไปกว่า 26 ล้านดอลลาร์

ในปี 2012 Tunstall-Pedoe ได้รับแรงบันดาลใจจากการเปิดตัวของ Siri โดยเริ่มเปิดตัวแอป Evi บน App Store และ Play Store ผู้ใช้สามารถถามคำถามโดยการพิมพ์หรือพูด โดย Evi จะทำการประเมินคำถามและพยายามเสนอคำตอบแบบ Realtime ซึ่งคล้ายๆ กับสิ่งที่เราเห็นใน ChatGPT ณ ปัจจุบันนั่นเอง

การบูรณาการเทคโนโลยีของ Evi ช่วยให้ Alexa ตอบคำถามที่เป็นข้อเท็จจริง เช่น การร้องขอให้ตั้งชื่อดาวเคราะห์ในระบบสุริยะ โดยพื้นฐานทางเทคโนโลยีของ Evi จะใช้เทคนิคที่เรียกว่า Knowledge Graph ซึ่งจะเชื่อมโยงแนวคิดและหมวดหมู่ในโดเมนที่เกี่ยวข้อง

แต่ดูเหมือนว่าเทคนิคการใช้ Knowledge Graph ของ Evi นั้นจะไม่ทำให้ Alexa มีสติปัญญาแบบล้ำเลิศอย่างแท้จริงที่จะสนองความฝันของ Bezos ที่ต้องการผู้ช่วยอเนกประสงค์ที่สามารถพูดคุยกับผู้ใช้และตอบคำถามใด ๆ ก็ได้

อีกหนึ่งเทคนิคที่กำลังกลายเป็นที่ฮือฮาในยุคนั้นก็คือ Deep Learning ที่เป็นเทคโนโลยีหลักของ ChatGPT อย่างที่เราใช้กันในทุกวันนี้นั่นเอง

Deep Learning จะได้รับข้อมูลจำนวนมหาศาลเกี่ยวกับวิธีการสนทนาของผู้คนและคำตอบใดที่น่าพึงพอใจ จากนั้นจึงตั้งโปรแกรมฝึกตนเองเพื่อคาดเดาคำตอบที่ดีที่สุด และผู้ที่ผลักดันแนวคิดนี้ก็คือ Rohit Prasad ที่เป็นบุคลากรภายใน Amazon

ในขณะที่ทีม Doppler พยายามปรับปรุงความสามารถของ Alexa อยู่นั้น Bill Barton ซึ่งเป็นผู้บริหารสำนักงานในบอสตันของ Amazon ได้แนะนำ Prasad ให้กับ Greg Hart ได้รู้จัก

Prasad เป็นพนักงานคนสำคัญที่สนับสนุนให้ Alexa ใช้เทคโนโลยี Deep Learning เพราะมองว่า Knowledge Graph ของ Evi จะให้คำตอบที่กว้างจนเกินไป ด้วยการใช้การฝึกอบรมข้อมูลผ่านเทคโนโลยี Deep Learning ระบบสามารถตอบคำถามได้รวดเร็วกว่ามาก

Rohit Prasad ผู้มาผลักดันเทคโนโลยี Deep Learning แบบเต็มตัว (CR:GeekWire)
Rohit Prasad ผู้มาผลักดันเทคโนโลยี Deep Learning แบบเต็มตัว (CR:GeekWire)

แม้ว่าแนวทางในการใช้เทคโนโลยี Deep Learning จะได้ผล แต่ Prasad ไม่ต้องการเปิดตัวระบบที่ไม่ฉลาดจริง เพราะลูกค้าจะไม่ใช้มัน ข้อมูลที่มีอยู่ใน Amazon มันยังไม่เพียงพอ เขาต้องการข้อมูลเพิ่มเติมเพื่อฝึกอบรมระบบให้ชาญฉลาดยิ่งขึ้น

Bezos สั่งลุยทันทีโดยให้ Amazon ทำสัญญากับบริษัทรวบรวมข้อมูลของออสเตรเลียที่มีชื่อว่า Appen โดยทำงานร่วมกับทีม Alexa ทำการเช่าบ้านและอพาร์ตเมนต์ โดยเริ่มจากในเมืองบอสตันเป็นอันดับแรก

จากนั้น Amazon ก็ได้วางอุปกรณ์ เช่น ไมโครโฟนแบบตั้งพื้น เครื่องเกม Xbox โทรทัศน์ และแท็บเล็ต โดยทำการสอดแนมด้วยอุปกรณ์ของ Alexa ประมาณ 20 ชิ้นที่ติดตั้งอยู่รอบ ๆ ห้องที่มีความสูงแตกต่างกัน โดยแต่ละชิ้นหุ้มด้วยผ้ากันเสียงเพื่อซ่อนอุปกรณ์เหล่านั้นจากการมองเห็น แต่ปล่อยให้เสียงลอดผ่านได้

จากนั้น Appen ก็ได้ทำการเซ็นสัญญากับบริษัท outsource ว่าจ้างคนงานให้มาอยู่ในห้องดังกล่าว แปดชั่วโมงต่อวัน หกวันต่อสัปดาห์ อ่านสคริปต์จาก iPad ที่มีประโยคและคำถามปลายเปิด เช่น “ขอให้เล่นเพลงโปรดของคุณ” หรือ “ถามอะไรก็ได้ที่คุณอยากให้ผู้ช่วยทำ”

ลำโพงจะถูกปิด ดังนั้น Alexa จึงไม่ได้ยินเสียงใด ๆ แต่ไมโครโฟนทั้งเจ็ดตัวในแต่ละอุปกรณ์จะจับทุกอย่างและสตรีมเสียงไปยังเซิร์ฟเวอร์ของ Amazon

เหล่ากองทัพคนงาน outsource จะมีการใส่คำอธิบายประกอบการถอดเสียง โดยจัดประเภทคำถามที่อาจทำให้เครื่องสะดุด เช่น “เปิด Hunger Games” ซึ่งเป็นการร้องขอให้เล่นภาพยนตร์ของ Jennifer Lawrence เพื่อที่ครั้งต่อไป Alexa จะได้เรียนรู้

ต้องบอกว่าการทดสอบครั้งใหญ่ในบอสตันเหมือนจะเริ่มเห็นแสงสว่างที่ปลายอุโมงค์ ดังนั้น Amazon จึงขยายโครงการโดยเช่าบ้านและอพาร์ตเมนต์เพิ่มเติมในซีแอตเทิลและเมืองอื่น ๆ อีก 10 เมืองในช่วงหกเดือนเพื่อบันทึกเสียงและรูปแบบคำพูดของอาสาสมัครที่ได้รับค่าจ้างอีกหลายพันคน

มันทำให้ทีมงาน Amazon ได้เรียนรู้อย่างลึกซึ้งเกี่ยวกับข้อมูลของการวางตำแหน่งอุปกรณ์ สภาพแวดล้อมของเสียง เสียงพื้นหลัง สำเนียงที่แตกต่างกันในแต่ละภูมิภาค และวิธีที่มนุษย์อาจะใช้วลีคำของ่าย ๆ เพื่อฟังสภาพอากาส เป็นต้น หรือให้เล่นเพลงฮิตของ Justin Timberlake

ภายในปี 2014 บริษัทได้เพิ่มการจัดเก็บข้อมูลคำพูดสูงขึ้นหมื่นเท่า และสามารถปิดช่องว่างทางด้านข้อมูลเมื่อเทียบกับคู่แข่งอย่าง Apple และ Google ได้สำเร็จ

แต่เมื่อ Alexa มันใกล้จะเสร็จสมบูรณ์เต็มทีแล้ว ทีมงานยังไม่รู้ว่าจะตั้งชื่อเจ้าอุปกรณ์ตัวนี้ว่าอย่างไร มันเป็นเวลาเกือบสี่ปีที่ทีมงานต่างถกเถียงกันในเรื่องชื่อที่แท้จริงของอุปกรณ์ตัวนี้

ทีมงานต่างถกเถียงกันไม่รู้จบว่าควรจะมีหนึ่งหรือสองชื่อสำหรับผู้ช่วยเสมือน (Alexa) และชื่อของอุปกรณ์ที่เป็นฮาร์ดแวร์

แต่ไม่ถึงหนึ่งเดือนก่อนที่จะเปิดตัว Bezos ได้ตัดสินใจเลือกที่จะนำเอาฟีเจอร์ของ Alexa นั่นก็คือ Echo ซึ่งเป็นฟีเจอร์ที่ผู้ใช้งานสามารถขอให้ Alexa พูดคำหรือวลีซ้ำออกมาได้ (หลังจากนั้นคำสั่งนี้ถูกเปลี่ยนเป็น “Simon Says”)

การเปิดตัว Amazon Echo เมื่อวันที่ 6 พฤศจิกายน 2014 เกิดขึ้นหลังจากความล้มเหลวของ Fire Phone เพียงไม่กี่เดือนก่อนหน้า ไม่มีการแถลงข่าวหรือการกล่าวสุนทรพจน์โดย Bezos แต่อย่างใด

ในทางกลับกัน Bezos ดูจะสบายใจกว่าด้วยแนวทางใหม่ที่เรียบง่าย : ทีมงานได้ประกาศเรื่องอุปกรณ์ Echo พร้อมข่าวประชาสัมพันธ์และวีดีโออธิบายความยาวสองนาทีบน Youtube ที่มีครอบครัวหนึ่งพูดคุยกับ Alexa อย่างร่าเริงเพียงเท่านั้น

เหล่าผู้บริหาร Amazon เองก็ยังไม่ค่อยมั่นใจอุปกรณ์ตัวนี้เท่าไหร่นัก พยายามที่จะบอกกับกลุ่มลูกค้าว่ามีหลายๆ โดเมนที่พวกเขามั่นใจว่ามีประโยชน์ เช่น การส่งข่าวสารและสภาพอากาศ การตั้งเวลา การซื้อของ และการเล่นเพลง

หลังจากสี่ปีของการพัฒนาอย่างยากลำบาก เหล่าทีมงาน Doppler หลายคนเริ่มวิตกกังวลว่า Amazon Echo จะเจริญรอยตามความล้มเหลวของ Fire Phone เพราะพวกเขายังแทบไม่มั่นใจในผลิตภัณฑ์ที่พวกเขาสร้างมันขึ้นมาเลยด้วยซ้ำ

แต่สิ่งที่เหลือเชื่อคือ ไม่กี่สัปดาห์ถัดมา ลูกค้าจำนวนหนึ่งแสนเก้าพันรายได้ลงทะเบียนเพื่อรอรับ Echo แถมยังได้รับการวิจารณ์เชิงบวกจากสื่อต่างๆ โดยบางสื่อถึงกับเล่นข่าวว่า “นี่คืออุปกรณ์ที่ล้ำสมัยที่สุดที่ Amazon ผลิตในรอบหลายปี”

Amazon Echo รุ่นแรกที่ประสบความสำเร็จแทบจะทันทีที่วางจำหน่าย (CR:Life Mobile)
Amazon Echo รุ่นแรกที่ประสบความสำเร็จแทบจะทันทีที่วางจำหน่าย (CR:Life Mobile)

เรียกได้ว่าสัญชาตญาณของ Bezos นั้นถูกต้อง มันเป็นอุปกรณ์มหัศจรรย์ตามความฝันของ Bezos ที่เข้ามาอยู่ในบ้านของชาวอเมริกันหลายล้านคน ลำโพงที่สามารถตอบสนองได้ดั่งมีเวทย์มนต์โดยที่ผู้คนแทบจะไม่ต้องแตะหน้าจอสมาร์ทโฟน

ณ สิ้นปี 2016 Amazon Echo ถูกจำหน่ายไปกว่าแปดล้านเครื่อง ผลักดันให้ Amazon บริษัทลำโพงที่มียอดขายสูงที่สุดในโลก และขึ้นมาสู่แนวหน้าของการเป็นบริษัทด้าน AI ชั้นนำของโลก

ต้องบอกว่าวิสัยทัศน์พร้อมกับความกล้า บ้าบิ่นของ Bezos เป็นปัจจัยสำคัญที่ทำให้อุปกรณ์ตัวใหม่อย่าง Echo ประสบความสำเร็จ แน่นอนว่าการเข้ามาคลุกคลีแบบถึงลูกถึงคนของ Bezos นั้นอาจจะทำให้ทีมงานแทบไม่ได้หลับนอน แต่สุดท้ายมันก็ให้ผลลัพธ์ที่ประเมินค่าไม่ได้อย่างที่ Echo ได้กลายเป็นอุปกรณ์ที่เข้ามาปฏิวัติวงการได้สำเร็จนั่นเองครับผม

References :
หนังสือ Amazon Unbound: Jeff Bezos and the Invention of a Global Empire โดย Brad Stone
https://en.wikipedia.org/wiki/Amazon_Echo
https://www.businessinsider.com/the-inside-story-of-how-amazon-created-echo-2016-4
https://www.wired.com/story/how-amazon-made-alexa-smarter/

เมื่อ Rider สู้กลับ AI กับฮีโร่ผู้กอบกู้ Rider ที่ทำงานภายใต้การถูกชักใยจากอัลกอริธึม

บนเนินเขาลาดชันสูงที่สุดแห่งหนึ่งในพิตส์เบิร์ก รัฐเพนซิลวาเนีย ในวันที่ 12 สิงหาคม 2020 เป็นวันที่ชายอย่าง Armin Samii นักกีฬาจักรยานวัย 32 ปี ตัดสินใจครั้งสำคัญในการต่อสู้กับอัลกอริธึมของ Uber Eats

Samii ตื่นนอนก่อนเวลาปรกติ เขาแต่งตัว ชงกาแฟ และนั่งลงบนคอมพิวเตอร์ และใช้เวลากว่า 16 ชั่วโมงต่อมาในการเขียนโปรแกรมสร้างเว็บแอปพลิเคชัน และถ่ายวีดีโอเพื่อแสดงวิธีการใช้งานให้กับกลุ่ม Rider คนอื่น ๆ

เขาตั้งชื่อแอปว่า UberCheats โดยเปิดระบบให้ออนไลน์ในช่วงเที่ยงคืนวันเดียวกัน และให้ทุกคนที่ได้รับความเดือดร้อนมาใช้งานกันแบบฟรี ๆ

UberCheats เป็นเครื่องมือที่ใช้ในการตรวจสอบอัลกอริธึมของ Uber โดย Samii ซึ่งทำงานเป็น Rider ให้กับแพลตฟอร์ม Uber ในพิตส์เบิร์กในเวลานั้น รู้สึกหมดความอดทนกับการโกงของอัลกอริธึมเบื้องหลังหยาดเหงื่อแรงกายของเพื่อน ๆ เหล่า Rider

Samii มั่นใจอย่างยิ่งว่าแอป Uber Eats มีข้อผิดพลาดและจ่ายค่าจ้างให้กับเขาต่ำเกินไป หลังจากพยายามอย่างหนักที่จะแจ้งไปยังแพลตฟอร์ม แต่ไร้ซึ่งการเหลียวแล เขารู้สึกไม่มีทางเลือก นอกจากต้องลงมือจัดการด้วยตัวเขาเอง

แอป UberCheats ของ Samii ทำหน้าที่สำคัญอย่างง่าย ๆ นั่นก็คือ แสดงพิกัดจีพีเอสจากใบเสร็จรับเงินและคำนวณระยะทางที่ Rider ขับไปจริง ๆ เปรียบเทียบกับระยะทางที่แสดงในแพลตฟอร์มของ Uber

Samii ที่หลงรักในการปั่นจักรยานและต้องการคืนความเป็นธรรมให้กับเหล่า Rider (CR:PublicSource)
Samii ที่หลงรักในการปั่นจักรยานและต้องการคืนความเป็นธรรมให้กับเหล่า Rider (CR:PublicSource)

โดยพื้นฐานแล้วนั้นแพลตฟอร์ม Delivery เหล่านี้ไม่มีอัตราค่าจ้างที่แน่นอน สามารถเปลี่ยนแปลงได้ทุก ๆ ชั่วโมง ในแต่ละพื้นที่ หรือแม้กระทั่งเปลี่ยนแปลงไปตาม Rider แต่ละคนที่แทบไม่เท่ากันเลย

ซึ่ง Uber จะทำการคำนวณจากปัจจัยต่าง ๆ ไม่ว่าจะเป็นสภาพอากาศ หรือ demand ของปริมาณลูกค้าในขณะนั้น เนื่องจาก Uber ได้ทำการปกปิดสถานที่จัดส่งจริงจาก Rider หลังจากที่พวกเขาส่งของเสร็จแล้ว

มันเป็นเรื่องยากที่เหล่า Rider จะทราบระยะทางที่แท้จริง เพราะในใบเสร็จรับเงินที่เหล่า Rider ได้รับนั้นจะเห็นเพียงแค่เส้นทางจากจุด A ไปยังจุด B พร้อมกับระยะทางเป็นไมล์และเงินที่พวกเขาได้รับ

หลังจากปล่อย Ubercheats ออกไปได้ไม่นาน Samii ก็เริ่มได้รับข้อมูลจากเหล่า Rider ของ Uber Eats จากทั่วทุกมุมโลก ทั้งที่ประเทศญี่ปุ่น บราซิล ออสเตรเลีย อินเดีย และไต้หวัน

มีการบันทึกการส่งอาหาร 6,000 ครั้งลงใน Ubercheats โดยมี 17% ที่ดูเหมือนค่าจ้างมันจะไม่แฟร์ และไม่ว่าจะอยู่ในเมืองไหน ข้อมูลที่บันทึกลงใน Ubercheats แสดงให้เห็นว่า Rider ถูกตัดค่าจ้างเป็นระยะทางเฉลี่ย 1.35 ไมล์ต่อการส่งหนึ่งครั้ง

ต้องบอกว่า Ubercheats ของ Samii เปรียบเสมือนฮีโร่ที่ช่วยมากอบกู้โลกแห่ง Delivery ซึ่งทำงานภายใต้การถูกชักใยจากอัลกอริธึม

Ubercheats ของ Samii เปรียบเสมือนฮีโร่ที่ช่วยมากอบกู้โลกแห่ง Delivery ( Twitter)
Ubercheats ของ Samii เปรียบเสมือนฮีโร่ที่ช่วยมากอบกู้โลกแห่ง Delivery ( Twitter)

ปัจจุบันมีแรงงานในกลุ่มนี้มากกว่าหนึ่งพันล้านคนในรูปแบบต่าง ๆ แอปพลิเคชันใช้เทคโนโลยี AI ได้ทำการออกคำสั่งให้แรงงานทาสเหล่านี้โดยส่งตรงไปยังโทรศัพท์มือถือของพวกเขา

ซอฟต์แวร์ที่ใช้เทคโนโลยี Machine Learning จะเป็นตัวกำหนดงานให้กับ Rider ยืนยันตัวตนของพวกเขา กำหนดอัตราค่าจ้าง มอบโบนัส ตรวจจับการทุจริตที่อาจเกิดขึ้น หรือแม้กระทั่งการตัดสินใจว่าจ้างหรือปลดพนักงานเลยทีเดียว

Samii มองว่า นายจ้าง AI เหล่านี้แทบไม่มีความเป็นมนุษย์ พวกมันไม่มีความรู้สึก แถมเวลาคุยกับพวกมันก็โครตน่าหงุดหงิด

ย้อนกลับไปในเดือนกรกฎาคมปี 2020 เมื่อ Samii พยายามที่จะลงทะเบียนเพื่อสมัครเป็น Rider กับ Uber Eats แอปพลิเคชันต้องการตรวจสอบรูปภาพเพื่อพิสูจน์ตัวตน โดยใช้เทคโนโลยี Face Recognition

แต่สำหรับ Samii มันกลับไม่ได้ผล เขาพยายามถ่ายรูปซ้ำแล้วซ้ำเล่า แต่ถูก AI แสนบื้อปฏิเสธกลับมาแทบทุกครั้ง

นั่นทำให้ Samii รู้ว่านี่คือปัญหาใหญ่สำหรับคนผิวสี เพราะเหุตการณ์แบบนี้เกิดขึ้นกับเขา 3-4 ครั้ง โดยในครั้งที่ 4 เขาอาบน้ำ สระผม ดัดผมให้เรียบ แล้วอ้าปาก เพื่อให้เจ้าอัลกอริธึมตรวจจับใบหน้าของเขา สุดท้ายก็สำเร็จ

แม้เขาจะสามารถเริ่มทำงานได้ แต่เขายังคงมีความรู้สึกว่ามีบางอย่างผิดปรกติ

ความรำคาญของ Samii เริ่มสะสมขึ้นเรื่อย ๆ โดยในวันแรกของการทำงาน เขาได้รับคำสั่งซ้ำ ๆ ให้ไปรับอาหารจากร้าน McDonald สาขาหนึ่งที่ปิดไปแล้วเป็นเวลาหลายเดือน ลูกค้าแทบไม่รู้เลยว่า Uber ไม่ได้ลบสาขานั้นออกจากฐานข้อมูล

Samii พยายามที่จะโน้มน้าวให้ Uber ลบสาขานี้ออกจากระบบ แต่กลับได้รับคำตอบกลับมาว่า “เราไม่สามารถเปลี่ยนแปลงข้อมูลในระบบได้ แต่เราสามารถจ่ายเงิน 2 ดอลลาร์ให้กับคุณได้เพราะคุณได้ไปที่นั่นมาแล้ว”

Samii ที่ใช้เวลา 20 นาทีขี่จักรยานคู่ใจของเขาไปที่นั่น และอีก 45 นาทีเพื่อคุยโทรศัพท์กับฝ่าย support ของ Uber แต่สุดท้ายได้เงินมาเพียงแค่ 2 ดอลลาร์

Samii รับไม่ได้ที่ไม่มีมนุษย์คนใดที่เขาสามารถพูดคุยด้วยและมีอำนาจในการแก้ไขปัญหาพื้นฐานแบบนี้ได้

พื้นฐานของ Samii เองพอมีความรู้ทางด้านการเขียนโปรแกรมอยู่บ้าง และรู้ด้วยว่ามันเป็นเรื่องง่ายมากสำหรับนักพัฒนาในการแก้ไขข้อผิดพลาดเหล่านี้

Samii อายุ 32 ปี เป็นลูกชายคนเล็กของครอบครัวชาวอิหร่านที่อพยพมายังแคลิฟอร์เนียในปี 1960 โดยพ่อแม่ของเขาทั้งคู่เป็นวิศวกรโยธา แม่ของเขาทำงานในหน่วยงานรัฐบาลท้องถิ่นคอยคำนวณทราฟฟิกของจราจรที่ได้รับผลกระทบจากการก่อสร้างถนน ส่วนพ่อของเขาเป็นวิศวกรที่สร้างสะพานและรางรถไฟให้กับเมืองซานดิเอโก

สำหรับสิ่งที่เขารักมาก ๆ ก็คือการปั่นจักรยาน เขามีจักรยานอยู่ 5 คัน และงานในฝันของเขาก็คืองานที่ต้องขี่จักรยานตลอดทั้งวัน

เมื่อย้ายจากเบิร์กลีย์ รัฐแคลิฟอร์เนียมายังพิตส์เบิร์กในปี 2019 เขาได้เข้าร่วมการประชุมกับผู้แทนในท้องถิ่นโดยมีความพยายามที่จะทำให้เมืองนี้ปลอดภัยสำหรับนักปั่นจักรยานมากขึ้น

ปัจจุบันเขาก่อตั้งสตาร์ทอัพชื่อ Dashcam For Your Bike ซึ่งช่วยให้นักปั่นจักรยานในเมืองสามารถบันทึกภาพวีดีโอเพื่อความปลอดภัยบนท้องถนน โดยเรียกได้ว่าเขาเป็นนักกิจกรรมตัวยง

Samii ยังเคยทำงานให้กับบริษัท Argo.ai ซึ่งเป็นสตาร์ทอัพพัฒนารถยนต์ขับเคลื่อนแบบอัตโนมัติที่ได้รับเงินทุนจาก Ford และ Volkswagen

เขาเป็นผู้นำทีมออกแบบระบบให้รองรับการสื่อสารระหว่างผู้โดยสารที่เป็นมนุษย์กับยานยนต์ไร้คนขับ ซึ่งเขาตระหนักอย่างยิ่งว่าเขากำลังเขียนโปรแกรมที่หากผิดพลาดอาจนำไปสู่การสังหารชีวิตมนุษย์ได้

ในช่วงฤดูร้อนปี 2020 เขาได้ลาออกจากงาน เพราะมองว่ารถยนต์ไร้คนขับแม้มันจะทำให้การขับขี่มีความปลอดภัยมากขึ้น แต่ก็ไม่ได้หมายความว่าจะทำให้เมืองน่าอยู่ขึ้น

ในช่วงที่เขาหยุดพักเพื่อคิดว่าจะเอายังไงต่อกับชีวิต Samii รู้ว่าเขาอยากสำรวจเมืองพิตส์เบิร์กด้วยการปั่นจักรยาน นั่นจึงเป็นที่มาของความคิดที่จะเป็นพนักงานส่งอาหารของ Uber Eats

จุดหมายปลายทางแรกของเขาคือบนยอดเนินพิกฮิลล์ ซึ่งเป็นเนินเขาที่สูงชันที่สุดแห่งหนึ่งในพิตส์เบิร์ก Samii ใช้เวลา 50 นาทีในการปั่นจักรยานขึ้นไปส่งอาหารจานแรก

ในขณะที่ยังไม่หายเหนื่อย งานที่สองก็เด้งเข้ามา เขาต้องใช้เวลาอีก 40 นาที ในการจัดส่งจนงานที่สองสำเร็จ ทำให้ลูกค้ารายที่สองของเขาต้องรอนานถึงชั่วโมงครึ่ง แถมยังถูกบ่นใส่อีกต่างหาก แต่ก็ยังอุตส่าห์มอบทิปราว ๆ 1 ดอลลาร์ให้กับ Samii

สิ่งที่ประหลาดคืออัลกอริธึมบอกว่างานทั้งหมดนี้จะใช้เวลาเพียงแค่ 6 นาที แต่กลับใช้เวลาทำงานจริง ๆ ถึง 90 นาที ในตอนแรกเขาคิดว่านี่เป็นเพียงแค่ความผิดพลาดธรรมดา ๆ ที่อาจเกิดขึ้นได้

แต่เขาก็คิดขึ้นมาได้ว่าแม้กระทั่งการขับรถยนต์ก็ไม่สามารถที่จะเดินทางในระยะทางดังกล่าวนี้ได้ในเวลาเพียงแค่ 6 นาที “นี่ไม่ใช่ความแตกต่างระหว่างการปั่นจักรยานและการขับรถ” เขากล่าว “นี่คือ Bug จริง ๆ”

ในสัปดาห์ต่อมา Samii ส่งข้อความถึง Uber มากกว่าสิบสองข้อความ เขาได้รับคำแนะนำอัตโนมัติจากระบบไม่ว่าจะเป็นการให้ออกจากระบบ , เริ่มแอปใหม่ , รีสตาร์ทอุปกรณ์ , ลบและติดตั้งแอปใหม่ , อัปเดทแอป , รีเซ็ตการตั้งค่าเน็ตเวิร์ก หากรอนานเกิน 10 นาทีให้ยกเลิกคำสั่งซื้อ แต่ก็ต้องบอกว่าที่ไล่ยาวมาทั้งหมดมันไม่สามารถแก้ไขปัญหาให้กับเขาได้เลย

เข้าได้สร้างสเปรดชีตขึ้นมาเพื่อบันทึกการติดต่อกับฝ่ายบริการลูกค้าของ Uber อย่างละเอียด เขาบันทึกไว้ 14 รายการและการสนทนาทางศัพท์นาน 126 นาที

“สุดท้ายผมก็ได้คุยกับคนที่สามารถเปิด Google Maps และบอกว่า ‘นี่คือจุดบกพร่องจริง ๆ'”

และนั่นเป็นจุดเริ่มต้นไอเดียที่แว๊บเข้ามาในสมองของเขาว่า เขาสามารถที่จะหาพิกัดจากใบเสร็จรับเงินแล้วนำไปค้นใน Google ด้วยตัวเองเพื่อตรวจสอบว่าถูกต้องหรือไม่

ต้องบอกว่าแอปส่งอาหารส่วนใหญ่ไม่ได้กำหนดค่าจ้างมาตรฐานแบบตายตัว แต่อัลกอริธึมจะกำหนดราคาแต่ละงานโดยใช้สูตรคำนวณที่คำนึงถึงตัวแปรต่าง ๆ อาจมีปัจจัยใดก็ได้ที่ส่งผลต่อราคา ตั้งแต่คะแนนความพึงพอใจของลูกค้าที่มีต่อ Rider ไปจนถึงสัดส่วนของงานที่พวกเขาปฏิเสธ

การคิดคำนวณโดยอัลกอริธึมแบบเพี้ยน ๆ ของ Uber (CR:Reddit)
การคิดคำนวณโดยอัลกอริธึมแบบเพี้ยน ๆ ของ Uber (CR:Reddit)

Samii รู้ว่าเขาได้รับค่าจ้างที่ต่ำเกินไป แต่ยังมีคำถามอื่น ๆ ที่ยังไม่ได้รับคำตอบ เช่น แล้วเหตุการณ์เหล่านี้มันเกิดขึ้นบ่อยแค่ไหน? Rider คนอื่น ๆ ในระบบได้รับค่าจ้างที่ไม่แฟร์แบบนี้ด้วยหรือไม่? และมันต่ำกว่าที่ควรจะเป็นเท่าไหร่กันแน่?

ระบบทำให้สับสนเพราะบางครั้งจำนวนเงินที่น้อยนั้นไม่ได้เกี่ยวกับระยะทางเลย แต่มันเกี่ยวกับอัลกอริธึม Machine Learning ที่ตัดสินว่าพวกเขาจะจ่ายให้ Rider น้อยที่สุดเท่าที่จะเป็นไปได้ต่างหาก

ในเดือนกุมภาพันธ์ปี 2021 หลังจาก UberCheats เปิดตัวไปไม่นาน ทนายความของ Uber ก็ทำการร้องเรียนและขอให้ Google บล็อกแอปนี้บนเบราว์เซอร์ Chrome โดยอ้างว่าผู้คนอาจสับสนว่าเป็นผลิตภัณฑ์จริงของ Uber

เมื่อ Google ปฏิบัติตามคำร้องจาก Uber ทาง Samii ก็ส่งอีเมลอุทรณ์ถึง Google อย่างต่อเนื่อง จนในที่สุดการบล็อกก็ถูกยกเลิก แต่ในเดือนกุมภาพันธ์ปี 2022 เขาติดสินใจปิด UberCheats แม้ว่ามันจะมีประโยชน์กับเหล่า Rider แต่มันกลายเป็นภาระที่มากเกินไปสำหรับเขา เพราะเมื่อ Uber ทำการปรับเปลี่ยนอัลกอริธึม เขาก็ต้องคอยมานั่งแก้ซึ่งมันไม่สนุกเลย

Samii ไม่มีทรัพยากรหรือแรงจูงใจมากพอที่จะฟ้อง Uber เขาสร้างเครื่องมือนี้เพื่อให้สังคมตระหนักถึงปัญหาดังกล่าว

และนั่นคือจุดเริ่มต้นของการเปลี่ยนแปลง เพราะเรื่องราวเหล่านี้ในที่สุดมันก็ขึ้นสู่ชั้นศาล ในปี 2021 ศาลในเมืองอัมสเตอร์ดัม ซึ่งเป็นที่ตั้งสำนักงานใหญ่ของ Uber ในยุโรป ตัดสินว่า Uber ใช้ระบบอัตโนมัติทั้งหมดในการหักเงินรายได้ของคนขับคนหนึ่ง เป็นการละเมิดกฎหมายคุ้มครองข้อมูลส่วนบุคคลซึ่งต้องมีการพิจารณาทบทวนอัลกอริธึมโดยมนุษย์

นอกจากนั้นยังสั่งให้ Uber เปิดเผยข้อมูลส่วนบุคคลของผู้เสียหายในคดีนี้ และสั่งให้ Uber คิดคำนวณคะแนนของ Rider อย่างเป็นกลาง

อย่างไรก็ตามศาลสนับสนุน Uber ในการกล่าวอ้างเรื่องความโปร่งใสของอัลกอริธึม และไม่ได้สั่งให้ Uber เปิดเผยข้อมูลเพิ่มเติมเกี่ยวกับวิธีการคำนวณราคา หรือวิธีที่ Rider ถูกตัดสินว่าฉ้อโกง

และที่สำคัญยังปฏิเสธคำกล่าวอ้างของเหล่า Rider ที่ว่า Uber ไม่มีการควบคุมและดูแลโดยมนุษย์ในกระบวนการแจกจ่ายงานและการลงโทษพักงาน ซึ่งถือได้ว่าเป็นหนึ่งในการตีความกฎหมายครั้งแรกเกี่ยวกับพื้นที่ที่ซับซ้อนระหว่างมนุษย์กับการตัดสินใจโดย AI

ในเดือนกุมภาพันธ์ปี 2021 มีคำตัดสินครั้งสำคัญโดยศาลฎีกาของสหราชอาณาจักรได้กล่าวว่า Rider ของแพลตฟอร์ม Uber ควรได้รับการปฏิบัติเหมือนแรงงานทั่วไปที่มีสิทธิได้ค่าแรงขั้นต่ำ สิทธิ์ในการลาป่วย และเงินบำนาญ ซึ่งต่างจากบุคคลที่ประกอบอาชีพอิสระ

นับเป็นครั้งแรกที่เหล่า Rider สามารถเรียกร้องสิทธิแรงงานที่บังคับใช้กับอุตสาหกรรมอื่น ๆ ส่วนใหญ่ รวมถึงการลาป่วยและวันหยุด และคำตัดสินคล้าย ๆ กันนี้ก็เกิดขึ้นในแคนาดา สวิตเซอร์แลนด์ และฝรั่งเศสเช่นเดียวกัน

ในช่วงบ่ายฝนตกในฤดูร้อนปี 2022 ของพิตส์เบิร์ก Samii คว้าหมวกกันน็อคและจักรยานของเขา และได้เปิดใช้งานบัญชี Uber Eats อีกครั้งในช่วงสั้น ๆ เพื่อเช็คข้อมูลเกี่ยวกับค่าจ้างที่เหล่าเพื่อน ๆ Rider จะได้รับนับตั้งแต่การแพร่ระบาดของ COVID-19

Samii กล่าวว่าเหล่า Rider ได้รับความคุ้มครองทางกฎหมายที่มากขึ้นนับตั้งแต่เขาสร้าง UberCheats ในปี 2020 มันเปรียบเสมือนการลุกขึ้นมาต่อสู้เป็นครั้งแรกโดย Samii ในฐานะ Rider ที่โดนเหล่าแพลตฟอร์มเอาเปรียบมานานแสนนาน

ก็ต้องบอกว่ามันกลายเป็นเคสตัวอย่างอย่างที่น่าสนใจที่โลกของเราตอนนี้ ไม่เพียงแต่แพลตฟอร์มในด้านการจัดส่งอาหารเพียงเท่านั้น เพราะแทบจะทุกแพลตฟอร์มที่ขับเคลื่อนโดยเทคโนโลยีนั้นกำลังถูกควบคุมโดย AI แทบจะทั้งสิ้น

ซึ่งบางครั้งเรื่องโง่ ๆ บางอย่าง AI มันก็ยังไม่สามารถแก้ไขให้ได้ ทั้งที่เป็นเรื่องง่ายดายก็ตามที แม้มันจะเป็นชัยชนะเล็ก ๆ ของเหล่า Rider แต่ท้ายที่สุดแล้วอัลกอริธึมที่ขับเคลื่อนโดยเทคโนโลยี AI มันก็ไม่เคยหยุดนิ่ง ยังพัฒนาต่อไป เพื่อขยายช่องว่างทางเศรษฐกิจอย่างไม่มีที่สิ้นสุดนั่นเองครับผม

References :
https://www.ft.com/content/5c72d938-5d17-4600-a2e4-1cc20d3f9de1
https://www.wired.com/story/gig-workers-gather-data-check-algorithm-math/
https://www.vice.com/en/article/wx8yvm/uber-shuts-down-app-that-lets-users-know-how-badly-theyve-been-cheated
https://barkanmeizlish.com/uber-eats-and-the-pandemic-economy/

AI x Biotechnology เมื่อสองเทคโนโลยีผสานเพื่อแก้ไขปัญหาที่มีมายาวนานของมนุษยชาติ

เป็นพาร์ทหนึ่งที่น่าสนใจมากจากหนังสือ The Coming Wave :  Technology, Power, and the Twenty-first Century’s Greatest Dilemma โดย Mustafa Suleyman ที่เป็นเรื่องราวเกี่ยวกับความก้าวหน้าที่สำคัญมาก ๆ เมื่อโลกของเทคโนโลยี AI มาบรรจบกับเทคโนโลยีด้านชีวภาพ

โปรตีนเป็นองค์ประกอบสำคัญของชีวิต กล้ามเนื้อ เลือด ฮอร์โมน หรือแม้กระทั่งเส้นผมของมนุษย์เรา โดยเป็นสัดส่วนถึง 75% ของน้ำหนักของมนุษย์โดยส่วนใหญ่

เรียกได้ว่าโปรตีนอยู่ในทุกอณูของชีวิตมนุษย์เรา ทำหน้าที่สำคัญมากมาย และมนุษย์เราก็มีคำถามที่สำคัญกับเรื่องโปรตีนมานานแล้ว

แต่ปัญหาหลักที่เกิดขึ้นกับองค์ความรู้ของมนุษย์เราที่ผ่านมาก็คือ การรู้เพียงแค่ลำดับ DNA เพียงอย่างเดียวนั้นมันยังไม่เพียงพอที่จะรู้ว่าโปรตีนทำงานอย่างไร

เราต้องทำความเข้าใจว่าการม้วนพับของโปรตีนนั้นมันเกิดขึ้นได้อย่างไร และมันเป็นปัญหาคลาสสิกที่มนุษย์เราต้องการที่จะเรียนรู้มันมานานแล้ว

แต่เดิมเราใช้วิธีการคำนวณแบบ brute-force ซึ่งก็คือการพยายามหาความเป็นไปได้ทั้งหมดที่สามารถเกิดขึ้นได้ ใช้ความถึกล้วน ๆ ซึ่งมันอาจจะใช้เวลานานกว่าอายุของเอกภพที่เรารู้จักกันเสียอีกกว่าจะได้เรียนรู้มันแบบจริง ๆ จัง ๆ

การค้นหาว่าการม้วนพับของโปรตีนมันทำได้อย่างไรจึงเป็นกระบวนการที่มีความท้าทายสูงมาก ๆ ซึ่งใช้เวลานานหลายทศวรรษแล้วที่นักวิทยาศาสตร์พยายามค้นหาวิธีว่ามันมีวิธีที่ดีกว่าเดิมหรือไม่

ในปี 1993 พวกเขาได้ตัดสินใจจัดการแข่งขันปีละ 2 ครั้งที่เรียกว่า Critical Assessment for Structure Prediction (CASP) เพื่อดูว่าใครที่จะสามารถแก้ไขปัญหาการม้วนพับของโปรตีนได้

ใครก็ตามในโลกใบนี้ที่สามารถคาดการณ์ได้ดีที่สุดว่าโปรตีนพับได้อย่างไรจะเป็นผู้ชนะ ซึ่งในไม่ช้า CASP ก็กลายเป็นมาตรฐานในสนามที่มีการแข่งขันที่ดุเดือดที่สุดแห่งหนึ่งของโลก

และการแข่งขัน CASP13 ในปี 2018 ซึ่งจัดขึ้นที่รีสอร์ตที่มีต้นปาล์มรายล้อมในแคนคูน ประเทศเม็กซิโก มีทีมม้ามืดทีมหนึ่งได้เข้ามาร่วมแข่งขันโดยที่ประสบการณ์ในแวดวงนี้ของพวกเขาแทบจะเป็นศูนย์

ทีมม้ามืดทีมนี้สามารถเอาชนะทีมอื่น ๆ ที่ล้วนแล้วแต่เป็นนักวิจัยที่เก่งกาจในสาขานี้รวมถึงทั้งสิ้น 98 ทีมไปได้อย่างง่ายดาย

และทีมม้ามืดทีมนั้นก็คือทีม DeepMind ซึ่งได้สร้างโปรเจกต์ลับที่มีชื่อว่า AlphaFold โดยเป็นโครงการแฮ็กกาธอนเป็นเวลาหนึ่งสัปดาห์ภายในบริษัทเมื่อปี 2016

โปรเจกต์ดังกล่าวทำให้นักวิจัยในแขนงดังกล่าวทั่วโลกต่างอึ้งกับผลลัพท์ที่ทีม ๆ นี้ทำได้ มันเป็นการผสมผสานระหว่างชีววิทยาและคอมพิวเตอร์ได้อย่างสมบูรณ์แบบ ซึ่งมันชี้ชัดให้เห็นว่าทั้ง AI และเทคโนโลยีชีวภาพจะมีความก้าวหน้าอย่างก้าวกระโดดได้อย่างไร

ทีมอันดับสองในเวลานั้นสามารถทำนายโครงสร้างโปรตีนได้เพียงสามโครงสร้างจาก 43 โครงสร้างเป้าหมายที่ยากที่สุด แต่ผลงานที่ชนะของ AlphaFold นั้นสามารถทำนายได้สูงถึง 25 โครงสร้าง และที่สำคัญมันฉีกหนีคู่แข่งเป็นชิ้น ๆ ด้วยการทำเวลาที่เร็วกว่ามาก ๆ ในเวลาเพียงไม่กี่ชั่วโมงเพียงเท่านั้น

ในการแข่งขันปีนั้นซึ่งเต็มไปด้วยยอดอัจฉริยะด้านเทคโนโลยีชีวภาพจากทั่วโลกที่ฉลาดเป็นกรด แต่ผลงานของ AlphaFold ทำให้ทุกคนต่างตกตะลึงและได้เห็นถึงศักยภาพที่แท้จริงของ AI ตั้งแต่วันนั้นเป็นต้นมา

Mohammed AlQuraishi นักวิจัยที่มีชื่อเสียงในสาขาดังกล่าวนี้ ถึงกับกล่าวว่า “มันเกิดอะไรขึ้น!!!”

ทีมงานของ DeepMind ใช้เทคโนโลยี Neural Network เพื่อทำนายว่าโปรตีนจะพับตัวอย่างไรตาม DNA ของพวกมัน ทำการฝึกฝนชุดของโปรตีนที่รูัจัก โดยแทบจะลืมสิ่งที่นักวิจัยเก่า ๆ ทำมาทั้งหมด

พวกเขาไม่ใช้ความเชี่ยวชาญทางด้านเภสัชกรรม หรือ เทคนิคดั้งเดิมแต่มีความล้าหลัง เช่น กล้องจุลทรรศน์ไครโออิเล็กตรอน หรือแม้แต่วิธีการใช้อัลกอริธึมแบบเดิม ๆ ที่สามารถแก้ไขปัญหาได้ แต่สิ่งสำคัญที่ AlphaFold ใช้ก็คือความเชี่ยวชาญและความสามารถด้าน Machine Learning ที่เป็นพื้นฐานของเทคโนโลยี AI โดยนำเทคโนโลยีดังกล่าวมาผสานรวมกับชีววิทยาได้อย่างสมบูรณ์แบบ

สองปีต่อมามีการพาดหัวข่าวใหญ่ในวารสาร Scientific American “ในที่สุดปัญหาใหญ่ที่สุดประการหนึ่งในด้านชีววิทยาก็ได้รับการแก้ไขแล้ว”

ต้องบอกว่าจักรวาลโปรตีนที่ซ่อนอยู่ก่อนหน้านี้ได้ถูกเปิดเผยด้วยความเร็วอันน่าตกใจเอามาก ๆ AlphaFold ทำให้เทคโนโลยีโบราณก่อนหน้านั้นถูกเลิกใช้อย่างถาวร

มันเป็นเวลากว่าครึ่งทศวรรษที่การม้วนพับของโปรตีนเป็นหนึ่งในความท้าทายที่ยิ่งใหญ่ของวงการวิทยาศาสตร์ และทันใดนั้น มันก็ถูกทำลายโดย AlphaFold

ในปี 2022 AlphaFold2 เปิดให้ประชาชนทั่วไปสามารถนำไปใช้ได้ มันเป็นเครื่องมือด้าน Machine Learning ที่มีความล้ำหน้ามากที่สุดในโลกซึ่งถูกใช้งานทั้งในการวิจัยทางชีววิทยาขั้นพื้นฐานและประยุกต์

นักวิจัยมากกว่าหนึ่งล้านคนที่เคยงมเข็มในมหาสมุทรโปรตีนสามารถเข้าถึงเครื่องมือนี้ภายในสิบแปดเดือนหลังจากเปิดตัวรวมถึงห้องปฏิบัติการด้านชีววิทยาชั้นนำของโลกแทบจะทุกแห่ง

โดยเครื่องมือดังกล่าวสามารถตอบคำถามตั้งแต่การดื้อยาปฏิชีวนะไปจนถึงการรักษาโรคยาก ๆ หรือแม้กระทั่งคำถามในเรื่องต้นกำเนิดของสิ่งมีชีวิต

การทดลองในยุคโบราณก่อนหน้านี้มีการส่งโครงสร้างของโปรตีนได้ประมาณแค่ 190,000 ชนิดไปยังฐานข้อมูลของสถาบันชีวสารสนเทศของยุโรป หรือประมาณเพียงแค่ 0.1% ของโปรตีนที่มีอยู่

DeepMind ได้อัปโหลดโครงสร้างโปรตีนประมาณ 200 ล้านโครงสร้างได้ในครั้งเดียว ซึ่งเป็นตัวแทนของโปรตีนที่รู้จักเกือบทั้งหมด ในขณะที่เหล่านักวิจัยอาจต้องใช้เวลาหลายสัปดาห์หรือหลายเดือนเพื่อตรวจสอบรูปร่างและหน้าที่ของโปรตีน แต่กระบวนการดังกล่าวของ DeepMind นั้นสามารถทำได้ในเวลาเพียงไม่กี่วินาที

และนี่เป็นเพียงจุดเริ่มต้นของการมาบรรจบกันของเทคโนโลยีทั้งสองนี้ การปฏิวัติทางชีวภาพกำลังพัฒนาร่วมกับความก้าวหน้าของ AI และเราจะได้เห็นปัญหาอีกหลายอย่างที่ไม่เคยแก้ปัญหาได้ โดยเฉพาะการรักษาโรคยาก ๆ เช่น มะเร็ง อัลไซเมอร์ หรืออีกหลากหลายโรคที่พรากชีวิตคนที่เรารักไปแบบไม่รู้ตัว ซึ่งผมเชื่อว่าสุดท้ายโรคเหล่านี้มันจะจบลงในรุ่นของเราได้อย่างแน่นอนครับผม

References :
หนังสือ The Coming Wave :  Technology, Power, and the Twenty-first Century’s Greatest Dilemma โดย Mustafa Suleyman
https://th.wikipedia.org/wiki/การม้วนพับโปรตีน
https://cs60052016.blogspot.com/2016/10/brute-force-algorithm.html

ขี้ขโมยก็ต้องโดนวางยาพิษ กับการล้างแค้นของเหล่าศิลปินที่ถูกขโมยผลงานแบบหน้าด้าน ๆ โดย AI

ความรุ่งเรืองของยุค Generative AI ที่เกิดขึ้น ก็ต้องบอกว่ากลุ่มคนที่เกิดความเสียหายกับพวกเขามากที่สุดคงหลีกหนีไม่พ้นกลุ่มศิลปิน ที่เกี่ยวข้องกับงานสร้างสรรค์ที่เรียกได้ว่าผลงานที่แลกมาด้วยหยาดเหงื่อแรงกายของพวกเขานั้นโดนขโมยไปสร้างผลงานโดย AI

มันไม่ใช่เรื่องน่าแปลกใจกับความสามารถของ AI ในการสร้างสรรค์งานศิลปะในแขนงต่าง ๆ ไม่ว่าจะเป็นโมเดล AI ที่ใช้ในการสร้างภาพอย่าง DALL-E,Midjourney และ Stable Diffusion หรือเคสล่าสุดที่เกี่ยวข้องกับงานสร้างสรรค์วีดีโออย่าง Sora ของ OpenAI นั้น จะสร้างสรรค์ผลงานออกมาแล้วมันดูคุ้น ๆ ว่าไปเอาความสามารถเหล่านี้มาจากไหนหากพวกมันสามารถคิดเองเออเองได้ทั้งหมดด้วยตัวมันเอง

บริษัทที่พัฒนาเทคโนโลยี AI เช่น OpenAI , Meta , Google และ Stability AI กำลังเผชิญกับการฟ้องร้องจำนวนมากจากศิลปินที่อ้างว่าเนื้อหาที่มีลิขสิทธิ์แบบถูกต้องตามกฎหมายและข้อมูลส่วนบุคคลของพวกเขาถูกขโมยไปอย่างหน้าด้าน ๆ โดย AI

แต่เหมือนสวรรค์ทรงโปรดให้กับเหล่าศิลปินที่ต้องการล้างแค้นเจ้า AI หน้าด้านเหล่านี้ เมื่อเครื่องมือใหม่ที่มีชื่อว่า Nightshade ได้ถือกำเนิดขึ้นและถูกออกแบบมาเพื่อต่อสู้กับเหล่าบริษัท AI ทั้งหลาย

ซึ่งรูปแบบการทำงานของมันก็คือการสร้างข้อมูลที่เปรียบเสมือนยาพิษหลอกเจ้า AI ทั้งหลาย ให้สาสมที่มันมันกจะขโมยผลงานของคนอื่นไปฝึกอบรบแล้วแอบอ้างโดยไม่ให้เครดิตว่าเป็นผลงานของตนเอง

รูปแบบคล้าย ๆ การวางยาพิษ ทำให้ข้อมูลที่จะถูกนำไป training โดย AI ไม่สามารถที่จะทำซ้ำมันได้ในอนาคต โดยทำให้ผลลัพธ์บางส่วนกลายเป็นสิ่งไร้ค้า เช่น สุนัขกลายเป็นแมว รถยนต์กลายเป็นวัว และอื่น ๆ

Ben Zhao ศาสตราจารย์แห่งมหาวิทยาลัยชิคาโก ซึ่งเป็นผู้นำทีมที่สร้าง Nightshade กล่าวว่า ความหวังอันสูงสุดของเขาก็คือมันจะช่วยสร้างเครื่องมือปกป้องที่ทรงพลังต่อการไม่เคารพลิขสิทธิ์และหยาดเหงื่อแรงกายของศิลปิน

ทีมงานของ Zhao ยังได้พัฒนา Glaze ซึ่งเป็นเครื่องมือที่ช่วยให้ศิลปินช่วยปกปิดสไตล์ส่วนตัวของตนเองเพื่อป้องกันไม่ให้บริษัท AI สามารถเลียนแบบมันได้

โดยมันจะทำงานในลักษณะเดียวกับ Nightshade โดยการเปลี่ยนพิกเซลของภาพในรูปแบบที่มีความละเอียดอ่อนซึ่งตามนุษย์ไม่สามารถมองเห็นได้ แต่ใช้เทคโนโลยี Machine Learning เพื่อตีความภาพว่าเป็นสิ่งที่แตกต่างจากที่มันแสดงจริง ๆ

Ben Zhao ศาสตราจารย์แห่งมหาวิทยาลัยชิคาโก ซึ่งเป็นผู้นำทีมที่สร้าง Nightshade (CR:global.uchicago.edu)
Ben Zhao ศาสตราจารย์แห่งมหาวิทยาลัยชิคาโก ซึ่งเป็นผู้นำทีมที่สร้าง Nightshade (CR:global.uchicago.edu)

โดยทีมพัฒนาตั้งใจที่จะรวม Nightshade เข้ากับ Glaze และศิลปินสามารถเลือกได้ว่าต้องการใช้เครื่องมือเพื่อทำลายข้อมูลหรือไม่ และทีมงานยังมีการเปิดโอเพ่นซอร์ส Nightshade ซึ่งจะช่วยให้ผู้อื่นสามารถปรับแต่งและสร้างเวอร์ชันของตนเองได้

และเมื่อยิ่งมีคนใช้มันมากเท่าไหร่และสร้างเวอร์ชันของตัวเองมากขึ้น เครื่องมือเหล่านี้ก็จะมีประสิทธิภาพมากยิ่งขึ้น

การโจมตีไปที่จุดอ่อนของ AI

แม้ทุกคนอาจจะมองว่าเทคโนโลยี AI ในยุคนี้มันฉลาดเกินมนุษย์ไปเสียแล้ว แต่ด้วยความที่มันเป็นเทคโนโลยียังไงมันก็มีจุดอ่อนให้โจมตีเสมอ

Nightshade ใช้ประโยชน์จากช่องโหว่ด้านความปลอดภัยในโมเดล AI ทั่วไปซึ่งเกิดขึ้นจากการที่โมเดลเหล่านี้ได้รับการ training จากข้อมูลจำนวนมหาศาลซึ่งภาพส่วนใหญ่ก็มีการดูดมาจากอินเทอร์เน็ตนั่นเอง

ศิลปินที่ต้องการอัปโหลดผลงานทางออนไลน์ แต่ไม่ต้องการที่จะให้บริษัท AI ดูดภาพของพวกเขาไปใช้งาน สามารถอัพโหลดไปที่ Glaze และเลือกที่จะเติมยาพิษเข้าไปด้วยสไตล์ศิลปะที่แตกต่างจากต้นฉบับของพวกเขาได้

เมื่อเหล่านักพัฒนาในบริษัทด้าน AI พยายามที่จะดูดภาพมาจากอินเทอร์เน็ตเพื่อปรับแต่งโมเดล AI ที่มีอยู่อยู่หรือสร้างโมเดลใหม่ขึ้นมา ยาพิษเหล่านั้นก็จะเข้าไปทำลายชุดข้อมูลในโมเดลและทำให้มันทำงานผิดปรกติทันที

ซึ่งแน่นอนว่ามันเหมือนหอกทิ่มแทงเข้าไปใจกลางหัวใจของ AI เมื่อพวกมันได้รับยาพิษ เครื่องมันก็รวนไปหมด เช่น มองเห็นรูปภาพหมวกเป็นเค้ก และรูปภาพกระเป๋าถือเป็นเครื่องปิ้งขนมปัง เป็นต้น

ที่สำคัญยาพิษเหล่านี้มันลบได้ยากมาก ๆ โดยเฉพาะโมเดลขนาดใหญ่ ๆ ที่คอยดูดข้อมูลมั่วซั่วไปซะหมดทั้งของฟรีและของที่มีลิขสิทธิ์ เพราะต้องคัดแยกและลบตัวอย่างภาพที่เสียหายแต่ละตัวอย่างระมัดระวัง

โดยนักวิจัยได้ทดสอบการโจมตีโมเดลล่าสุดของ Stable Diffusion เมื่อทำการป้อนข้อมูลรูปภาพของสุนัขพร้อมแนบยาพิษสุดแสบเข้าไปให้ Stable Diffusion เพียง 50 รูป แล้วสั่งให้มันสร้างรูปภาพของสุนัขขึ้นมาเอง

การวางยาพิษให้ AI ที่ทำงานให้การทำงานของมันเพี้ยนไปหมด (CR:technologyreview)
การวางยาพิษให้ AI ที่ทำงานให้การทำงานของมันเพี้ยนไปหมด (CR:technologyreview)

ผลลัพธ์ที่ได้ผิดเพี้ยนไปจากความเป็นจริง สุนัขได้แปรเปลี่ยนเป็นสัตว์ประหลาดมีแขนขาและใบหน้าแบบการ์ตูน และด้วยตัวอย่างข้อมูลสุนัขแฝงด้วยยาพิษ 300 ภาพ Stable Diffusion เพี้ยนถึงขนาดว่าสร้างภาพสุนัขให้เหมือนแมวได้เลยทีเดียว

เครื่องมือที่ทรงพลัง

Junfeng Yang ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์ที่มหาวิทยาลัยโคลัมเบีย ซึ่งศึกษาความปลอดภัยของเทคโนโลยี Deep Learning กล่าวว่า Nightshade อาจมีผลกระทบอย่างมากหากทำให้บริษัทด้าน AI เคารพสิทธิของศิลปินมากขึ้น เช่น การเต็มใจที่จะจ่ายค่าลิขสิทธิ์มากขึ้นไม่ใช่ขโมยไปแบบดื้อ ๆ

บริษัท AI ที่ได้พัฒนาโมเดลการแปลงข้อความเป็นรูปแบบ เช่น Stability AI และ OpenAI ได้เสนอทางเลือกให้ศิลปินเลือกไม่ใช่รูปภาพของตนเองเพื่อฝึกโมเดลเวอร์ชันในอนาคต

แต่ศิลปินมองว่าแค่นั้นมันไม่เพียงพอ Eva Toorenent นักวาดภาพประกอบและหนึ่งในศิลปินที่เคยใช้ Glaze กล่าวว่านโยบายชุ่ย ๆ แบบนี้ มันแทบจะไร้ค่าเพราะสุดท้ายแล้วเราก็ยังปล่อยให้บริษัทเทคโนโลยีมีอำนาจทั้งหมดอยู่ดี

Toorenent หวังว่า Nightshade จะเป็นฮีโร่มาช่วยศิลปินแก้ไขปัญหาดังกล่าวได้อย่างเป็นรูปธรรม

“มันจะทำให้บริษัท AI ผู้หิวโหยข้อมูล ต้องคิดทบทวน เพราะมันมีความเป็นไปได้ว่ามันอาจจะเป็นจุดเริ่มต้นของการทำลายโมเดลทั้งหมดที่ขโมยผลงานของเราโดยไม่ได้รับความยินยอมจากเรา” เธอกล่าว

Eva Toorenent นักวาดภาพประกอบและหนึ่งในศิลปินที่เคยใช้ Glaze  (CR:evaboneva.com)
Eva Toorenent นักวาดภาพประกอบและหนึ่งในศิลปินที่เคยใช้ Glaze (CR:evaboneva.com)

Authumn Beverly ศิลปินอีกคนกล่าวว่าเครื่องมืออย่าง Nightshade และ Glaze ทำให้เธอมั่นใจในการโพสต์ผลงานของเธอออนไลน์อีกครั้ง ซึ่งก่อนหน้านี้เธอได้ลบมันออกจากอินเทอร์เน็ตทั้งหมดหลังจากพบว่ามันถูกขโมยโดยไม่ได้รับความยินยอมจากเธอโดย LAION ที่ใช้วิธีการทำ Web Scraping ซึ่งเป็นการใช้บอตเพื่อค้นหาภาพจากอินเทอร์เน็ตและดูดมันมา

“ฉันรู้สึกขอบคุณจริง ๆ ที่เรามีเครื่องมือที่สามารถช่วยคืนพลังให้กับศิลปินสำหรับการช่วยปกป้องงานของพวกเขาเองได้” เธอกล่าว

บทสรุป

แม้มันจะเป็นเรื่องดีสำหรับเครื่องมือเหล่านี้สำหรับเหล่าศิลปิน แต่การนำยาพิษมารบกวนกระบวนการเรียนรู้ของ AI ทำให้เกิดความท้าทายที่อาจเกิดขึ้นกับผลลัพธ์ของมันเช่นกัน หากนำไปใช้ในทางที่ไม่ถูกต้อง

ความสัมพันธ์ที่มีความซับซ้อนระหว่างศิลปินและโมเดล AI ตั้งแต่การป้องกันการใช้งานโดยไม่ได้รับอนุญาตไปจนถึงภัยคุกคามที่อาจเกิดขึ้นกับโมเดล AI ที่ใช้ในการสร้างภาพ

เครื่องมือเหล่านี้ได้นำพามนุษย์เราไปในดินแดนที่ไม่เคยประสบพบเจอมาก่อนในโลกแห่งศิลปะโดย AI ที่มีการพัฒนาอยู่ตลอดเวลา ซึ่งสุดท้ายทุกอย่างก็ต้องมีความบาลานซ์กันระหว่างศิลปะ เทคโนโลยี และเรื่องจริยธรรม ที่กำลังไหลเวียนมาบรรจบกันอย่างที่เราได้เห็นในทุกวันนี้นั่นเองครับผม

References :
https://www.technologyreview.com/2023/10/23/1082189/data-poisoning-artists-fight-generative-ai/
https://www.themarysue.com/artists-fighting-back-against-ai-with-glaze-and-nightshade/
https://medium.com/generative-ai-art/nightshade-and-glaze-tools-reshape-the-battle-against-unauthorized-ai-model-training-3d49996e01c4