หลายคนอาจจะสงสัยว่าทำไม Tesla ถึงกล้าถอดเซนเซอร์ออกจากรถของพวกเขา? เรื่องนี้ต้องบอกว่าเป็นเรื่องที่น่าสนใจมาก ๆ ที่ Tesla ทำในสิ่งที่สวนกระแสของอุตสาหกรรม เพราะมันไม่ใช่แค่เรื่องของเทคโนโลยี แต่เป็นเรื่องของปรัชญาการทำงานที่น่าสนใจ
ในปี 2021 Tesla ได้ตัดสินใจถอดเรดาร์ออกจากชุดเซนเซอร์ และล่าสุดก็มีการถอดเซนเซอร์อัลตร้าโซนิกทั้งหมดออกไปอีก จนเหลือแค่ระบบกล้อง (Vision) เท่านั้น การตัดสินใจแบบนี้ทำให้หลายคนต่างสงสัย
แล้วการเลือกตัดแบบนี้จะทำให้ระบบการรับรู้ของรถยนต์ยากขึ้นหรือง่ายขึ้นกันแน่?
ก็ต้องบอกว่าเมื่อพูดถึงเซนเซอร์ในรถยนต์ หลายคนมักคิดว่ายิ่งมีมาก ระบบจะยิ่งเทพ แต่ความจริงแล้ว เซนเซอร์พวกนี้อาจกลายเป็นภาระมหาศาลที่ทำให้ระบบเละเทะได้เช่นเดียวกัน
เซนเซอร์ไม่ได้มาฟรีๆ ต้องมีทีมจัดซื้อ มีห่วงโซ่อุปทาน เจอปัญหาชิ้นส่วน ต้องเปลี่ยนเมื่อเสียหาย และถ้ามีปัญหา ก็ทำให้สายการผลิตสะดุดได้ง่ายๆ
ยิ่งไปกว่านั้น เซนเซอร์แต่ละชนิดต้องมีทีมเขียนเฟิร์มแวร์ ต้องบูรณาการเข้ากับระบบรวม ทำให้โครงสร้างองค์กรบวมใหญ่ขึ้นเรื่อยๆ จนอาจกลายเป็นองค์กรที่จัดการได้ยากในที่สุด
Elon Musk มีแนวคิดโครตเจ๋งที่ว่า “ชิ้นส่วนที่ดีที่สุดคือไม่มีชิ้นส่วน” เขาเข้าใจเรื่องเอนโทรปี (ความไร้ระเบียบ) ในองค์กร และพยายามกำจัดสิ่งที่ไม่จำเป็นออกไปตลอด
หลายคนอาจมองไม่เห็นต้นทุนที่ซ่อนอยู่ ซึ่งเมื่อพิจารณาต้นทุนทั้งหมด เซนเซอร์พวกนี้อาจเป็นภาระที่ไม่คุ้มค่า เนื่องจากเซนเซอร์แต่ละประเภทมีการเปลี่ยนแปลงตลอดเวลา วันนี้ใช้เรดาร์แบบหนึ่ง พรุ่งนี้อาจเป็นอีกแบบหนึ่ง ทำให้ต้องสร้างระบบฐานข้อมูลที่ซับซ้อนขึ้นเรื่อยๆ เพื่อรองรับความหลากหลายนั้น
สุดท้ายแล้ว เซนเซอร์พวกนี้สร้างสัญญาณรบกวน เพิ่มความไม่เป็นระเบียบ และทำให้องค์กรต้องกระจายความสนใจออกไป ไม่สามารถมุ่งเน้นไปที่สิ่งสำคัญจริงๆ ได้
เมื่อ Tesla เลือกที่จะทำงานเฉพาะกับระบบกล้อง ทรัพยากรทั้งหมดจะถูกมุ่งเน้นไปที่เทคโนโลยีเดียว ทำให้สามารถสร้าง data engine และพัฒนาระบบไปข้างหน้าได้อย่างเต็มรูปแบบ
กล้องเป็นเซนเซอร์ที่มีแบนด์วิดธ์มากที่สุด มีความท้าทายสูงสุด และเมื่อลงทุนเต็มที่กับมัน ก็จะพัฒนาให้ดีขึ้นได้อย่างก้าวกระโดด ไม่ต้องกระจายความสนใจไปที่อื่น
การถกเถียงระหว่าง Lidar และกล้องทำให้หลายคนสับสน แต่ประเด็นจริงๆ ควรอยู่ที่การมีฝูงยานพาหนะ (fleet) สำหรับเก็บข้อมูลมากกว่า ซึ่งเป็นสิ่งที่สำคัญกว่าประเภทของเซนเซอร์มาก
Lidar มีราคาแพงมาก ๆ มีปัญหาสารพัด และต้องการการปรับแต่งที่ซับซ้อน ซึ่งสร้างความยุ่งยากและเพิ่มความไม่เป็นระเบียบให้กับระบบอย่างมาก
เมื่อมองภาพรวม ประเด็นสำคัญอยู่ที่การสร้างฝูงยานพาหนะขนาดใหญ่ที่เก็บข้อมูลจำนวนมหาศาล และบูรณาการเข้ากับระบบข้อมูลที่แข็งแกร่ง
ระบบ Vision มีความจำเป็นเพราะโลกถูกออกแบบมาสำหรับการรับรู้ด้วยสายตาของมนุษย์ และในขณะเดียวกันแค่ระบบเดียวมันก็เพียงพอเพราะมีข้อมูลทั้งหมดที่จำเป็นสำหรับการขับขี่
สังเกตว่ามนุษย์ก็ใช้การมองเห็นเป็นหลักในการขับรถ ไม่ได้ใช้เรดาร์หรือ Lidar แต่อย่างใด ดังนั้น Vision จึงทั้ง “จำเป็น” และ “เพียงพอ” สำหรับการขับขี่อัตโนมัติ
การเพิ่มเซนเซอร์อื่นๆ ทำได้ไม่มีที่สิ้นสุด แต่ในที่สุดก็ต้องขีดเส้นและตัดสินใจว่าอะไรคือสิ่งจำเป็นจริงๆ ซึ่ง Tesla มองว่าเซนเซอร์นอกเหนือจาก Vision หรือ กล้อง ไม่คุ้มค่าพอ
บริษัทอื่นๆ ตัวอย่างเช่น Waymo ที่พัฒนาเทคโนโลยีขับขี่อัตโนมัติเช่นเดียวกับ Tesla เลือกใช้วิธีสร้างแผนที่ความละเอียดสูงล่วงหน้า และจำกัดพื้นที่ที่รถวิ่งได้
การสร้างและบำรุงรักษาแผนที่ที่มีความแม่นยำระดับเซนติเมตรสำหรับทุกพื้นที่ที่รถจะวิ่งผ่าน เป็นเรื่องบ้าคลั่งและไม่สมเหตุสมผล หากเรากำลังพูดถึงการปฏิวัติระบบขนส่งระดับโลกที่ต้องมีการ scale ระบบได้ง่าย
มนุษย์ไม่จำเป็นต้องมีแผนที่ละเอียดระดับเซนติเมตรในการขับรถ แค่รู้ว่ามีทางแยกข้างหน้าก็พอ Tesla ใช้ข้อมูลแผนที่แบบเดียวกับ Google Map แต่ไม่ได้ทำแผนที่แบบละเอียดยิบ
การทำแผนที่แบบละเอียดอาจจะทำให้เสียสมาธิ เพิ่มความไม่เป็นระเบียบ และทำให้ทีมกระจายความสนใจออกไป แทนที่จะมุ่งเน้นไปที่ปัญหาคอมพิวเตอร์วิชั่นที่แท้จริง
การลดทอนเซนเซอร์ลงเหลือเพียง Vision ไม่ได้ทำให้ประสิทธิภาพแย่ลง ในทางกลับกัน การมุ่งเน้นทรัพยากรไปที่การพัฒนาเทคโนโลยีเดียวให้แข็งแกร่งที่สุด ทำให้ระบบพุ่งทะยานขึ้นได้เช่นเดียวกัน
การลดความซับซ้อนยังช่วยเพิ่มความน่าเชื่อถือ เนื่องจากมีจุดที่อาจเกิดความล้มเหลวน้อยลง ระบบที่พึ่งพาเซนเซอร์หลายประเภทอาจจะล้มเหลวได้ง่ายหากเซนเซอร์ใดเซนเซอร์หนึ่งมีปัญหา
เมื่อไม่ต้องกังวลกับการรวมข้อมูลจากเซนเซอร์หลายประเภท ทีมวิศวกรสามารถรังสรรค์อัลกอริทึมการประมวลผลภาพให้แม่นยำและเร็วขึ้น นำไปสู่การพัฒนาที่ก้าวกระโดด
มนุษย์ขับรถได้อย่างปลอดภัยโดยใช้แค่ตาเป็นหลัก แม้จะได้ยินเสียงและรู้สึกถึงการเคลื่อนไหวด้วย แต่การมองเห็นยังเป็นประสาทสัมผัสหลักในการขับขี่
การพัฒนาระบบขับขี่อัตโนมัติโดยเลียนแบบวิธีการรับรู้ของมนุษย์จึงเป็นแนวทางที่มีเหตุผล แทนที่จะเพิ่มเทคโนโลยีเซนเซอร์ที่มนุษย์ไม่เคยต้องใช้มาก่อน
การมุ่งพัฒนาระบบ Vision ให้มีความสามารถเทียบเท่าหรือเหนือกว่าความสามารถในการมองเห็นของมนุษย์จึงเป็นเป้าหมายที่ตรงจุดและได้ผลมากกว่า
ข้อได้เปรียบมหาศาลของ Tesla คือการมีฝูงรถกว่าล้านคันที่วิ่งอยู่บนท้องถนนทั่วโลก ทำหน้าที่เป็นเครื่องเก็บข้อมูล ข้อมูลจากสถานการณ์จริงเหล่านี้มีค่ามากในการฝึกอัลกอริทึม AI
การมุ่งเน้นไปที่การเรียนรู้จากข้อมูลจริงในโลกจริง แทนที่จะพึ่งพาแผนที่สร้างไว้ล่วงหน้าหรือเซนเซอร์พิเศษ ทำให้ระบบของ Tesla มีความยืดหยุ่นและปรับตัวได้ดีกว่า ซึ่งเป็นคุณสมบัติสำคัญสำหรับการขับขี่ในสภาพแวดล้อมที่ไม่คาดคิด
การตัดสินใจของ Tesla ในการลดจำนวนเซนเซอร์อาจผลักดันให้อุตสาหกรรมยานยนต์อัตโนมัติทั้งหมดเปลี่ยนแนวคิด บริษัทอื่นๆ อาจเริ่มลดการพึ่งพาเซนเซอร์หลากหลายประเภทในอนาคต
เมื่อเทคโนโลยีคอมพิวเตอร์วิชั่นและการเรียนรู้ของเครื่อง (Machine Learning) มีความก้าวหน้ามากขึ้น การใช้กล้องเพียงอย่างเดียวก็อาจมีประสิทธิภาพเพียงพอและคุ้มค่ากว่า
การตัดสินใจของ Tesla ในการลดเซนเซอร์ลงเหลือแค่ Vision สะท้อนปรัชญาการทำงานที่มุ่งเน้นความเรียบง่ายและประสิทธิภาพ แม้จะดูเหมือนลดความสามารถลง แต่จริงๆ แล้วเป็นการมุ่งเน้นทรัพยากรไปที่เทคโนโลยีที่มีศักยภาพสูงสุด
การลดความซับซ้อนช่วยลดความไร้ระเบียบและเพิ่มประสิทธิภาพในการพัฒนา ในขณะที่การมีฝูงยานพาหนะขนาดใหญ่ทำหน้าที่เก็บข้อมูลจากโลกจริง สร้างความได้เปรียบที่สำคัญในการปลุกปั้นระบบ AI
ในท้ายที่สุด การถกเถียงเรื่องเทคโนโลยีเซนเซอร์ไม่ควรมุ่งเน้นเพียงประเภทของเซนเซอร์ แต่ควรพิจารณาถึงระบบโดยรวม รวมถึงความสามารถในการเก็บข้อมูล การประมวลผล และการเรียนรู้จากสถานการณ์จริง ซึ่งจะเป็นตัวขีดชะตาผู้ชนะในการแข่งขันพัฒนายานยนต์ขับขี่อัตโนมัติในอนาคต