AI ใหม่ของ IBM กับการเรียนรู้ผ่านความทรงจำ

เมื่ออัลกอริทึม AI เริ่มมีการเรียนรู้ทักษะใหม่ ตัวอย่างการเล่น วิดีโอเกมเช่น StarCraft II  ซึ่งแน่นอนว่ามันดีพอที่จะโค่นล้มผู้เชี่ยวชาญเกมส์ StarCraft II ที่ดีที่สุดที่เป็นมนุษย์ได้ไม่ยากนัก

แต่นั่นเป็นเรื่องจริงถ้าทุกคนเล่นตามกฎเกณฑ์เดียวกัน แต่หากเราเปลี่ยนพารามิเตอร์ของเกม จะทำให้ AI พบว่าตัวเองไม่สามารถปรับตัวได้ทั้งหมด ตัวอย่างเช่น AI ที่เก่งในเกม Pong ไม่สามารถรับมือแม้แต่การเปลี่ยนระยะทางไปเพียงเล็กน้อยระหว่างไม้ตีทั้งสองนั่นเอง

ตอนนี้การวิจัยใหม่ของ IBM ที่จะนำเสนอในการประชุม AI ในเดือนพฤษภาคมที่ผ่านมา  บริษัท ด้านเทคโนโลยียักษ์ใหญ่ กล่าวว่าความสามารถใหม่ของ AI ตอนนี้ ทำให้มันสร้างอัลกอริทึมที่สามารถเรียนรู้ได้ทันที โดยใช้ประโยชน์จากสิ่งที่คล้ายกับหน่วยความจำเสมือนเพื่อปรับให้เข้ากับสภาพแวดล้อมที่เปลี่ยนแปลงโดยไม่จำเป็นต้องได้รับการฝึกฝนตั้งแต่เริ่มต้นใหม่เหมือน AI รูปแบบเดิม ๆ ที่เคยมีมา

ตัวอย่างเช่นเมื่อเล่นเกม Flappy Bird อัลกอริทึมสามารถเล่นต่อไปได้แม้ว่าระยะทางระหว่างท่อและสิ่งกีดขวางยังคงเปลี่ยนไป ตามรายงานการวิจัยล่าสุดโดยห้องปฏิบัติการ IBM-Watson AI ซึ่งตัวอย่างที่น่าทึ่งของ ของการปรับตัวเรียนรู้ได้ตามสถานการณ์ของ AI จาก IBM

เป้าหมายสุดท้ายของโครงการนี้ คือ การสร้างปัญญาประดิษฐ์ที่คล้ายมนุษย์มากที่สุด หรือ ทำให้มันเหมือน AI จากนิยายวิทยาศาสตร์นั่นเอง งานวิจัยใหม่นี้ยังไม่ได้เพียงแต่จะทำให้ AI เรียนรู้ในแบบมนุษย์มากขึ้นโดยเลียนแบบความยืดหยุ่นของสมอง และความสามารถในการปรับปรุงฐานความรู้เมื่อกาลเวลาผ่านพ้นไป หรือสภาพแวดล้อมที่เปลี่ยนแปลงไปนั่นเอง

Matt Riemer นักวิทยาศาสตร์ของ IBM อธิบายว่าการวิจัยของทีมของเขาจัดการกับปัญหาของ AI ซึ่งโดยทั่วไปอัลกอริทึม AI จะตกเป็นเหยื่อของสิ่งที่เรียกว่า “catastrophic forgetting”  ซึ่งความหมายคือ AI ลืมการฝึกอบรมก่อนหน้าทั้งหมดทันทีที่พวกเขาได้รับการฝึกฝนเกี่ยวกับงานใหม่ที่เกิดขึ้น

นักวิทยาศาสตร์คนอื่นได้จัดการกับกับเรื่องดังกล่าวเฉกเช่นเดียวกับที่ IBM ทำ โดยทีมหนึ่งจาก DeepMind ของ Google ได้สร้างอัลกอริธึมด้วยวิธีการที่อนุญาตให้ AI เก็บ“ ความทรงจำ” ได้ดีขึ้น ซึ่งงานวิจัยใหม่นี้จัดการปัญหาที่คล้ายกันกับการวิจัย DeepMind แต่จากมุมมองที่ต่างออกไปนั่นเอง

แต่ Riemer เขียนว่าการป้องกันอัลกอริทึมจากการลืมสิ่งที่เคยเรียนรู้มานั้นไม่ดีเท่ากับการสร้าง AI ที่สามารถปรับและเรียนรู้สิ่งใหม่ ๆ ได้แบบเดียวกับทักษะของมนุษย์นั่นเอง

ความแตกต่างที่สำคัญคือทีมงานของ IBM พบวิธีการฝึกอบรม AI เพื่อให้ เมื่อพบกับการเปลี่ยนแปลงสภาพแวดล้อมไม่ว่าจะเป็นระยะห่างระหว่างท่อในเกม Flappy Bird หรือสิ่งอื่นใด ความรู้ที่มีอยู่และการฝึกอบรมที่มีอยู่ถูกถ่ายโอนไปยังงานใหม่ได้อย่างมาประสิทธิภาพมากที่สุด

ในท้ายที่สุด Riemer เขียนเป้าหมายสูงสุดของ IBM คือการสร้าง AI ที่สามารถทำสิ่งต่าง ๆ ด้วยตัวเอง เรียนรู้ และปรับตัวโดยไม่จำเป็นต้องมีมนุษย์คอยดูแลและคอยช่วยเหลือไปตลอดทางนั่นเอง

References : 
https://futurism.com

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

Comments