โคลนนิ่งความทรงจำกับการทำให้สัตว์เลี้ยงอยู่กับคุณตลอดกาล

Garlic เป็นลูกแมวขนปุยที่มีจมูกสีชมพูและหูสีเทาขนาดเล็ก มันดูเหมือนกับแมวที่ถูกโคลนนิ่ง  “แมวของฉันเสียชีวิตจากโรคระบบทางเดินปัสสาวะ” เจ้าของ Garlic Huang Yu บอกกับ Globaltimes “ ฉันตัดสินใจที่จะโคลนนิ่งมันเพราะมันมีความพิเศษและน่าจดจำมากสำหรับตัวฉัน”

แต่ในขณะที่ Garlic มีคุณสมบัติทางชีวภาพเหมือนกับบรรพบุรุษของมัน  แต่มันไม่ใช่แมวตัวเดียวกัน โดยมันมีบุคลิกภาพของตัวเองและตอนนี้มันกำลังสร้างความทรงจำของตัวเอง

ตอนนี้ บริษัท เทคโนโลยีชีวภาพ Sinogene ของจีนได้เปิดตัวแมวโคลนนิ่งตัวแรกของประเทศ โดยที่ได้กล่าวว่าในอนาคตบริษัทจะใช้ปัญญาประดิษฐ์ (AI) ในการถ่ายโอนความทรงจำจากสัตว์เลี้ยงอันเป็นที่รักของคุณไปยังตัวที่ถูกโคลนนิ่ง

ผู้จัดการทั่วไปของ Sinogene บอกกับผู้เข้าร่วมประชุมในงานแถลงข่าวเมื่อวันจันทร์ที่ผ่านมาว่า“ เพื่อให้สัตว์เลี้ยงโคลนนิ่งเหล่านี้สามารถถ่ายทอดความทรงจำเดียวกันกับตัวต้นแบบของมันได้

ซึ่ง บริษัท กำลังพิจารณาใช้ปัญญาประดิษฐ์หรือเทคโนโลยี man-machine interface เพื่อทำการจัดเก็บหรือส่งผ่านความทรงจำไปยัง สัตว์ที่ถูกโคลนนิ่ง” จากรายงานของ สำนักข่าว Global Times ของประเทศจีน 

โดย Sinogene กำลังมองหาตลาดที่แน่นอนว่าเหล่าเจ้าของสัตว์เลี้ยงที่แสนรักของเขาล้วนมีความผูกพันและเมื่อตัวหนึ่งต้องตายไปไม่ว่าด้วยเหตุใดก็ตาม พวกเขาก็มีความต้องการสัตว์เลี้ยงที่เหมือนกันทั้งร่างกายและวิญญาณ ซึ่งเปรียบเสมือนสัตว์ตัวเดียวกันนั่นเอง

นักวิทยาศาสตร์อ้างว่าสัตว์โคลนนิ่งเหล่านี้จะไม่แข็งแรงเท่า และยังมีอายุขัยที่สั้นกว่าสัตว์ที่เกิดตามธรรมชาติ ในขณะที่นักเคลื่อนไหวสัตว์บางคนแย้งว่าการโคลนนิ่งสัตว์เลี้ยงนั้นผิดจรรยาบรรณเนื่องจากยังมีจำนวนสัตว์จรจัดอีกจำนวนมากที่ต้องการบ้านอยู่

แต่ถึงกระนั้นก็ยังไม่ได้ทำให้  Barbra Streisand , Simon Cowell และคนที่ไม่ใช่คนดังมากมายที่ต้องเสียเงินหลายพันดอลลาร์เพื่อให้สัตว์เลี้ยงอันเป็นที่รักของพวกเขากลับมามีชีวิตอีกครั้ง

ในขณะเดียวกันเจ้า Garlic ที่มีอายุเพียงหนึ่งเดือนและ Sinogene กล่าวว่า มีเจ้าของสัตว์เลี้ยงอีกเป็นจำนวนมาก ที่พร้อมจ่ายเงินประมาณ 250,000 หยวน (35,400 ดอลลาร์) เพื่อให้แมวของตัวเองถูกโคลน

และหาก บริษัท สามารถหาวิธีที่จะเลียนแบบความทรงจำของสัตว์เลี้ยงได้ ก็ไม่มีใครบอกได้ว่าสัตว์จำนวนมากจะถูกทิ้งไว้ในที่พักพิง ในขณะที่เจ้าของสัตว์เลี้ยงที่รู้สึกเศร้าใจจากการสูญเสียก็ได้หันไปหาหนทางทางวิทยาศาสตร์เพื่อช่วยให้พวกเขาได้อยู่กับสัตว์เลี้ยงแสนรักของพวกเขาไปตลอดกาลได้นั่นเองครับ

References : 
http://www.globaltimes.cn

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

Facebook แอบดักฟังการสนทนาของเราจริงหรือไม่?

หลายคนอาจจะสงสัยว่า Facebook นั้นได้ทำการดักฟังบทสนทนาของผู้ใช้ ที่เป็นความลับจริงหรือไม่ หลังจากที่่บางครั้งเราแค่พูดแต่กลับมาโฆษณาในสิ่งที่เราพูดโผล่มาในหน้า Feed อย่างรวดเร็ว

ซึ่งล่าสุดได้มีรายงานข่าวจากสำนักข่าวใหญ่อย่าง Bloomberg ว่า สื่อโซเชียลยักษ์ใหญ่แห่งนี้แอบบันทึกการสนทนาผ่านไมโครโฟนในโทรศัพท์ของผู้ใช้งาน

นั่นเป็นไปตามบริษัท Sub-Contract ของ Facebook ที่ได้มีการพูดคุยกับ  Bloomberg เกี่ยวกับการปฏิบัติงานที่ได้รับมอบหมายจาก Facebook  ซึ่งทางบริษัทได้กล่าวว่าพวกเขาได้รับเงินเพื่อฟังบทสนทนาที่หยาบคายเป็นครั้งคราวในหมู่ผู้ใช้งาน Facebook Messenger

แม้ว่าบริษัทจะไม่เคยอธิบายให้พวกเขาฟังว่าทำไมมันถึงต้องมีการถอดข้อความเสียงจาก Facebook  ซึ่งทาง Facebook ได้กล่าวกับ Bloomberg ว่าการแอบบันทึกเสียงเหล่านี้ เป็นการทำเพื่อทดสอบประสิทธิภาพของเทคโนโลยี speech-recognition artificial intelligence ของทาง Facebook เอง ซึ่งถือเป็นการยอมรับอย่างหนักใจว่า บริษัทได้ละเมิด ความเป็นส่วนตัวของผู้ใช้งานเป็นประจำ

Facebook บอกกับ Bloomberg ว่าจะหยุดโครงการลับเหล่านี้เมื่อสัปดาห์ที่แล้ว แต่ในการพิจารณาคดีต่าง ๆ นานาในสภาคองเกรส CEO Mark Zuckerberg ยืนยันว่า Facebook เข้าถึงไมโครโฟนของผู้คนเมื่อได้รับอนุญาตจากผู้ใช้งานเท่านั้น เพื่อคุณสมบัติในบาง Features  เช่น การส่งข้อความเสียงเป็นต้น โดยตัว Zuckerberg ไม่เคยเปิดเผยว่า Facebook ได้ส่งข้อมูลเสียงเหล่านี้ไปยังบริษัท Sub-Contract ที่เป็นบริษัท third party แต่อย่าใด

ซึ่งชัดเจนว่ามันเป็นความแตกต่างกับข้อมูลที่ได้เปิดเผยจากทาง Facebook เอง ซึ่งสำนักข่าว Bloomberg ได้รายงานว่า Facebook ไม่ได้กล่าวถึงการบันทึกเสียงของผู้ใช้งาน ในนโยบายการใช้ข้อมูลที่เป็นสิ่งที่ทุกคนต้องยอมรับก่อนเข้าใช้งาน Facebook แต่อย่างใด

References : 
https://www.bloomberg.com

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

Startup จีนสร้าง AI ตามหาสุนัขที่หายไปด้วยภาพของจมูก

Megvii เป็น Startup ด้าน AI ของจีนที่สร้างซอฟต์แวร์จดจำใบหน้าสำหรับโปรแกรมการเฝ้าระวังของรัฐบาลจีน กำลังขยายเทคโนโลยีให้มากกว่าที่จะใช้ในมนุษย์เพียงเดียว โดยมีการสร้างระบบเพื่อจดจำใบหน้าสัตว์เลี้ยงที่แตกต่างกัน 

ตามรายงานของ Abacus News โปรแกรมใหม่ของ Megvii ได้รับการฝึกฝนให้รู้จักสุนัขด้วยการรูปแบบของจมูก ซึ่งเป็นการเลียนแบบการระบุตัวตน เหมือนกับที่มนุษย์ใช้ลายนิ้วมือในการระบุตัวตนแต่ละบุคคลได้นั่นเอง

การใช้แอพ Megvii นั้น ทางบริษัท บอกว่าสามารถลงทะเบียนสุนัขของคุณได้ง่ายๆเพียงสแกนจมูกด้วยกล้องในโทรศัพท์ของคุณ เช่นเดียว กับที่โทรศัพท์ลงได้สร้างระบบจดจำลายนิ้วมือของคุณเพื่อปลดล็อคนั่นเอง ซึ่งแอพจะขอให้คุณถ่ายรูปจมูกสุนัขของคุณจากหลายมุม

โดยทาง Megvii กล่าวว่ามันมีอัตราความแม่นยำในการระบุตัวสุนัขได้สูงถึง 95 เปอร์เซ็นต์และตอนนี้ได้รวมตัวฐานข้อมูลสัตว์เลี้ยงจำนวนกว่า 15,000 ตัว ผ่านแอพดังกล่าวเป็นที่เรียบร้อยแล้ว

การจดจำใบหน้าสำหรับสัตว์เลี้ยงเริ่มแพร่หลายมากขึ้นในช่วงไม่กี่ปีที่ผ่านมา แนวคิดที่ได้รับการใช้งานโดยนักวิจัยเพื่อการอนุรักษ์สัตว์ป่า ในสหรัฐอเมริกา แอปที่ชื่อว่า Finding Rover ก็ได้ใช้เทคโนโลยีการจดจำใบหน้าเพื่อค้นหาแมวและสุนัขที่ถูกรายงานว่าหายไปเช่นเดียวกัน

แต่ในประเทศจีน Megvii กล่าวว่าแอปนี้จะใช้งานได้มากกว่าแค่ใช้ในการค้นหาสัตว์เลี้ยงที่หายไป ด้วยความสัมพันธ์ที่มีอยู่กับรัฐบาล ทางบริษัทได้กล่าวว่าแอพนี้สามารถใช้ในการตรวจสอบ “การดูแลสุนัขที่ไม่ดี” สำหรับเหล่าเจ้าของสัตว์เลี้ยงที่ ไม่มีจิตสำนึกในสาธารณะ ซึ่งอาจจะเป็นการปล่อยให้สัตว์เลี้ยงไปถ่ายเรี่ยราดตามที่สาธารณะได้นั่นเอง

References : 
https://www.theverge.com

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

จีนกำลังจะส่ง Artificial Moon ไปยังระบบอวกาศโลก

นักวิทยาศาสตร์ และ วิศวกรชาวจีน กำลังร่วมมือกันพัฒนา Artificial Moon หรือดวงจันทร์จำลองโดยใช้เทคโนโลยี AI โดยมีแผนที่จะส่งไปยังระบบอวกาศจริง ๆ เพื่อให้เป็นแสงไฟส่องสว่าง ไปยังเมือง Chengdu แทนที่ ไฟตามท้องถนนในเวลากลางคืน

ซึ่งจากรายงานของหนังสือพิมพ์ชื่อดังอย่าง The People’s Daily นั้น ดวงจันทร์จำลองนี้จะเป็นรูปแบบของดาวเทียมส่องสว่าง โคจรอยู่เหนือโลก

โดยจะให้ความสว่างสูงถึง 8 เท่าของแสงสว่างจาก ดวงจันทร์จริง ๆ ครอบคลุมพื้นที่ได้มากถึง 50 ตารางไมล์

ซึ่งใน project นี้ยังช่วยเป็นพลังานทดแทนได้อีกด้วย สามารถที่จะลดงบประมาณต่าง ๆ ที่เกี่ยวข้องได้ถึง 2 หมื่นล้านหยวน ในเวลา 5 ปี

เมือง chengdu ประเทศจีน

เมือง chengdu ประเทศจีน

และ นักวิจัย ยังอ้างว่า Articicial Moon นั้นยังปลอดภัยต่อระบบชีวภาพ และไม่เป็นอันตรายต่อสายตามนุษย์

โดยมีกำหนดการที่จะส่งขึ้นสู่อวกาศภายในปี 2020 เพื่อช่วยเพิ่มความสว่างในเวลากลางคืน ให้กับประชากรเมือง Chengdu

ความน่าสนใจในการพัฒนา AI ของจีน

หากคนที่อยู่ในวงการวิทยาศาสตร์ ตอนนี้ ไม่ว่าจะเป็นแขนงไหน ๆ ก็ตาม ที่มีโอกาสได้อ่าน Paper ที่ตีพิมพ์จากจีนนั้น ต้องบอกว่าเป็นเรื่องที่น่าสนใจอย่างมาก เพราะจากเดิมที่เรามองจีน เป็น ดินแดนของ ก๊อปปี้ ทำได้แค่พัฒนาสินค้าเลียนแบบ ไร้คุณภาพเท่านั้น

ตอนนี้เราต้องมองจีนใหม่แล้ว เพราะตอนนี้ ประเทศจีน สามารถผลิตได้แทบจะทุกอย่างที่มีในโลกของเรา และไม่ใช่เพียงแค่พัฒนาของไร้คุณภาพออกมาอีกต่อไป ตอนนี้ ด้วยความก้าวหน้าด้านงานวิจัยจีนนั้น

ทั้งเรื่องใหญ่ อย่าง AI ที่กำลังขับเคี่ยวกับประเทศอเมริกา หรือ แม้กระทั่ง สาขา ชีววิทยา หรือทางการแพทย์ ก็ตาม จีนกำลังเริ่มฉีกหนีห่างจากประเทศอื่น ๆ ไปเรื่อย ๆ

ซึ่งจากข่าวนี้ ที่จีนจะสร้าง ดวงจันทร์ AI ที่เป็นดวงจันทร์เสมือน มาให้แสงส่องสว่าง ในเมือง Chengdu นั้น ก่อนหน้านี้ถ้ามีข่าวแบบนี้ ต้องคิดว่าเป็นเรื่องไร้สาระอย่างแน่แท้ แต่ตอนนี้ จีนพร้อมแล้ว ในทุก ๆ อย่างที่จะก้าวขึ้นไปเป็นผู้นำเศรษฐกิจโลก ด้วยพื้นฐาน ของการ R&D ที่กำลังขับเคลื่อนจีนก้าวไปข้างหน้าอย่างรวดเร็วนั่นเอง

Credit Video : @nowthisnews

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage :facebook.com/tharadhol.blog
Blockdit :blockdit.com/tharadhol.blog
Twitter :twitter.com/tharadhol
Instragram :instragram.com/tharadhol

Support Vector Machine กับการวิเคราะห์มะเร็งเต้านม

เนื่องจากในตอนเรียนปริญญาโท ผมได้มีโอกาสที่จะทำงานวิจัยที่เกี่ยวข้องกับการใช้ machine learning ในการวิเคราะห์การตรวจหามะเร็งเต้านมของผู้หญิง รวมถึงในปัจจุบันผมงานของตัวผมเองก็อยู่ใน domain นี้โดยตรง ซึ่งแม้จะเป็นเวลาหลายปีมาแล้ว แต่ช่วงนี้กระแสของ AI รวมถึง Machine Learning กำลังมาแรง จึงขอจะกล่าวถึงซักหน่อย รวมถึง algorithm ที่ผมเลือกใช้คือ Support Vector Machine เริ่มถูกพูดถึงในหลาย ๆ  วงการแม้กระทั่งวงการ trading  เนื่องจากมีความแม่นยำในการจำแนกค่อนข้างสูง

ปัจจุบันนั้นโรคมะเร็งเต้านมกำลังเป็นปัญหาทางสาธารณสุขของทุกประเทศทั่วโลก เนื่องจากโรคมะเร็งเป็นโรงที่ร้ายแรงที่คุกคามชีวิตมนุษย์โดยไม่เลือกเพศและวัยนอกจากนี้โรคมะเร็งเป็นโรคเรื้อรัง ที่ต้องใช้เวลาในการรักษานาน ทำให้ผู้ป่วยเกิดความทุกข์ทรมาน มีค่าใช้จ่ายสูง และยังคุกคามความเป็นอยู่ของครอบครัว ในปัจจุบันนั้นโรคมะเร็งจึงเป็นสาเหตุการตายอันดับต้น ๆ ของประชากรโลก ซึ่งรวมถึงประชากรในประเทศไทย มะเร็งเป็นโรคที่เกิดขึ้นกับเซลหลายชนิด หลายอวัยวะ

ซึ่งเต้านมเป็นอวัยวะหนึ่งในอวัยวะเพศหญิงที่มีอัตราการเป็นมะเร็งได้ค่อนข้างสูง ในประเทศไทยก็พบว่ามีผู้ป่วยมะเร็งเต้านมในอัตราที่สูง และมีแนวโน้มสูงขึ้นเรื่อย ๆ ซึ่งอัตราการเติบโตของมะเร็งเต้านมในไทยนั้นได้มีการเพิ่มปริมาณขึ้นอย่างรวดเร็วซึ่งสอดคล้องกับการเติบโตของโรคนี้ในประชากรทั่วโลก และเป็นโรคมะเร็งที่เกิดขึ้นมากที่สุดในเพศหญิง และอัตราการเสียชีวิตก็เพิ่มขึ้นในอัตราที่รวดเร็วเช่นกัน

ในปัจจุบันยังไม่มีวิธีการใดที่สามารถรักษาโรคนี้ได้อย่างมีประสิทธิภาพเพียงพอ ซึ่งการตรวจหาผ่านการ X-Ray จึงเป็นปัจจัยสำคัญในการรักษาโรค และปรับปรุงอัตราการรอดตายที่เกิดขึ้นจากโรคมะเร็งเต้านม ซึ่งในปัจจุบันนั้นวิธีการที่มีความน่าเชื่อถือที่สุดในการตรวจหามะเร็งเต้านมนั้น คือ การวินิจฉัยผ่านคลังข้อมูลภาพทางการแพทย์ ที่มีการเก็บอย่างมีประสิทธิภาพ จากคลังข้อมูลที่มีขนาดใหญ่ ซึ่งระเบียบวิธีขั้นตอนดังกล่าวนั้นสามารถช่วยเร่งกระบวนการในการวินิจฉัยโรคได้อย่างรวดเร็ว แต่ก็ยังมี limit อยู่กับความสามารถของแพทย์ที่ไม่เท่าเทียมกัน รวมถึง แพทย์ที่ expert จริงๆ  ด้านนี้ยังมีอยู่น้อยมาก รวมถึงความแม่นยำในการวินิจฉัยนั้นยังมีข้อจำกัดอยู่ถ้าเทียบกับประสิทธิภาพของ AI

 

Support Vector Machine คืออะไร

Support Vector Machine  เป็นตัวแบบที่ใช้ในการระบุตัวบุคคลหรือ object  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์เป็นตัวแบบที่ใช้ในการระบุตัวบุคคล  โดย SVM จะทำการแบ่งชั้นของข้อมูลด้วยระนาบหลายมิติ  จากข้อมูล 2 กลุ่มชุดข้อมูล  โดยตัวแบบของ SVM เกี่ยวข้องกับเครือข่ายประสาทเทียม

ซึ่งโดยอันที่จริงแล้วตัวแบบของ SVM ใช้ Sigmoid Kernel Function ซึ่งมีค่าเท่ากันทั้ง 2 เลเยอร์ ตัวแบบของ SVM มีความคล้ายคลึงกับเพอร์เซฟตรอนซึ่งเป็นข่ายงานประสาทเทียมแบบง่ายมีหน่วยเดียวที่จำลองลักษณะของเซลล์ประสาท  ด้วยการใช้ Kernal Function

โดยใน paper ที่ตีพิมพ์เกี่ยวกับ SVM นั้นจะเรียกตัวแปรในการตัดสินใจว่า คุณสมบัติและตัวแปรที่เปลี่ยนแปลงใช้ในการกำหนดระนาบหลายมิติ ซึ่งเรียกว่า โครงสร้าง (feature)  ส่วนการเลือกที่มีความเหมาะสมที่สุดเรียกว่า โครงสร้างในการคัดเลือก (feature selection)  จำนวนเซตของโครงสร้างที่ใช้อธิบายในกรณีหนึ่ง (เช่น แถวของการค่าที่เราคาดการณ์)  เรียกว่า  เวกเตอร์ (vector)  ดังนั้นจุดมุ่งหมายของตัวแบบ SVM คือการประโยชน์สูงสุดจากระนาบหลายมิติที่แบ่งแยกกลุ่มของเวกเตอร์ในกรณีนี้ด้วยหนึ่งกลุ่มของตัวแปรเป้าหมายที่อยู่ข้างหนึ่งของระนาบ  และกรณีของกลุ่มอื่นที่อยู่ทางระนาบต่างกัน  ซึ่งเวกเตอร์ที่อยู่ข้างระนาบหลายมิติทั้งหมดนี้เราจะเรียกว่า  ซัพพอร์ตเวกเตอร์ (Support Vectors)

 

Atrribute Reduction based on Atribute Importance Function

มี paper หลายตัวที่นำเสนอการใช้ Support Vector Machine ในการวิเคราะห์ มะเร็งเต้านม ซึ่งให้ค่าความแม่นยำไม่ต่างกันเท่าไหร่ในหลากหลายวิธี แต่ในตอนนั้นผมสนใจในเรื่องการ Improve Attribute base on Inportance Function ซึ่งเป็นการกรองคุณสมบัติ หรือ features ที่เป็นขยะออกไปให้มากที่สุด เนื่องจากเราใช้ค่าทางสถิติหลายอย่างในการจำแนก ซึ่งบางค่านั้นแทบจะไม่มีผลต่อความแม่นยำในการจำแนกผลเลยด้วยซ้ำ เทคนิค นี้ก็ทำเพื่อแยก คุณสมบัติที่มีผลต่อความแม่นยำจริง ๆ ให้ได้มากที่สุด ก่อนนำไป training

ซึ่งผมได้สนใจเป็นพิเศษในงานวิจัย  An Improved Attribute Reduction Algorithm  based on Attribute Importance function  ได้นำเสนอวิธีในการลดคุณลักษณะของข้อมูลโดยปรับปรุงส่วนของ Discernibility Matrix ของ Attribute โดยจะพิจารณาจากฟังก์ชั่นที่สำคัญ เมื่อนำข้อมูลมาแปลงในรูปแบบของ Binary Discernibility Matrix รวมกับการคุณสมบัติการลดคุณลักษณะโดยใช้ Rough Set Theory โดยจะลดคุณลักษณะที่ไม่จำเป็นออกโดยใช้ฟังก์ชันสำคัญของคุณลักษณะที่ได้ทำการปรับปรุงผ่าน ของ Matrix ซึ่งจะสามารถทำให้มีประสิทธิภาพที่ดีขึ้น

โดยการพิสูจน์ทำโดยวิเคราะห์ความเปรียบต่าง (contrast)  ซึ่งเมื่อมองใน time complexity นั้นจะมีประสิทธิภาพกว่างานวิจัยพื้นฐานของการใช้ Rough Set Theory ในการลดคุณลักษณะของข้อมูล วิธีการลดคุณลักษณะของ Matrix Binary Discernibility ซึ่งแม้ว่าคุณลักษณะที่ตรงกับคอลัมน์ใน Matrix ที่มีค่า “1” จำนวนมากนั้น ซึ่งในหลาย ๆ งานวิจัย  แสดงให้เห็นว่าสามารถลดส่วนที่ไม่จำเป็นออกไปได้โดยมองจาก Importance Function ซึ่งมองที่ จำนวนการเกิดของคุณลักษณะ และ ความยาวขององค์ประกอบของ Discernibility Binary Matrix ซึ่งจะได้ค่าฟังก์ชั่นดังนี้

 

เมื่อ mij คือ Binary Discernibility Matrix ซึ่งได้จากการแปลงข้อมูลที่เราสนใจโดยใช้การDicretizationซึ่งจากสมการนั้น Count(c) หมายถึงจำนวนรวมของ c attribute ที่ปรากฏใน matrix  Len c (mij) คือความยาวขององค์ประกอบใน matrix ที่มีคุณสมบัติ c

จากสมการจะได้ค่าตามอัตราส่วนของจำนวนลักษณะที่ปรากฏ และความยาวเฉลี่ยของ matrix ที่มีคุณสมบัติ c ซึ่งหมายความว่าถ้าการเกิดขึ้นของสองลักษณะที่แตกต่างกันจำนวนมาก ทำให้คุณลักษณะนั้นปรากฏมากขึ้น  ซึ่งส่วนที่สำคัญในการลดคุณลักษณะคือ คุณสมบัติที่มีจำนวนการเกิดที่โดดเด่นของข้อมูลที่มีคุณลักษณะ c

 

Feature extraction and Selection

คุณสมบัติด้าน Texture ได้รับการพิสูจน์จากงานวิจัยหลาย ๆ ชิ้น แล้วว่ามีประโยชน์ในเรื่องการจำแนกความแตกต่างของมวลและเนื้อเยื่อของเต้านมปกติใน digital mammograms ซึ่งสามารถแยกความปกติและผิดปรกติของเนื้อเยื่อรวมถึง microcalcifications  ซึ่งคุณสมบัติด้าน Texture นั้นจะทำการจำแนกโดยใช้ Gray level co-occurrence matrices (GLCM)  ซึ่ง matrices นั้นจะถูกสร้างจากระยะทาง d=1 และทิศทางของθให้เป็น 0 °, 45 °, 90 ° และ 135 °

ซึ่งการใช้เพียงทิศทางเดียวอาจจะไม่เพียงพอและทำให้ข้อมูลที่จำแนกมีความน่าเชื่อถือได้ด้วยเหตุนี้การใช้สี่ทิศทางจะใช้ในการจำแนกข้อมูล Texture ของแต่ละพื้นที่ใน digital mammograms ซึ่งการอธิบายค่าของ Texture จาก GLCM นั้นจะมีค่าที่เกี่ยวข้องคือ Contrast , energy , homogeneity และ correlation ของค่า gray scale  ซึ่งค่า energy ที่อยู่ในบาง element ของ GLCM นั้น สามารถอ้างได้ถึงรูปแบบของการเกิดก้อนเนื้อ ส่วนค่าของ Homogeneity นั้นจะสามารถอ้างได้ถึงการกระจายตัวขององค์ประกอบใน GLCM  ส่วนค่า Correlation นั้น จะแสดงถึงความสัมพันธ์ของ pixel ที่อยู่ใกล้เคียงกันของ image ซึ่งจากงานวิจัยส่วนใหญ่ นั้นใช้ฐานข้อมูลส่วนใหญ่ในขนาด 32*32  และใช้ขนาดเล็กสุดที่ 8*8  ซึ่งสามาถแสดงรายละเอียดดังนี้

 

Gray-level co-occurrence matrix (GLCM)

Gray-level co-occurrence matrix (GLCM) นิยมใช้เป็นอย่างมากในการวิเคราะห์โครงร่างของภาพ เนื่องจากโครงร่างของภาพเป็นคุณลักษณะที่สามารถมองเห็นได้โดยตรงจากภาพ ดังนั้น ในการพิจารณาโครงร่างของภาพจากค่าระดับเทาจะต้องใช้เมตริกซ์ ขนาด 2 มิติ gray-level co-occurrence matrix เป็นเมตริกซ์ 2 มิติ ซึ่งพิจารณาได้ จากการเกิดค่าระดับเทาซํ้าๆ กันในโครงร่างของภาพ (คุณสมบัติดังกล่าวเปลี่ยนแปลงตามระยะทางอย่างรวดเร็วในโครงร่างที่ละเอียด และเปลี่ยนแปงอย่างช้าๆ ในโครงร่างที่หยาบ) สำหรับการวิเคราะห์ส่วนที่เป็นโครงร่างของภาพจะใช้เมตริกซ์จัตุรัสที่มีขนาด M×M (M เป็นจำนวนค่าระดับเทาของภาพ) มาคํานวณ การเกิดค่าระดับเทาซํ้าๆ กันสามารถอธิบายได้ด้วยเมตริกซ์ที่มีความถี่ที่ สัมพันธ์กันซึ่งเขียนแทนได้ด้วย Pd,r(i,j) ซึ่งแทนความถี่ในการเกิดค่าระดับเทาที่ i และ j ในวินโดวส์ที่พิจารณา ด้วยระยะห่างเท่ากับ d ที่ทิศทาง r ความถี่ ของ gray-level co-occurrence matrix สามารถเขียนเป็นฟังก์ชันใน 4 ทิศทางที่ระยะทาง d ใดๆได้ดังนี้

เมื่อ |{…}| แทนเซตของค่าที่เป็นไปได้ตามเงื่อนไข

การจําแนกโครงร่างสามารถทําได้ด้วยการใช้เกณฑ์ในการพิจารณาลักษณะโครงร่างของพื้นผิวภาพ บางประการที่ได้จาก co-occurrence matrix ดังต่อไปนี้

ในหลาย ๆ งานวิจัย นั้นใช้การทำ pre-processing image ก่อนที่จะนำมาใช้ในการจำแนก โดยคุณสมบัติของการจำแนกนั้นจะมาจากฐานข้อมูล ซึ่งฐานข้อมูลดังกล่าวนั้นสามารถสร้างโดยการรวบรวมคุณลักษณะที่มีอยู่แล้วบางชนิด เช่น ชนิดของเนื้อเยื่อ (ความหนาแน่นของไขมัน และ ต่อมไขมัน ) และตำแหน่งที่มีความผิดปรกติ ( เช่น จุดศูนย์กลางของวงกลมรอบเนื้องอก) ที่ทำการจำแนกโดยคุณสมบัติ 4 อย่างทางสถิติ คือ mean, variance, skewnessและ kurtosis ซึ่งใช้สูตรสำหรับการคำนวณค่าทางสถิติแต่ละค่าดังนี้

ซึ่ง N หมายถึงจำนวน Gray Level ในภาพเต้านมโดย fk เป็นระดับสีเทา   ที่  nk คือจำนวน pixel ที่ fk เป็น Gray Level  และ n คือ จำนวน pixel ทั้งหมด

ซึ่งคุณสมบัติการจำแนกนั้นจะมีการคำนวณใน windows ที่มีขนาดเล็กของรูปต้นฉบับ โดยที่จะนำรูปต้นฉบับนั้นมาแบ่งเป็นสี่ส่วน เพื่อเพิ่มประสิทธิภาพในการจำแนกผล ซึ่งค่าสถิติต่าง ๆ ที่ได้ทำการคำนวณใน 16 ส่วนย่อยนั้น จะได้ค่าคุณสมบัติทั้งหมด 64 ค่าของแต่ละ image โดยจะนำค่าดังกล่าวไปประมวลผลกับเทคนิค Support Vector Machine เป็นลำดับต่อไป

 

Experiment

 โดยในการทดลอง ก็จะนำเทคนิคและงานวิจัยที่เกี่ยวข้องดังกล่าวมาพัฒนาและปรับปรุง ในด้านประสิทธิภาพการทำงานทั้งในเรื่องของความแม่นยำของการจำแนก และรวมถึงประสิทธิภาพในการประมวลผลข้อมูลให้ดียิ่งขึ้น โดยการทดลองจะเน้นที่การปรับปรุงส่วนของการคัดเลือกคุณลักษณะที่เหมาะสม เพื่อให้ SVM algorithm ทำงานได้อย่างมีประสิทธิภาพมากขึ้น ซึ่งจากงานวิจัย ก่อนหน้านั้นจะเห็นได้ถึงแนวทางในการปรับปรุงการคัดเลือกคุณลักษณะที่เหมาะสมโดยมองที่ฟังก์ชั่นสำคัญ ซึ่งจะเป็นการลดคุณลักษณะของข้อมูล และเมื่อเปรียบเทียบกับการใช้ Rough Set Theory แบบ General Model หรือ การใช้ Genetic algorithm ร่วมกับเทคนิคของ Decision Tree นั้น ก็เป็นแนวทางที่สามารถทำให้ได้ผลการทดลองมีประสิทธิภาพมากยิ่งขึ้น

ซึ่งเมื่อทำการศึกษาจุดอ่อนและจุดแข็งของแต่ละงานวิจัยที่เกี่ยวข้องกับการจำแนกภาพดิจิตอลแมมโมแกรมนั้น เราสามารถใช้เทคนิค ที่มีอยู่มาปรับใช้ได้อย่างมีประสิทธิภาพ จึงเป็นจุดที่ผมสนใจที่จะนำเทคนิคต่าง ๆ ที่เกี่ยวข้องมาปรับและเพิ่มเติมในส่วนที่เป็นข้อบกพร่องกับการทดลองให้มีประสิทธิภาพการทำงานที่ดีขึ้น และสามารถใช้กับข้อมูลจริง ที่ได้จากการทำงานจริงกับโรงพยาบาลที่มีเครื่องมือประเภท Digital Mammogram เพื่อใช้ในการวิเคราะห์รักษาและช่วยจำแนกประเภทของข้อมูลภาพเต้านม ร่วมกับผู้เชี่ยวชาญที่เป็นแพทย์ทางด้านรังสีวิทยาได้อย่างมีประสิทธิภาพมากยิ่งขึ้น
ซึ่งจากงานวิจัยที่เกี่ยวข้องนั้นสามารถนำมาปรับปรุงการคัดเลือกคุณลักษณะเพื่อเพิ่มประสิทธิภาพโดยใช้เทคนิคของ Reduction Attribute based on important function เพื่อปรับปรุงความแม่นยำและประสิทธิภาพการทำงานของการคัดเลือกและจำแนกโดยใช้ SVM Algorithm กับภาพประเภทดิจิตอลแมมโมแกรมซึ่งมี วิธีการดังนี้

 

ส่วนของ input data นั้นผมจะใช้ภาพดิจิตอลแมมโมแกรมจาก MIAS ( Mammogram Image Analysis Society) ซึ่งเป็นข้อมูลที่ใช้เป็นมาตรฐานของงานวิจัยที่ยอมรับในปัจจุบันและจากงานวิจัยที่เกี่ยวข้องกับการทำ Feature Extraction ของดิจิตอลแมมโมแกรมนั้น จะใช้เทคนิคของ GLCM  ในการ extract features ซึ่งจะได้ค่า features ที่มีประสิทธิภาพในการจำแนกผลที่ให้ความแม่นยำสูง

รวมถึงค่า features ทางด้านสถิติต่าง ๆ เพื่อเข้าสู่กระบวนการ Features Selection  โดยใช้พื้นฐานของงานวิจัยในด้านการลดคุณลักษณะ ( Reduction Attribute based on important function) โดยจะมีการแก้ไขข้อจำกัดในเรื่องของ significant weight ที่จากงานวิจัยตัวอย่าง นั้นจะมีข้อจำกัดในข้อมูลที่ทำการ discretization ออกมาแล้ว Matrix เหลือขนาดเล็กเกินไปทำให้การคำนวณค่า significant weight

จากงานวิจัยตัวอย่าง  นั้นจะมีการเลือกค่า Attribute ที่ตัดไปนั้นอาจจะมีผลต่อความแม่นยำในการจำแนก เพราะ สาเหตุของการเลือกค่า significant weight ที่มีค่ามากที่สุด ที่มีหลายค่านั้นทำให้ต้องมีการเลือกเพียง attribute เพียงตัวเดียว และ หากมีการเลือกตัวใดตัวหนึ่ง ก็จะมีผลต่อการเลือกในตัวต่อไป ซึ่งจะได้ผลการจำแนกที่แตกต่างกันเนื่องจากการเลือกลด Attribute ตัวใดไปแล้วจะมีผลต่อการเลือก Attribute ตัวถัดไปทันทีซึ่งถือเป็นจุดอ่อนของงานวิจัยชิ้นดังกล่าว

 

Experiment Results

ผมใช้เทคนิคการตรวจสอบ 10 fold cross validation techniques  เพื่อประเมินประสิทธิภาพของอัลกอริทึม และได้ทำการแบ่งฐานข้อมูลคุณลักษณะใน 10 แบบ สำหรับการแบ่งแต่ละครั้งที่เราเลือกไว้ประมาณ 90% ของชุดข้อมูลสำหรับการ training  และส่วนที่เหลือสำหรับการทดสอบ นั่นคือ 288 ภาพสำหรับชุด training  และ 34 ภาพสำหรับชุดทดสอบ ซึ่งฐานข้อมูลคุณสมบัติประกอบด้วยคุณสมบัติที่สกัดได้และข้อมูลที่มีอยู่ของภาพ 322 ภาพใน MIAS แอตทริบิวต์ที่เป็นตัวเลขทั้งหมดใช้วิธีการ extract features จากที่นำเสนอในหัวข้อข้างบน ผมขอเรียกการทดลองนี้เป็น ISVM เพื่อเปรียบเทียบกับ SVM แบบปรกติ  ซึ่งในขั้นตอนการ training  ISVM ถูกนำมาใช้กับข้อมูลการ training

จากนั้นสำหรับการจัดหมวดหมู่ในช่วงเวลาเดียวกันจำนวนของการเลือก Attributes  ต่าง ๆ  จะถูกบันทึกไว้โปรแกรม SVM ซึ่งมาจาก LIBSVM  ซึ่งเราได้ผลการทดลองดังนี้

จากตาราง แสดงการเปรียบเทียบในแง่ของจำนวน Attributes ที่เลือก และการจำแนกความถูกต้องของอัลกอริทึมที่ทำการทดลองคือ ISVM และอัลกอริทึมของ SVM คอลัมน์แรกคือ 10 fold cross validation ของ MIAS คอลัมน์ที่สองและสี่คือความถูกต้องที่แยกได้ของ SVM และ ISVM โดยพิจารณาจาก 10 fold ส่วนคอลัมน์ที่สาม Attributes number  คือจำนวนของการเลือกคุณลักษณะของ ISVM ที่ด้านล่างของ ตารางค่าเฉลี่ยของแต่ละคอลัมน์จะปรากฏขึ้น จากตารางสามารถสรุปได้ว่า  ISVM นั้นมีประสิทธิภาพ ดีกว่าอัลกอริธึม SVM เพียงอย่างเดียวในแง่ของความถูกต้องในการจำแนกประเภท ที่เวลาเดียวกัน แต่ต้องแลกด้วยเวลาที่เพิ่มขึ้นในการทำ Reduction base on Importance function แต่เราจะได้ Attributes จริงๆ ที่มีผลต่อการจำแนกมากกว่าการใช้ SVM ร่วมกับ Attributes ทั้งหมดที่เราสามารถ Extract ออกมาได้จริง

อย่างไรก็ดี การทดสอบนี้นั้นใช้ข้อมูลจาก MIAS เท่านั้นเพื่อนำมาทดสอบจึงทำให้ประสิทธิภาพในการจำแนกสูงถึงกว่า 90% แต่ในโลกของความจริงใน real world นั้น เราไม่สามารถได้รูปที่สมบูรณ์แบบเพื่อมาทำ Features Extraction ได้อย่างมีประสิทธิภาพ เนื่องด้วยปัจจัยหลายอย่างที่ไม่สามารถควบคุมได้เช่น Technician ที่ทำงานที่เราไม่สามารถ control ในส่วน Quality ได้อย่างมีประสิทธิภาพ  รวมถึงเครื่องไม้เครื่องมือต่างๆ  ซึ่งมีผลต่อคุณภาพของ Image ที่จะนำมาทดสอบ แต่ก็เป็นการทดลองที่เห็นแนวโน้มของการใช้ AI หรือ Machine Learning มาใช้กับ Healthcare ซึ่งน่าจะมีบทบาทสำคัญต่อไปในอนาคตอันใกล้นี้อย่างแน่นอน

 

ติดตาม ด.ดล Blog เพิ่มเติมได้ที่
Fanpage : facebook.com/tharadhol.blog
Blockdit : blockdit.com/tharadhol.blog
Twitter : twitter.com/tharadhol
Instragram : instragram.com/tharadhol

 

 

References : 

  1.      https://www.bedfordbreastcenter.com/mammogram-los-angeles/
  2.      http://ieeexplore.ieee.org/document/4731868/
  3.      http://www.mammoimage.org/databases/
  4.      https://link.springer.com/chapter/10.1007/978-3-540-73451-2_80
  5.      http://ieeexplore.ieee.org/document/1040110/
  6.      https://www.researchgate.net/publication/284700306_Medical_image_feature_extraction_selection_and_classification
  7.      https://www.ncbi.nlm.nih.gov/pubmed/21611053
  8.      http://elcvia.cvc.uab.es/article/view/216