ข้อจำกัด เป็นส่วนประกอบพื้นฐานในกระบวนการเพิ่มประสิทธิภาพของ Support Vector Machines (SVMs) ซึ่งเป็นวิธีการที่นิยมและทรงพลังในด้านการเรียนรู้ของเครื่องจักรสำหรับงานการจำแนกประเภท ข้อจำกัดนี้มีบทบาทสำคัญในการทำให้แน่ใจว่าโมเดล SVM จำแนกจุดข้อมูลการฝึกได้อย่างถูกต้องในขณะที่เพิ่มระยะขอบระหว่างคลาสต่างๆ ให้สูงสุด เพื่อให้เข้าใจถึงความสำคัญของข้อจำกัดนี้ได้อย่างถ่องแท้ จำเป็นต้องพิจารณาถึงกลไกของ SVM การตีความทางเรขาคณิตของข้อจำกัด และผลที่ตามมาสำหรับปัญหาการเพิ่มประสิทธิภาพ
Support Vector Machines มุ่งหวังที่จะค้นหาไฮเปอร์เพลนที่เหมาะสมที่สุดซึ่งแยกจุดข้อมูลของคลาสต่างๆ ด้วยระยะขอบสูงสุด ไฮเปอร์เพลนในปริภูมิ n มิติถูกกำหนดโดยสมการ ที่นี่มี
คือเวกเตอร์น้ำหนักปกติของไฮเปอร์เพลน
คือเวกเตอร์คุณลักษณะอินพุต และ
เป็นคำที่มีอคติ เป้าหมายคือการจำแนกจุดข้อมูล โดยที่จุดจากคลาสหนึ่งวางอยู่บนด้านหนึ่งของไฮเปอร์เพลน และจุดจากอีกคลาสหนึ่งอยู่ฝั่งตรงข้าม
ข้อจำกัด ทำให้มั่นใจได้ว่าแต่ละจุดข้อมูล
ได้รับการจำแนกอย่างถูกต้องและอยู่ทางด้านขวาของระยะขอบ ที่นี่,
แสดงถึงป้ายกำกับคลาสของจุดข้อมูล i-th ด้วย
สำหรับหนึ่งชั้นเรียนและ
สำหรับชั้นเรียนอื่น ระยะ
คือฟังก์ชันการตัดสินใจที่กำหนดตำแหน่งของจุดข้อมูลที่สัมพันธ์กับไฮเปอร์เพลน
เพื่อทำความเข้าใจการตีความทางเรขาคณิต ให้พิจารณาสิ่งต่อไปนี้:
1. การแบ่งแยกชนชั้นในทางบวกและทางลบ: สำหรับจุดข้อมูล อยู่ในกลุ่มเชิงบวก (
) ข้อจำกัด
ช่วยลดความยุ่งยากในการ
- ซึ่งหมายความว่าจุดข้อมูล
ต้องอยู่บนหรือนอกขอบเขตระยะขอบที่กำหนดโดย
- ในทำนองเดียวกันสำหรับจุดข้อมูล
อยู่ในกลุ่มเชิงลบ (
) ข้อจำกัดจะลดความซับซ้อนลง
เพื่อให้แน่ใจว่าจุดข้อมูลอยู่บนหรือนอกขอบเขตระยะขอบที่กำหนดโดย
.
2. การเพิ่มกำไรขั้นต้น: ระยะขอบคือระยะห่างระหว่างไฮเปอร์เพลนและจุดข้อมูลที่ใกล้เคียงที่สุดจากคลาสใดคลาสหนึ่ง ข้อจำกัดทำให้มั่นใจได้ว่าระยะขอบจะถูกขยายให้สูงสุดโดยการผลักจุดข้อมูลให้ห่างจากไฮเปอร์เพลนมากที่สุดเท่าที่จะเป็นไปได้ ในขณะที่ยังคงรักษาการจำแนกประเภทที่ถูกต้อง ระยะทางจากจุดหนึ่ง ให้กับไฮเปอร์เพลนโดย
- โดยการบังคับใช้ข้อจำกัด
อัลกอริธึม SVM จะเพิ่มระยะห่างนี้อย่างมีประสิทธิภาพ ซึ่งนำไปสู่ระยะขอบที่มากขึ้นและประสิทธิภาพการวางนัยทั่วไปที่ดีขึ้น
3. สนับสนุนเวกเตอร์: จุดข้อมูลที่วางอยู่บนขอบเขตระยะขอบพอดี และ
เรียกว่าเวกเตอร์แนวรับ จุดเหล่านี้มีความสำคัญในการกำหนดไฮเปอร์เพลนที่เหมาะสมที่สุด เนื่องจากเป็นจุดที่ใกล้ที่สุดกับไฮเปอร์เพลนและมีอิทธิพลโดยตรงต่อตำแหน่งและทิศทางของมัน ข้อจำกัดทำให้มั่นใจได้ว่าเวกเตอร์สนับสนุนเหล่านี้ได้รับการจำแนกอย่างถูกต้องและอยู่บนขอบเขตของระยะขอบ ดังนั้นจึงมีบทบาทสำคัญในปัญหาการปรับให้เหมาะสม
ปัญหาการปรับให้เหมาะสมที่สุดสำหรับ SVM สามารถกำหนดได้ว่าเป็นปัญหาการปรับให้เหมาะสมแบบนูน โดยมีวัตถุประสงค์เพื่อลดบรรทัดฐานของเวกเตอร์น้ำหนักให้เหลือน้อยที่สุด (ซึ่งเทียบเท่ากับการเพิ่มระยะขอบสูงสุด) ขึ้นอยู่กับข้อจำกัด
สำหรับจุดข้อมูลการฝึกอบรมทั้งหมด ในทางคณิตศาสตร์สามารถแสดงได้เป็น:
ปัจจัยของ รวมไว้เพื่อความสะดวกทางคณิตศาสตร์เมื่อหาอนุพันธ์ระหว่างการปรับให้เหมาะสม สูตรนี้เรียกว่ารูปแบบเบื้องต้นของปัญหาการปรับให้เหมาะสม SVM
เพื่อแก้ปัญหาการหาค่าเหมาะที่สุดนี้ โดยทั่วไปแล้วเราจะใช้เทคนิคจากการหาค่าเหมาะที่สุดแบบนูน เช่น ตัวคูณลากรองจ์ โดยการแนะนำตัวคูณลากรองจ์ สำหรับแต่ละข้อจำกัด ปัญหาการปรับให้เหมาะสมสามารถเปลี่ยนเป็นรูปแบบคู่ได้ ซึ่งมักจะแก้ไขได้ง่ายกว่า โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับข้อมูลที่มีมิติสูง ปัญหาการปรับให้เหมาะสม SVM รูปแบบคู่ได้รับจาก:
ที่ไหน คือจำนวนจุดข้อมูลการฝึก และ
เป็นพารามิเตอร์การทำให้เป็นมาตรฐานที่ควบคุมการแลกเปลี่ยนระหว่างการเพิ่มระยะขอบสูงสุดและลดข้อผิดพลาดในการจำแนกประเภทข้อมูลการฝึกอบรมให้เหลือน้อยที่สุด
สูตรคู่ใช้ประโยชน์จากเคล็ดลับเคอร์เนล ทำให้ SVM สามารถจัดการข้อมูลที่ไม่สามารถแบ่งแยกได้แบบไม่เป็นเชิงเส้น โดยการแมปข้อมูลอินพุตกับพื้นที่คุณลักษณะมิติที่สูงกว่าซึ่งสามารถแยกเชิงเส้นได้ สิ่งนี้สามารถทำได้ผ่านฟังก์ชันเคอร์เนล เช่น เคอร์เนลพหุนาม เคอร์เนลฟังก์ชันพื้นฐานรัศมี (RBF) และเคอร์เนลซิกมอยด์ ซึ่งคำนวณผลคูณดอทโดยปริยายในพื้นที่มิติที่สูงกว่าโดยไม่ต้องดำเนินการแปลงอย่างชัดเจน
ด้วยการแก้ปัญหาการหาค่าเหมาะที่สุดแบบคู่ เราจะได้ตัวคูณลากรองจ์ที่เหมาะสมที่สุด ซึ่งสามารถใช้เพื่อกำหนดเวกเตอร์น้ำหนักที่เหมาะสมที่สุด
และระยะอคติ
- เวกเตอร์สนับสนุนสอดคล้องกับจุดข้อมูลที่มีตัวคูณลากรองจ์ที่ไม่เป็นศูนย์ และฟังก์ชันการตัดสินใจสำหรับการจำแนกจุดข้อมูลใหม่
มอบให้โดย:
ข้อจำกัด จึงเป็นส่วนสำคัญในกระบวนการเพิ่มประสิทธิภาพ SVM เพื่อให้มั่นใจว่าแบบจำลองจะมีความสมดุลระหว่างการจัดประเภทข้อมูลการฝึกอบรมอย่างถูกต้องและการเพิ่มส่วนต่างสูงสุด ซึ่งนำไปสู่การสรุปข้อมูลทั่วไปที่ดีขึ้นในข้อมูลที่มองไม่เห็น
เพื่อแสดงให้เห็นความสำคัญของข้อจำกัดนี้ด้วยตัวอย่าง ให้พิจารณาปัญหาการจำแนกประเภทไบนารีอย่างง่ายที่มีจุดข้อมูลสองมิติ สมมติว่าเรามีข้อมูลการฝึกอบรมดังต่อไปนี้:
เป้าหมายคือการค้นหาไฮเปอร์เพลนที่เหมาะสมที่สุดที่แยกคลาสที่เป็นบวก () จากคลาสเชิงลบ (
- ข้อจำกัดสำหรับปัญหานี้สามารถเขียนได้ดังนี้:
การแก้ปัญหาการปรับ SVM ให้เหมาะสมด้วยข้อจำกัดเหล่านี้ทำให้เราได้เวกเตอร์น้ำหนักที่เหมาะสมที่สุด และระยะอคติ
ที่กำหนดไฮเปอร์เพลนที่แยกทั้งสองคลาสด้วยระยะขอบสูงสุด
ข้อจำกัด มีความสำคัญต่อกระบวนการเพิ่มประสิทธิภาพ SVM เนื่องจากช่วยให้สามารถจำแนกจุดข้อมูลการฝึกอบรมได้อย่างถูกต้อง พร้อมทั้งเพิ่มขอบเขตระหว่างคลาสต่างๆ ได้อย่างสูงสุด ส่งผลให้ประสิทธิภาพการสรุปผลทั่วไปและความทนทานของโมเดล SVM ดีขึ้น
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/MLP Machine Learning ด้วย Python:
- พารามิเตอร์ b ในการถดถอยเชิงเส้น (ค่าตัดแกน y ของเส้นพอดีที่ดีที่สุด) คำนวณอย่างไร
- เวกเตอร์สนับสนุนมีบทบาทอย่างไรในการกำหนดขอบเขตการตัดสินใจของ SVM และจะระบุได้อย่างไรในระหว่างกระบวนการฝึกอบรม
- ในบริบทของการปรับให้เหมาะสม SVM อะไรคือความสำคัญของเวกเตอร์น้ำหนัก `w` และอคติ `b` และจะพิจารณาได้อย่างไร
- จุดประสงค์ของวิธี "แสดงภาพ" ในการใช้งาน SVM คืออะไร และช่วยในการทำความเข้าใจประสิทธิภาพของแบบจำลองได้อย่างไร
- วิธีการ 'คาดการณ์' ในการใช้งาน SVM กำหนดการจำแนกประเภทของจุดข้อมูลใหม่อย่างไร
- วัตถุประสงค์หลักของ Support Vector Machine (SVM) ในบริบทของการเรียนรู้ของเครื่องคืออะไร
- ไลบรารีเช่น scikit-learn สามารถใช้ในการจำแนกประเภท SVM ใน Python ได้อย่างไร และฟังก์ชันหลักที่เกี่ยวข้องคืออะไร
- วัตถุประสงค์ของปัญหาการปรับให้เหมาะสม SVM คืออะไร และมีการกำหนดสูตรทางคณิตศาสตร์อย่างไร
- การจำแนกประเภทของคุณลักษณะที่ตั้งค่าใน SVM ขึ้นอยู่กับเครื่องหมายของฟังก์ชันการตัดสินใจอย่างไร (ข้อความ {เครื่องหมาย} (mathbf {x__i cdot mathbf {w} + b))
- บทบาทของสมการไฮเปอร์เพลนคืออะไร (mathbf{x} cdot mathbf{w} + b = 0) ในบริบทของ Support Vector Machines (SVM)
ดูคำถามและคำตอบเพิ่มเติมใน EITC/AI/MLP Machine Learning with Python