การดึงคุณสมบัติเป็นขั้นตอนสำคัญในกระบวนการโครงข่ายประสาทเทียมแบบหมุนวน (CNN) ที่นำไปใช้กับงานการจดจำภาพ ใน CNN กระบวนการแยกคุณสมบัติเกี่ยวข้องกับการแยกคุณสมบัติที่มีความหมายจากรูปภาพอินพุตเพื่อช่วยให้จำแนกประเภทได้อย่างแม่นยำ กระบวนการนี้มีความสำคัญเนื่องจากค่าพิกเซลดิบจากรูปภาพไม่เหมาะกับงานจำแนกประเภทโดยตรง ด้วยการดึงคุณสมบัติที่เกี่ยวข้องออกมา CNN สามารถเรียนรู้ที่จะจดจำรูปแบบและรูปร่างภายในภาพ ทำให้สามารถแยกแยะความแตกต่างระหว่างวัตถุหรือเอนทิตีประเภทต่างๆ ได้
กระบวนการแยกคุณลักษณะใน CNN โดยทั่วไปเกี่ยวข้องกับการใช้เลเยอร์แบบหมุนวน เลเยอร์เหล่านี้ใช้ตัวกรองหรือที่เรียกว่าเคอร์เนลกับรูปภาพอินพุต ตัวกรองแต่ละตัวจะสแกนทั่วทั้งรูปภาพอินพุต ดำเนินการคูณและบวกตามองค์ประกอบเพื่อสร้างแผนผังคุณลักษณะ แผนที่คุณลักษณะจะบันทึกรูปแบบหรือคุณลักษณะเฉพาะที่มีอยู่ในภาพที่นำเข้า เช่น ขอบ พื้นผิว หรือรูปร่าง การใช้ตัวกรองหลายตัวในเลเยอร์แบบหมุนวนทำให้ CNN สามารถแยกชุดคุณลักษณะที่หลากหลายในลำดับชั้นเชิงพื้นที่ที่แตกต่างกันได้
หลังจากเลเยอร์ Convolutional แล้ว CNN มักจะรวมฟังก์ชันการเปิดใช้งาน เช่น ReLU (Rectified Linear Unit) เพื่อแนะนำความไม่เชิงเส้นในโมเดล ฟังก์ชันการเปิดใช้งานแบบไม่เชิงเส้นมีความสำคัญอย่างยิ่งในการทำให้ CNN สามารถเรียนรู้ความสัมพันธ์และรูปแบบที่ซับซ้อนภายในข้อมูลได้ โดยทั่วไปแล้ว การรวมชั้นเลเยอร์ เช่น การรวมสูงสุดหรือการรวมเฉลี่ย จะถูกนำไปใช้เพื่อลดขนาดเชิงพื้นที่ของแผนผังคุณลักษณะในขณะที่ยังคงรักษาข้อมูลที่เกี่ยวข้องมากที่สุด การรวมกลุ่มช่วยทำให้เครือข่ายแข็งแกร่งมากขึ้นต่อการเปลี่ยนแปลงของรูปภาพอินพุต และลดความซับซ้อนในการคำนวณ
หลังจากเลเยอร์การบิดและการรวมกลุ่ม คุณสมบัติที่แยกออกมาจะถูกทำให้แบนเป็นเวกเตอร์และส่งผ่านเลเยอร์ที่เชื่อมต่อกันอย่างสมบูรณ์ตั้งแต่หนึ่งเลเยอร์ขึ้นไป เลเยอร์เหล่านี้ทำหน้าที่เป็นตัวแยกประเภท โดยเรียนรู้ที่จะแมปคุณลักษณะที่แยกออกมากับคลาสเอาต์พุตที่สอดคล้องกัน เลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์ขั้นสุดท้ายมักจะใช้ฟังก์ชันการเปิดใช้งาน softmax เพื่อสร้างความน่าจะเป็นของคลาสสำหรับงานจำแนกประเภทหลายคลาส
เพื่อแสดงให้เห็นกระบวนการแยกคุณลักษณะใน CNN สำหรับการจดจำรูปภาพ ให้พิจารณาตัวอย่างการจัดประเภทรูปภาพเสื้อผ้า ในสถานการณ์นี้ CNN จะเรียนรู้ที่จะแยกคุณลักษณะต่างๆ เช่น พื้นผิว สี และลวดลายที่เป็นเอกลักษณ์ของเสื้อผ้าประเภทต่างๆ เช่น รองเท้า เสื้อเชิ้ต หรือกางเกง ด้วยการประมวลผลชุดข้อมูลขนาดใหญ่ของภาพเสื้อผ้าที่มีป้ายกำกับ CNN จะปรับตัวกรองและน้ำหนักซ้ำๆ เพื่อระบุและจัดประเภทคุณสมบัติที่โดดเด่นเหล่านี้ได้อย่างแม่นยำ ซึ่งท้ายที่สุดแล้ว ทำให้สามารถคาดการณ์ภาพที่มองไม่เห็นด้วยความแม่นยำสูงได้
การดึงคุณสมบัติเป็นองค์ประกอบพื้นฐานของ CNN สำหรับการจดจำภาพ ช่วยให้โมเดลสามารถเรียนรู้และแยกความแตกต่างระหว่างรูปแบบและคุณสมบัติที่เกี่ยวข้องภายในภาพที่ป้อนเข้า ด้วยการใช้เลเยอร์แบบสลับ ฟังก์ชันการเปิดใช้งาน การรวมเลเยอร์ และเลเยอร์ที่เชื่อมต่ออย่างสมบูรณ์ CNN สามารถแยกและใช้ประโยชน์จากคุณสมบัติที่มีความหมายได้อย่างมีประสิทธิภาพเพื่อดำเนินการจำแนกประเภทที่แม่นยำ
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/TFF TensorFlow Fundamentals:
- เราจะใช้เลเยอร์การฝังเพื่อกำหนดแกนที่เหมาะสมสำหรับการแสดงคำเป็นเวกเตอร์ได้อย่างไร
- จุดประสงค์ของการรวมสูงสุดใน CNN คืออะไร?
- จำเป็นต้องใช้ฟังก์ชันการเรียนรู้แบบอะซิงโครนัสสำหรับโมเดลการเรียนรู้ของเครื่องที่ทำงานใน TensorFlow.js หรือไม่
- พารามิเตอร์จำนวนคำสูงสุด TensorFlow Keras Tokenizer API คืออะไร
- TensorFlow Keras Tokenizer API สามารถใช้ค้นหาคำที่ใช้บ่อยที่สุดได้หรือไม่
- โทโค่คืออะไร?
- อะไรคือความสัมพันธ์ระหว่างยุคต่างๆ ในโมเดล Machine Learning และความแม่นยำของการคาดการณ์จากการรันโมเดล
- Pack Neighbors API ใน Neural Structured Learning ของ TensorFlow สร้างชุดข้อมูลการฝึกอบรมแบบเสริมตามข้อมูลกราฟธรรมชาติหรือไม่
- Pack Neighbors API ใน Neural Structured Learning ของ TensorFlow คืออะไร
- การเรียนรู้แบบโครงสร้างประสาทสามารถนำไปใช้กับข้อมูลที่ไม่มีกราฟธรรมชาติได้หรือไม่?
ดูคำถามและคำตอบเพิ่มเติมใน EITC/AI/TFF TensorFlow Fundamentals