อะไรคือข้อดีและความท้าทายของการใช้ 3D Convolutions สำหรับการจดจำการกระทำในวิดีโอ และชุดข้อมูล Kinetics มีส่วนสนับสนุนการวิจัยสาขานี้อย่างไร
วันพุธที่ 22 พฤษภาคม 2024 by สถาบัน EITCA
ข้อดีและความท้าทายของการใช้ 3D Convolutions สำหรับการจดจำการกระทำในวิดีโอ ข้อดี 1. การแยกคุณสมบัติ Spatio-Temporal: หนึ่งในข้อได้เปรียบหลักของการใช้ 3D Convolutions ในการจดจำการกระทำคือความสามารถในการจับภาพคุณสมบัติเชิงพื้นที่และเวลาพร้อมกัน ซึ่งแตกต่างจากการโน้มน้าวใจแบบ 2 มิติ ซึ่งประมวลผลเฉพาะข้อมูลเชิงพื้นที่แบบเฟรมต่อเฟรม การโน้มน้าวใจแบบ 3 มิติจะทำงานบน

