สถาปัตยกรรมของโครงข่ายประสาทเทียมที่ใช้ในตัวอย่างคือโครงข่ายประสาทเทียมแบบฟีดฟอร์เวิร์ดที่มีสามเลเยอร์: เลเยอร์อินพุต เลเยอร์ซ่อน และเลเยอร์เอาต์พุต เลเยอร์อินพุตประกอบด้วย 784 หน่วย ซึ่งสอดคล้องกับจำนวนพิกเซลในภาพอินพุต แต่ละหน่วยในเลเยอร์อินพุตจะแทนค่าความเข้มของพิกเซลในภาพ
เลเยอร์ที่ซ่อนอยู่ประกอบด้วย 128 ยูนิตซึ่งเชื่อมต่อกับเลเยอร์อินพุตอย่างสมบูรณ์ แต่ละหน่วยในเลเยอร์ที่ซ่อนอยู่จะคำนวณผลรวมถ่วงน้ำหนักของอินพุตจากเลเยอร์อินพุตและใช้ฟังก์ชันการเปิดใช้งานเพื่อสร้างเอาต์พุต ในตัวอย่างนี้ ฟังก์ชันการเปิดใช้งานที่ใช้ในเลเยอร์ที่ซ่อนอยู่คือฟังก์ชันหน่วยเส้นตรงแบบแก้ไข (ReLU) ฟังก์ชัน ReLU ถูกกำหนดเป็น f(x) = max(0, x) โดยที่ x คือผลรวมถ่วงน้ำหนักของอินพุตไปยังหน่วย ฟังก์ชัน ReLU นำเสนอความไม่เชิงเส้นให้กับเครือข่าย ทำให้สามารถเรียนรู้รูปแบบและความสัมพันธ์ที่ซับซ้อนในข้อมูลได้
เอาท์พุตเลเยอร์ประกอบด้วย 10 หน่วย แต่ละหน่วยแทนหนึ่งในคลาสที่เป็นไปได้ในปัญหาการจำแนกประเภท หน่วยในเลเยอร์เอาต์พุตยังเชื่อมต่อกับหน่วยในเลเยอร์ที่ซ่อนอยู่อย่างสมบูรณ์ เช่นเดียวกับเลเยอร์ที่ซ่อนอยู่ แต่ละหน่วยในเลเยอร์เอาต์พุตจะคำนวณผลรวมถ่วงน้ำหนักของอินพุตจากเลเยอร์ที่ซ่อนอยู่และใช้ฟังก์ชันการเปิดใช้งาน ในตัวอย่างนี้ ฟังก์ชันการเปิดใช้งานที่ใช้ในเลเยอร์เอาต์พุตคือฟังก์ชันซอฟต์แม็กซ์ ฟังก์ชัน softmax แปลงผลรวมถ่วงน้ำหนักของอินพุตเป็นการแจกแจงความน่าจะเป็นในแต่ละคลาส โดยที่ผลรวมของความน่าจะเป็นเท่ากับ 1 หน่วยที่มีความน่าจะเป็นสูงสุดจะแสดงถึงคลาสที่คาดการณ์ของรูปภาพอินพุต
โดยสรุป สถาปัตยกรรมโครงข่ายประสาทเทียมที่ใช้ในตัวอย่างประกอบด้วยเลเยอร์อินพุตที่มี 784 ยูนิต เลเยอร์ซ่อนที่มี 128 ยูนิตโดยใช้ฟังก์ชันการเปิดใช้งาน ReLU และเลเยอร์เอาต์พุตที่มี 10 ยูนิตโดยใช้ฟังก์ชันการเปิดใช้งาน softmax
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ การสร้างเครือข่ายประสาทเพื่อทำการจำแนก:
- จำเป็นต้องใช้ฟังก์ชันการเรียนรู้แบบอะซิงโครนัสสำหรับโมเดลการเรียนรู้ของเครื่องที่ทำงานใน TensorFlow.js หรือไม่
- โมเดลถูกรวบรวมและฝึกฝนอย่างไรใน TensorFlow.js และอะไรคือบทบาทของฟังก์ชันการสูญเสียเอนโทรปีข้ามหมวดหมู่
- อัตราการเรียนรู้และจำนวนยุคในกระบวนการเรียนรู้ของเครื่องมีความสำคัญอย่างไร
- ข้อมูลการฝึกแบ่งออกเป็นชุดการฝึกและการทดสอบใน TensorFlow.js อย่างไร
- จุดประสงค์ของ TensorFlow.js ในการสร้างโครงข่ายประสาทเทียมสำหรับงานจำแนกประเภทคืออะไร