ในตัวอย่างการจัดประเภทข้อความด้วย TensorFlow ที่ให้มา เครื่องมือเพิ่มประสิทธิภาพที่ใช้คือเครื่องมือเพิ่มประสิทธิภาพ Adam และฟังก์ชันการสูญเสียที่ใช้คือ Sparse Categorical Crossentropy
เครื่องมือเพิ่มประสิทธิภาพ Adam เป็นส่วนเสริมของอัลกอริทึม stochastic Gradient Destination (SGD) ที่รวมเอาข้อดีของเครื่องมือเพิ่มประสิทธิภาพยอดนิยมอีกสองตัว ได้แก่ AdaGrad และ RMSProp โดยจะปรับอัตราการเรียนรู้แบบไดนามิกสำหรับแต่ละพารามิเตอร์ ช่วยให้การบรรจบกันเร็วขึ้นและประสิทธิภาพที่ดีขึ้น เครื่องมือเพิ่มประสิทธิภาพ Adam คำนวณอัตราการเรียนรู้แบบปรับตัวสำหรับแต่ละพารามิเตอร์ตามค่าประมาณของช่วงเวลาแรกและวินาทีของการไล่ระดับสี อัตราการเรียนรู้ที่ปรับเปลี่ยนได้นี้ช่วยให้เครื่องมือเพิ่มประสิทธิภาพผสานรวมได้อย่างรวดเร็วและมีประสิทธิภาพ
ฟังก์ชันการสูญเสียที่ใช้ในตัวอย่างคือ Sparse Categorical Crossentropy ฟังก์ชันการสูญเสียนี้มักใช้สำหรับงานการจัดหมวดหมู่แบบหลายคลาสเมื่อคลาสต่างๆ โดยจะคำนวณการสูญเสียข้ามเอนโทรปีระหว่างความน่าจะเป็นที่คาดการณ์ไว้และป้ายกำกับจริง Sparse Categorical Crossentropy เหมาะสำหรับกรณีที่ฉลากแสดงเป็นจำนวนเต็มแทนที่จะเป็นเวกเตอร์ที่เข้ารหัสแบบร้อนเดียว ภายในจะแปลงฉลากจำนวนเต็มเป็นเวกเตอร์เข้ารหัสแบบร้อนเดียวก่อนที่จะคำนวณการสูญเสีย
เพื่อแสดงการใช้งานตัวเพิ่มประสิทธิภาพ Adam และฟังก์ชันการสูญเสีย Crossentropy Categorical แบบกระจายในบริบทของการจำแนกประเภทข้อความ ให้พิจารณาส่วนย่อยของโค้ดต่อไปนี้:
python # Define the optimizer optimizer = tf.keras.optimizers.Adam() # Define the loss function loss_function = tf.keras.losses.SparseCategoricalCrossentropy() # Compile the model model.compile(optimizer=optimizer, loss=loss_function, metrics=['accuracy'])
ในข้อมูลโค้ดนี้ เครื่องมือเพิ่มประสิทธิภาพ Adam ถูกสร้างขึ้นโดยใช้ฟังก์ชัน `tf.keras.optimizers.Adam()` และฟังก์ชันการสูญเสีย Crossentropy Categorical แบบกระจายถูกสร้างขึ้นโดยใช้ฟังก์ชัน `tf.keras.losses.SparseCategoricalCrossentropy() อินสแตนซ์ของฟังก์ชันเพิ่มประสิทธิภาพและการสูญเสียเหล่านี้จะถูกส่งต่อไปยังเมธอด `compile()` ของโมเดล ซึ่งตั้งค่าเหล่านี้สำหรับการฝึกอบรมโครงข่ายประสาทเทียม
ตัวอย่างการจัดประเภทข้อความด้วย TensorFlow นั้นใช้ Adam Optimizer และฟังก์ชัน Sparse Categorical Crossentropy Loss เครื่องมือเพิ่มประสิทธิภาพ Adam ปรับอัตราการเรียนรู้แบบไดนามิกสำหรับแต่ละพารามิเตอร์ ในขณะที่ฟังก์ชันการสูญเสียข้ามศูนย์ประเภทกระจัดกระจายจะคำนวณการสูญเสียข้ามเอนโทรปีสำหรับงานจำแนกประเภทหลายชั้นด้วยป้ายกำกับจำนวนเต็ม
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ การออกแบบโครงข่ายประสาทเทียม:
- ความแม่นยำของโมเดลที่ผ่านการฝึกอบรมมีการประเมินเทียบกับชุดทดสอบใน TensorFlow อย่างไร
- อธิบายสถาปัตยกรรมของโมเดลโครงข่ายประสาทเทียมที่ใช้สำหรับการจำแนกข้อความใน TensorFlow
- เลเยอร์การฝังใน TensorFlow แปลงคำเป็นเวกเตอร์ได้อย่างไร
- จุดประสงค์ของการใช้การฝังในการจำแนกข้อความด้วย TensorFlow คืออะไร

