หากต้องการแยกป้ายกำกับออกจากรูปภาพโดยใช้โปรแกรม Python และ Vision API คุณสามารถใช้ประโยชน์จากความสามารถอันทรงพลังของ Google Cloud Vision API ได้ Vision API มีชุดคุณลักษณะการวิเคราะห์รูปภาพที่ครอบคลุม รวมถึงการตรวจจับป้ายกำกับ ซึ่งช่วยให้คุณระบุและแยกป้ายกำกับออกจากรูปภาพได้โดยอัตโนมัติ
ในการเริ่มต้น คุณจะต้องตั้งค่าโปรเจ็กต์ Google Cloud และเปิดใช้ Vision API เมื่อคุณทำเสร็จแล้ว คุณสามารถติดตั้งไลบรารี Python ที่จำเป็นได้โดยการรันคำสั่งต่อไปนี้:
python pip install google-cloud-vision
ถัดไป คุณต้องตรวจสอบสิทธิ์แอปพลิเคชันของคุณเพื่อเข้าถึง Vision API คุณสามารถทำได้โดยสร้างคีย์บัญชีบริการและตั้งค่าตัวแปรสภาพแวดล้อม `GOOGLE_APPLICATION_CREDENTIALS` ให้ชี้ไปยังเส้นทางของไฟล์คีย์ ซึ่งสามารถทำได้โดยใช้รหัสต่อไปนี้:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
ตอนนี้คุณสามารถใช้ Vision API เพื่อแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมได้ ข้อมูลโค้ดต่อไปนี้สาธิตวิธีการทำเช่นนี้:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
ในโค้ดนี้ ก่อนอื่นเราจะสร้างอินสแตนซ์ของคลาส `ImageAnnotatorClient` จากไลบรารี `google.cloud.vision` จากนั้นเราจะอ่านไฟล์ภาพ สร้างออบเจ็กต์ `รูปภาพ` จากเนื้อหาไฟล์ และส่งไปยัง Vision API เพื่อการตรวจจับป้ายกำกับ การตอบสนองของ API ประกอบด้วยรายการคำอธิบายประกอบของป้ายกำกับ ซึ่งเราแยกคำอธิบายของป้ายกำกับออกมา
ตอนนี้คุณสามารถเรียกใช้ฟังก์ชัน `extract_labels` ได้โดยการส่งเส้นทางไปยังไฟล์ภาพที่คุณต้องการวิเคราะห์ มันจะส่งคืนรายการป้ายกำกับที่ดึงมาจากรูปภาพ
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
นี่จะเป็นเอาต์พุตป้ายกำกับที่แยกออกมาจากรูปภาพ
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API ใช้โมเดลการเรียนรู้ของเครื่องขั้นสูงเพื่อวิเคราะห์ภาพและระบุวัตถุ ฉาก และคุณสมบัติด้านภาพอื่นๆ สามารถตรวจจับป้ายกำกับได้หลากหลายอย่างแม่นยำ ทำให้เป็นเครื่องมือที่มีประโยชน์สำหรับการใช้งานต่างๆ เช่น การจัดหมวดหมู่รูปภาพ การกลั่นกรองเนื้อหา และการค้นหาด้วยภาพ
หากต้องการแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมโดยใช้ Python และ Vision API คุณต้องตั้งค่าโปรเจ็กต์ Google Cloud เปิดใช้งาน Vision API ติดตั้งไลบรารี Python ที่จำเป็น ตรวจสอบสิทธิ์แอปพลิเคชันของคุณ จากนั้นใช้ Vision API เพื่อดำเนินการตรวจจับป้ายกำกับบน ภาพ ป้ายกำกับที่แยกออกมาสามารถใช้เพื่อการวิเคราะห์เพิ่มเติมหรือเพื่อเพิ่มความเข้าใจในเนื้อหารูปภาพได้
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/GVAPI Google Vision API:
- หมวดหมู่ที่กำหนดไว้ล่วงหน้าสำหรับการจดจำวัตถุใน Google Vision API มีอะไรบ้าง
- Google Vision API เปิดใช้งานการจดจำใบหน้าหรือไม่
- จะเพิ่มข้อความที่แสดงลงในรูปภาพเมื่อวาดเส้นขอบวัตถุโดยใช้ฟังก์ชัน "draw_vertices" ได้อย่างไร
- พารามิเตอร์ของเมธอด "draw.line" ในโค้ดที่ให้มามีอะไรบ้าง และพารามิเตอร์เหล่านี้ใช้ในการลากเส้นระหว่างค่าจุดยอดอย่างไร
- ไลบรารี่หมอนสามารถใช้เพื่อวาดเส้นขอบของวัตถุใน Python ได้อย่างไร
- จุดประสงค์ของฟังก์ชัน "draw_vertices" ในโค้ดที่ให้มาคืออะไร
- Google Vision API ช่วยในการทำความเข้าใจรูปร่างและวัตถุในรูปภาพได้อย่างไร
- ผู้ใช้สามารถสำรวจรูปภาพที่คล้ายกันซึ่งแนะนำโดย API ได้อย่างไร
- องค์ประกอบต่างๆ ที่ให้ไว้ในออบเจ็กต์ตอบสนองของฟีเจอร์การตรวจจับเว็บของ Google Vision API มีอะไรบ้าง
- คุณสมบัติ Web Detection ช่วยในการสร้างแท็กสำหรับภาพที่อัพโหลดอย่างไร
ดูคำถามและคำตอบเพิ่มเติมใน EITC/AI/GVAPI Google Vision API
คำถามและคำตอบเพิ่มเติม:
- สนาม: ปัญญาประดิษฐ์
- โปรแกรม: EITC/AI/GVAPI Google Vision API (ไปที่โปรแกรมการรับรอง)
- บทเรียน: ภาพการติดฉลาก (ไปที่บทเรียนที่เกี่ยวข้อง)
- หัวข้อ: การตรวจจับฉลาก (ไปที่หัวข้อที่เกี่ยวข้อง)
- ทบทวนข้อสอบ