หากต้องการระบุและเน้นวัตถุที่ตรวจพบในภาพด้วยภาพโดยใช้ไลบรารี Pillow เราสามารถทำตามขั้นตอนทีละขั้นตอนได้ ไลบรารี Pillow เป็นไลบรารีรูปภาพ Python ที่ทรงพลังซึ่งมีความสามารถในการประมวลผลรูปภาพที่หลากหลาย ด้วยการรวมความสามารถของไลบรารี Pillow เข้ากับฟังก์ชันการตรวจจับวัตถุของ Google Vision API เราจึงสามารถบรรลุงานนี้ได้อย่างมีประสิทธิภาพ
ต่อไปนี้เป็นขั้นตอนในการระบุและเน้นวัตถุที่ตรวจพบในรูปภาพโดยใช้ไลบรารี Pillow:
1. ติดตั้งไลบรารีที่จำเป็น: เริ่มต้นด้วยการติดตั้งไลบรารีที่จำเป็น ติดตั้ง Pillow โดยใช้คำสั่ง `pip install pillow` นอกจากนี้ คุณจะต้องตั้งค่า Google Vision API และติดตั้งไลบรารีไคลเอ็นต์ Google Cloud สำหรับ Python
2. ตรวจสอบสิทธิ์กับ Google Vision API: หากต้องการใช้ Google Vision API คุณต้องตรวจสอบสิทธิ์แอปพลิเคชันของคุณ ปฏิบัติตามเอกสารที่ Google ให้ไว้เพื่อรับข้อมูลรับรองที่จำเป็น
3. โหลดและวิเคราะห์ภาพ: ใช้ไลบรารี Pillow เพื่อโหลดภาพที่คุณต้องการวิเคราะห์ คุณสามารถใช้เมธอด `Image.open()` เพื่อเปิดไฟล์รูปภาพได้ เมื่อโหลดรูปภาพแล้ว ให้แปลงเป็นรูปแบบที่เข้ากันได้กับ Google Vision API เช่น JPEG หรือ PNG
4. ส่งรูปภาพไปยัง Google Vision API: ใช้ไลบรารีไคลเอ็นต์ Google Cloud สำหรับ Python เพื่อส่งรูปภาพไปยัง Google Vision API สำหรับการตรวจจับวัตถุ ซึ่งสามารถทำได้โดยการสร้างออบเจ็กต์คำขอด้วยข้อมูลรูปภาพและเรียกใช้วิธีการที่เหมาะสม เช่น `image_annotator_client.object_localization().annotate_image()`
5. ดึงผลลัพธ์การตรวจจับวัตถุ: แยกผลลัพธ์การตรวจจับวัตถุจากการตอบสนองที่ได้รับจาก Google Vision API การตอบสนองจะมีข้อมูลเกี่ยวกับออบเจ็กต์ที่ตรวจพบ เช่น กรอบขอบเขต ป้ายกำกับ และคะแนนความเชื่อมั่น
6. วาดกรอบขอบบนภาพ: ใช้ไลบรารีหมอนเพื่อวาดกรอบขอบรอบวัตถุที่ตรวจพบบนภาพ คุณสามารถใช้วิธี `ImageDraw.Draw()` เพื่อสร้างวัตถุรูปวาด จากนั้นใช้วิธี `draw.rectangle()` เพื่อวาดกรอบขอบ
7. เพิ่มป้ายกำกับและคะแนนให้กับรูปภาพ: หากต้องการปรับปรุงการแสดงภาพ คุณสามารถเพิ่มป้ายกำกับและคะแนนความเชื่อมั่นให้กับรูปภาพได้ ใช้เมธอด `draw.text()` จากไลบรารี Pillow เพื่อวางป้ายกำกับและคะแนนบนรูปภาพ
8. บันทึกและแสดงรูปภาพที่มีคำอธิบายประกอบ: บันทึกรูปภาพที่มีคำอธิบายประกอบโดยใช้วิธี `Image.save()` จากไลบรารี Pillow คุณสามารถเลือกรูปแบบที่ต้องการได้ เช่น JPEG หรือ PNG หรือแสดงรูปภาพที่มีคำอธิบายประกอบโดยใช้วิธี `Image.show()`
ด้วยการทำตามขั้นตอนเหล่านี้ คุณสามารถระบุและเน้นวัตถุที่ตรวจพบในรูปภาพด้วยสายตาได้โดยใช้ไลบรารี Pillow การผสมผสานความสามารถในการประมวลผลภาพอันทรงพลังของ Pillow และฟังก์ชันการตรวจจับวัตถุของ Google Vision API ช่วยให้การวิเคราะห์ภาพมีประสิทธิภาพและแม่นยำ
ตัวอย่าง:
python from PIL import Image, ImageDraw from google.cloud import vision # Load and analyze the image image_path = 'path/to/your/image.jpg' image = Image.open(image_path) image_data = image.tobytes() # Authenticate with the Google Vision API client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json') # Send the image to the Google Vision API for object detection response = client.object_localization(image=vision.Image(content=image_data)) objects = response.localized_object_annotations # Draw bounding boxes on the image draw = ImageDraw.Draw(image) for obj in objects: bbox = obj.bounding_poly.normalized_vertices draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height), (bbox[2].x * image.width, bbox[2].y * image.height)], outline='red', width=3) # Add labels and scores to the image label = obj.name score = obj.score draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15), f'{label} ({score:.2f})', fill='red') # Save and display the annotated image annotated_image_path = 'path/to/save/annotated_image.jpg' image.save(annotated_image_path) image.show()
ในตัวอย่างนี้ ก่อนอื่นเราจะโหลดและวิเคราะห์รูปภาพโดยใช้ไลบรารี Pillow จากนั้น เราจะตรวจสอบสิทธิ์กับ Google Vision API และส่งภาพเพื่อการตรวจจับวัตถุ เราดึงข้อมูลผลลัพธ์การตรวจจับวัตถุ และใช้ไลบรารี Pillow เพื่อวาดกรอบขอบเขตรอบๆ วัตถุที่ตรวจพบบนรูปภาพ นอกจากนี้ เรายังเพิ่มป้ายกำกับและคะแนนความเชื่อมั่นให้กับรูปภาพอีกด้วย สุดท้าย เราจะบันทึกและแสดงภาพที่มีคำอธิบายประกอบ
คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ ความเข้าใจภาพขั้นสูง:
- หมวดหมู่ที่กำหนดไว้ล่วงหน้าสำหรับการจดจำวัตถุใน Google Vision API มีอะไรบ้าง
- แนวทางที่แนะนำในการใช้คุณลักษณะการตรวจจับการค้นหาปลอดภัยร่วมกับเทคนิคการดูแลอื่นๆ คืออะไร
- เราจะเข้าถึงและแสดงค่าความน่าจะเป็นสำหรับแต่ละหมวดหมู่ในคำอธิบายประกอบการค้นหาปลอดภัยได้อย่างไร
- เราจะรับคำอธิบายประกอบการค้นหาปลอดภัยโดยใช้ Google Vision API ใน Python ได้อย่างไร
- ห้าหมวดหมู่ที่รวมอยู่ในคุณลักษณะการตรวจจับการค้นหาปลอดภัยมีอะไรบ้าง
- คุณลักษณะการค้นหาที่ปลอดภัยของ Google Vision API ตรวจจับเนื้อหาที่ไม่เหมาะสมภายในภาพได้อย่างไร
- เราจะจัดระเบียบข้อมูลวัตถุที่แยกออกมาในรูปแบบตารางโดยใช้กรอบข้อมูลของแพนด้าได้อย่างไร
- เราจะแยกคำอธิบายประกอบวัตถุทั้งหมดออกจากการตอบสนองของ API ได้อย่างไร
- ไลบรารีและภาษาการเขียนโปรแกรมใดที่ใช้ในการสาธิตการทำงานของ Google Vision API
- Google Vision API ทำการตรวจหาวัตถุและการแปลในรูปภาพอย่างไร
ดูคำถามและคำตอบเพิ่มเติมในการทำความเข้าใจรูปภาพขั้นสูง
คำถามและคำตอบเพิ่มเติม:
- สนาม: ปัญญาประดิษฐ์
- โปรแกรม: EITC/AI/GVAPI Google Vision API (ไปที่โปรแกรมการรับรอง)
- บทเรียน: ความเข้าใจภาพขั้นสูง (ไปที่บทเรียนที่เกี่ยวข้อง)
- หัวข้อ: การตรวจจับวัตถุ (ไปที่หัวข้อที่เกี่ยวข้อง)
- ทบทวนข้อสอบ