เราจะระบุและเน้นวัตถุที่ตรวจพบในภาพด้วยสายตาโดยใช้ไลบรารีหมอนได้อย่างไร

by สถาบัน EITCA / วันเสาร์ที่ 30 ธันวาคม 2023 / ตีพิมพ์ใน ปัญญาประดิษฐ์, EITC/AI/GVAPI Google Vision API, ความเข้าใจภาพขั้นสูง, การตรวจจับวัตถุ, ทบทวนข้อสอบ

หากต้องการระบุและเน้นวัตถุที่ตรวจพบในภาพด้วยภาพโดยใช้ไลบรารี Pillow เราสามารถทำตามขั้นตอนทีละขั้นตอนได้ ไลบรารี Pillow เป็นไลบรารีรูปภาพ Python ที่ทรงพลังซึ่งมีความสามารถในการประมวลผลรูปภาพที่หลากหลาย ด้วยการรวมความสามารถของไลบรารี Pillow เข้ากับฟังก์ชันการตรวจจับวัตถุของ Google Vision API เราจึงสามารถบรรลุงานนี้ได้อย่างมีประสิทธิภาพ

ต่อไปนี้เป็นขั้นตอนในการระบุและเน้นวัตถุที่ตรวจพบในรูปภาพโดยใช้ไลบรารี Pillow:

1. ติดตั้งไลบรารีที่จำเป็น: เริ่มต้นด้วยการติดตั้งไลบรารีที่จำเป็น ติดตั้ง Pillow โดยใช้คำสั่ง `pip install pillow` นอกจากนี้ คุณจะต้องตั้งค่า Google Vision API และติดตั้งไลบรารีไคลเอ็นต์ Google Cloud สำหรับ Python

2. ตรวจสอบสิทธิ์กับ Google Vision API: หากต้องการใช้ Google Vision API คุณต้องตรวจสอบสิทธิ์แอปพลิเคชันของคุณ ปฏิบัติตามเอกสารที่ Google ให้ไว้เพื่อรับข้อมูลรับรองที่จำเป็น

3. โหลดและวิเคราะห์ภาพ: ใช้ไลบรารี Pillow เพื่อโหลดภาพที่คุณต้องการวิเคราะห์ คุณสามารถใช้เมธอด `Image.open()` เพื่อเปิดไฟล์รูปภาพได้ เมื่อโหลดรูปภาพแล้ว ให้แปลงเป็นรูปแบบที่เข้ากันได้กับ Google Vision API เช่น JPEG หรือ PNG

4. ส่งรูปภาพไปยัง Google Vision API: ใช้ไลบรารีไคลเอ็นต์ Google Cloud สำหรับ Python เพื่อส่งรูปภาพไปยัง Google Vision API สำหรับการตรวจจับวัตถุ ซึ่งสามารถทำได้โดยการสร้างออบเจ็กต์คำขอด้วยข้อมูลรูปภาพและเรียกใช้วิธีการที่เหมาะสม เช่น `image_annotator_client.object_localization().annotate_image()`

5. ดึงผลลัพธ์การตรวจจับวัตถุ: แยกผลลัพธ์การตรวจจับวัตถุจากการตอบสนองที่ได้รับจาก Google Vision API การตอบสนองจะมีข้อมูลเกี่ยวกับออบเจ็กต์ที่ตรวจพบ เช่น กรอบขอบเขต ป้ายกำกับ และคะแนนความเชื่อมั่น

6. วาดกรอบขอบบนภาพ: ใช้ไลบรารีหมอนเพื่อวาดกรอบขอบรอบวัตถุที่ตรวจพบบนภาพ คุณสามารถใช้วิธี `ImageDraw.Draw()` เพื่อสร้างวัตถุรูปวาด จากนั้นใช้วิธี `draw.rectangle()` เพื่อวาดกรอบขอบ

7. เพิ่มป้ายกำกับและคะแนนให้กับรูปภาพ: หากต้องการปรับปรุงการแสดงภาพ คุณสามารถเพิ่มป้ายกำกับและคะแนนความเชื่อมั่นให้กับรูปภาพได้ ใช้เมธอด `draw.text()` จากไลบรารี Pillow เพื่อวางป้ายกำกับและคะแนนบนรูปภาพ

8. บันทึกและแสดงรูปภาพที่มีคำอธิบายประกอบ: บันทึกรูปภาพที่มีคำอธิบายประกอบโดยใช้วิธี `Image.save()` จากไลบรารี Pillow คุณสามารถเลือกรูปแบบที่ต้องการได้ เช่น JPEG หรือ PNG หรือแสดงรูปภาพที่มีคำอธิบายประกอบโดยใช้วิธี `Image.show()`

ด้วยการทำตามขั้นตอนเหล่านี้ คุณสามารถระบุและเน้นวัตถุที่ตรวจพบในรูปภาพด้วยสายตาได้โดยใช้ไลบรารี Pillow การผสมผสานความสามารถในการประมวลผลภาพอันทรงพลังของ Pillow และฟังก์ชันการตรวจจับวัตถุของ Google Vision API ช่วยให้การวิเคราะห์ภาพมีประสิทธิภาพและแม่นยำ

ตัวอย่าง:

python
from PIL import Image, ImageDraw
from google.cloud import vision

# Load and analyze the image
image_path = 'path/to/your/image.jpg'
image = Image.open(image_path)
image_data = image.tobytes()

# Authenticate with the Google Vision API
client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json')

# Send the image to the Google Vision API for object detection
response = client.object_localization(image=vision.Image(content=image_data))
objects = response.localized_object_annotations

# Draw bounding boxes on the image
draw = ImageDraw.Draw(image)
for obj in objects:
    bbox = obj.bounding_poly.normalized_vertices
    draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height),
                    (bbox[2].x * image.width, bbox[2].y * image.height)],
                   outline='red', width=3)

    # Add labels and scores to the image
    label = obj.name
    score = obj.score
    draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15),
              f'{label} ({score:.2f})', fill='red')

# Save and display the annotated image
annotated_image_path = 'path/to/save/annotated_image.jpg'
image.save(annotated_image_path)
image.show()

ในตัวอย่างนี้ ก่อนอื่นเราจะโหลดและวิเคราะห์รูปภาพโดยใช้ไลบรารี Pillow จากนั้น เราจะตรวจสอบสิทธิ์กับ Google Vision API และส่งภาพเพื่อการตรวจจับวัตถุ เราดึงข้อมูลผลลัพธ์การตรวจจับวัตถุ และใช้ไลบรารี Pillow เพื่อวาดกรอบขอบเขตรอบๆ วัตถุที่ตรวจพบบนรูปภาพ นอกจากนี้ เรายังเพิ่มป้ายกำกับและคะแนนความเชื่อมั่นให้กับรูปภาพอีกด้วย สุดท้าย เราจะบันทึกและแสดงภาพที่มีคำอธิบายประกอบ

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ ความเข้าใจภาพขั้นสูง:

ดูคำถามและคำตอบเพิ่มเติมในการทำความเข้าใจรูปภาพขั้นสูง

คำถามและคำตอบเพิ่มเติม:

สนาม: ปัญญาประดิษฐ์
โปรแกรม: EITC/AI/GVAPI Google Vision API (ไปที่โปรแกรมการรับรอง)
บทเรียน: ความเข้าใจภาพขั้นสูง (ไปที่บทเรียนที่เกี่ยวข้อง)
หัวข้อ: การตรวจจับวัตถุ (ไปที่หัวข้อที่เกี่ยวข้อง)
ทบทวนข้อสอบ

Tagged under: ปัญญาประดิษฐ์, Google วิชั่น API, การประมวลผลภาพ, การตรวจจับวัตถุ, ห้องสมุดหมอน, หลาม

สถาบัน EITCA

เราจะระบุและเน้นวัตถุที่ตรวจพบในภาพด้วยสายตาโดยใช้ไลบรารีหมอนได้อย่างไร

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ ความเข้าใจภาพขั้นสูง:

คำถามและคำตอบเพิ่มเติม:

EITCA Academy เป็นส่วนหนึ่งของกรอบการรับรองด้านไอทีของยุโรป

สิทธิ์เข้าร่วม EITCA Academy 80% สนับสนุนเงินช่วยเหลือ EITCI DSJC

สถาบัน EITCA

เข้าสู่บัญชีของคุณด้วยชื่อผู้ใช้หรือที่อยู่อีเมลของคุณ

ลืมรายละเอียดของคุณ?

สร้างบัญชี

เราจะระบุและเน้นวัตถุที่ตรวจพบในภาพด้วยสายตาโดยใช้ไลบรารีหมอนได้อย่างไร

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ ความเข้าใจภาพขั้นสูง:

คำถามและคำตอบเพิ่มเติม:

สิทธิ์เข้าร่วม EITCA Academy 80% สนับสนุนเงินช่วยเหลือ EITCI DSJC