คุณจะแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมโดยใช้ Python และ Vision API ได้อย่างไร

by สถาบัน EITCA / วันพุธที่ 27 2023 ธันวาคม / ตีพิมพ์ใน ปัญญาประดิษฐ์, EITC/AI/GVAPI Google Vision API, ภาพการติดฉลาก, การตรวจจับฉลาก, ทบทวนข้อสอบ

หากต้องการแยกป้ายกำกับออกจากรูปภาพโดยใช้โปรแกรม Python และ Vision API คุณสามารถใช้ประโยชน์จากความสามารถอันทรงพลังของ Google Cloud Vision API ได้ Vision API มีชุดคุณลักษณะการวิเคราะห์รูปภาพที่ครอบคลุม รวมถึงการตรวจจับป้ายกำกับ ซึ่งช่วยให้คุณระบุและแยกป้ายกำกับออกจากรูปภาพได้โดยอัตโนมัติ

ในการเริ่มต้น คุณจะต้องตั้งค่าโปรเจ็กต์ Google Cloud และเปิดใช้ Vision API เมื่อคุณทำเสร็จแล้ว คุณสามารถติดตั้งไลบรารี Python ที่จำเป็นได้โดยการรันคำสั่งต่อไปนี้:

python
pip install google-cloud-vision

ถัดไป คุณต้องตรวจสอบสิทธิ์แอปพลิเคชันของคุณเพื่อเข้าถึง Vision API คุณสามารถทำได้โดยสร้างคีย์บัญชีบริการและตั้งค่าตัวแปรสภาพแวดล้อม `GOOGLE_APPLICATION_CREDENTIALS` ให้ชี้ไปยังเส้นทางของไฟล์คีย์ ซึ่งสามารถทำได้โดยใช้รหัสต่อไปนี้:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

ตอนนี้คุณสามารถใช้ Vision API เพื่อแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมได้ ข้อมูลโค้ดต่อไปนี้สาธิตวิธีการทำเช่นนี้:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

ในโค้ดนี้ ก่อนอื่นเราจะสร้างอินสแตนซ์ของคลาส `ImageAnnotatorClient` จากไลบรารี `google.cloud.vision` จากนั้นเราจะอ่านไฟล์ภาพ สร้างออบเจ็กต์ `รูปภาพ` จากเนื้อหาไฟล์ และส่งไปยัง Vision API เพื่อการตรวจจับป้ายกำกับ การตอบสนองของ API ประกอบด้วยรายการคำอธิบายประกอบของป้ายกำกับ ซึ่งเราแยกคำอธิบายของป้ายกำกับออกมา

ตอนนี้คุณสามารถเรียกใช้ฟังก์ชัน `extract_labels` ได้โดยการส่งเส้นทางไปยังไฟล์ภาพที่คุณต้องการวิเคราะห์ มันจะส่งคืนรายการป้ายกำกับที่ดึงมาจากรูปภาพ

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

นี่จะเป็นเอาต์พุตป้ายกำกับที่แยกออกมาจากรูปภาพ

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

Vision API ใช้โมเดลการเรียนรู้ของเครื่องขั้นสูงเพื่อวิเคราะห์ภาพและระบุวัตถุ ฉาก และคุณสมบัติด้านภาพอื่นๆ สามารถตรวจจับป้ายกำกับได้หลากหลายอย่างแม่นยำ ทำให้เป็นเครื่องมือที่มีประโยชน์สำหรับการใช้งานต่างๆ เช่น การจัดหมวดหมู่รูปภาพ การกลั่นกรองเนื้อหา และการค้นหาด้วยภาพ

หากต้องการแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมโดยใช้ Python และ Vision API คุณต้องตั้งค่าโปรเจ็กต์ Google Cloud เปิดใช้งาน Vision API ติดตั้งไลบรารี Python ที่จำเป็น ตรวจสอบสิทธิ์แอปพลิเคชันของคุณ จากนั้นใช้ Vision API เพื่อดำเนินการตรวจจับป้ายกำกับบน ภาพ ป้ายกำกับที่แยกออกมาสามารถใช้เพื่อการวิเคราะห์เพิ่มเติมหรือเพื่อเพิ่มความเข้าใจในเนื้อหารูปภาพได้

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/GVAPI Google Vision API:

ดูคำถามและคำตอบเพิ่มเติมใน EITC/AI/GVAPI Google Vision API

คำถามและคำตอบเพิ่มเติม:

สนาม: ปัญญาประดิษฐ์
โปรแกรม: EITC/AI/GVAPI Google Vision API (ไปที่โปรแกรมการรับรอง)
บทเรียน: ภาพการติดฉลาก (ไปที่บทเรียนที่เกี่ยวข้อง)
หัวข้อ: การตรวจจับฉลาก (ไปที่หัวข้อที่เกี่ยวข้อง)
ทบทวนข้อสอบ

Tagged under: ปัญญาประดิษฐ์, Google Cloud, การวิเคราะห์ภาพ, การตรวจจับฉลาก, หลาม, วิชั่น API

สถาบัน EITCA

คุณจะแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมโดยใช้ Python และ Vision API ได้อย่างไร

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/GVAPI Google Vision API:

คำถามและคำตอบเพิ่มเติม:

EITCA Academy เป็นส่วนหนึ่งของกรอบการรับรองด้านไอทีของยุโรป

สิทธิ์เข้าร่วม EITCA Academy 80% สนับสนุนเงินช่วยเหลือ EITCI DSJC

สถาบัน EITCA

เข้าสู่บัญชีของคุณด้วยชื่อผู้ใช้หรือที่อยู่อีเมลของคุณ

ลืมรายละเอียดของคุณ?

สร้างบัญชี

คุณจะแยกป้ายกำกับออกจากรูปภาพโดยทางโปรแกรมโดยใช้ Python และ Vision API ได้อย่างไร

คำถามและคำตอบล่าสุดอื่น ๆ เกี่ยวกับ EITC/AI/GVAPI Google Vision API:

คำถามและคำตอบเพิ่มเติม:

สิทธิ์เข้าร่วม EITCA Academy 80% สนับสนุนเงินช่วยเหลือ EITCI DSJC