Jak programowo wyodrębnić etykiety z obrazów przy użyciu języka Python i interfejsu Vision API?

by Akademia EITCA / Środa, 27 grudnia 2023 / Opublikowano w Artificial Intelligence, EITC/AI/GVAPI Interfejs Google Vision API, Etykietowanie obrazów, Wykrywanie etykiet, Przegląd egzaminów

Aby programowo wyodrębnić etykiety z obrazów za pomocą Pythona i Vision API, możesz wykorzystać potężne możliwości Google Cloud Vision API. Vision API zapewnia kompleksowy zestaw funkcji analizy obrazu, w tym wykrywanie etykiet, co pozwala na automatyczną identyfikację i wyodrębnianie etykiet z obrazów.

Aby rozpocząć, musisz skonfigurować projekt Google Cloud i włączyć Vision API. Gdy już to zrobisz, możesz zainstalować wymagane biblioteki Pythona, uruchamiając następującą komendę:

python
pip install google-cloud-vision

Następnie musisz uwierzytelnić swoją aplikację, aby uzyskać dostęp do Vision API. Możesz to zrobić, tworząc klucz konta usługi i ustawiając zmienną środowiskową `GOOGLE_APPLICATION_CREDENTIALS` tak, aby wskazywała ścieżkę do pliku klucza. Można to zrobić za pomocą następującego kodu:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

Teraz możesz używać interfejsu Vision API do programowego wyodrębniania etykiet z obrazów. Poniższy fragment kodu demonstruje, jak to zrobić:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

W tym kodzie najpierw tworzymy instancję klasy `ImageAnnotatorClient` z biblioteki `google.cloud.vision`. Następnie czytamy plik obrazu, tworzymy obiekt „Image” z zawartości pliku i wysyłamy go do API Vision w celu wykrycia etykiety. Odpowiedź API zawiera listę adnotacji etykiet, z których wyodrębniamy opisy etykiet.

Możesz teraz wywołać funkcję `extract_labels`, przekazując ścieżkę do pliku obrazu, który chcesz przeanalizować. Zwróci listę etykiet wyodrębnionych z obrazu.

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

Spowoduje to wyświetlenie wyodrębnionych etykiet z obrazu.

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

Vision API wykorzystuje zaawansowane modele uczenia maszynowego do analizowania obrazów i identyfikowania obiektów, scen i innych cech wizualnych. Może dokładnie wykryć szeroką gamę etykiet, co czyni go cennym narzędziem do różnych zastosowań, takich jak klasyfikacja obrazów, moderowanie treści i wyszukiwanie wizualne.

Aby programowo wyodrębnić etykiety z obrazów za pomocą Pythona i Vision API, musisz skonfigurować projekt Google Cloud, włączyć Vision API, zainstalować wymagane biblioteki Pythona, uwierzytelnić aplikację, a następnie użyć Vision API do wykrywania etykiet na obrazy. Wyodrębnione etykiety można wykorzystać do dalszej analizy lub w celu lepszego zrozumienia treści obrazu.

Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GVAPI Interfejs Google Vision API:

Zobacz więcej pytań i odpowiedzi w EITC/AI/GVAPI Google Vision API

Więcej pytań i odpowiedzi:

Pole: Artificial Intelligence
Program: EITC/AI/GVAPI Interfejs Google Vision API (przejdź do programu certyfikacji)
Lekcja: Etykietowanie obrazów (przejdź do odpowiedniej lekcji)
Wątek: Wykrywanie etykiet (przejdź do powiązanego tematu)
Przegląd egzaminów

Tagged under: Artificial Intelligence, Google Cloud, Analiza obrazu, Wykrywanie etykiet, Python, Wizja API

Akademia EITCA

Jak programowo wyodrębnić etykiety z obrazów przy użyciu języka Python i interfejsu Vision API?

Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GVAPI Interfejs Google Vision API:

Więcej pytań i odpowiedzi:

Akademia EITCA jest częścią europejskich ram certyfikacji IT

Uprawnienie do Akademii EITCA 80% wsparcia EITCI DSJC Subsydium

Akademia EITCA

ZALOGUJ SIĘ NA KONTO PODAJĄC NAZWĘ UŻYTKOWNIKA LUB ADRES E-MAIL

ZAPOMNIAŁEŚ DANYCH LOGOWANIA?

STWÓRZ KONTO

Jak programowo wyodrębnić etykiety z obrazów przy użyciu języka Python i interfejsu Vision API?

Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GVAPI Interfejs Google Vision API:

Więcej pytań i odpowiedzi:

Uprawnienie do Akademii EITCA 80% wsparcia EITCI DSJC Subsydium