Oznaczone dane w kontekście sztucznej inteligencji (AI), a konkretnie w domenie Google Cloud Machine Learning, odnoszą się do zbioru danych, który został opatrzony adnotacjami lub oznaczony określonymi etykietami lub kategoriami. Etykiety te służą jako podstawowa prawda lub odniesienie do szkolenia algorytmów uczenia maszynowego. Łącząc punkty danych z odpowiadającymi im etykietami, model uczenia maszynowego może nauczyć się rozpoznawać wzorce i formułować prognozy na podstawie nowych, niewidocznych danych.
Oznaczone dane odgrywają kluczową rolę w uczeniu nadzorowanym, które jest powszechnym podejściem w uczeniu maszynowym. W uczeniu nadzorowanym model jest szkolony na oznaczonym zbiorze danych, aby poznać związek między cechami wejściowymi i odpowiadającymi im etykietami wyjściowymi. Ten proces uczenia pozwala modelowi uogólniać swoją wiedzę i dokonywać dokładnych przewidywań na podstawie nowych, niewidocznych danych.
Aby zilustrować tę koncepcję, rozważmy przykład zadania uczenia maszynowego z zakresu rozpoznawania obrazu. Załóżmy, że chcemy zbudować model, który będzie w stanie klasyfikować obrazy zwierząt na różne kategorie, takie jak koty, psy i ptaki. Potrzebowalibyśmy oznaczonego zbioru danych, w którym każdy obraz jest powiązany z właściwą etykietą. Na przykład zdjęcie kota zostanie oznaczone jako „kot”, zdjęcie psa jako „pies” i tak dalej.
Oznaczony zbiór danych składałby się z kolekcji obrazów i odpowiadających im etykiet. Każdy obraz byłby reprezentowany przez zestaw cech, takich jak wartości pikseli lub reprezentacje wyższego poziomu wyodrębnione z obrazu. Etykiety wskazywałyby właściwą kategorię lub klasę, do której należy każdy obraz.
Na etapie szkolenia model uczenia maszynowego zostanie zaprezentowany z oznaczonym zbiorem danych. Nauczyłoby się identyfikować wzorce i relacje między cechami wejściowymi a odpowiadającymi im etykietami. Model zaktualizowałby swoje parametry wewnętrzne, aby zminimalizować różnicę między przewidywaniami a prawdziwymi etykietami w danych szkoleniowych.
Po przeszkoleniu modelu można go używać do przewidywania nowych, niewidzianych obrazów. Biorąc pod uwagę obraz bez etykiety, model analizowałby jego cechy i przewidywał najbardziej prawdopodobną etykietę w oparciu o wiedzę zdobytą ze zbioru danych oznaczonych etykietą. Na przykład, jeśli model przewiduje, że obraz przedstawia kota, oznacza to, że rozpoznał na obrazie wzorce wskazujące na kota.
Oznaczone dane są podstawowym składnikiem modeli uczenia maszynowego. Dostarcza niezbędnych informacji, z których model może się uczyć i dokonywać dokładnych przewidywań. Łącząc punkty danych z odpowiadającymi im etykietami, model może nauczyć się rozpoznawać wzorce i uogólniać swoją wiedzę na niewidoczne dane.
Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GCML Uczenie Maszynowe Google Cloud:
- Co to jest tekst na mowę (TTS) i jak współpracuje z AI?
- Jakie są ograniczenia w pracy z dużymi zbiorami danych w uczeniu maszynowym?
- Czy uczenie maszynowe może pomóc w dialogu?
- Czym jest plac zabaw TensorFlow?
- Co właściwie oznacza większy zbiór danych?
- Jakie są przykłady hiperparametrów algorytmu?
- Co to jest uczenie się zespołowe?
- Co się stanie, jeśli wybrany algorytm uczenia maszynowego nie będzie odpowiedni i jak można się upewnić, że zostanie on wybrany właściwy?
- Czy model uczenia maszynowego wymaga nadzoru podczas szkolenia?
- Jakie są kluczowe parametry wykorzystywane w algorytmach opartych na sieciach neuronowych?
Zobacz więcej pytań i odpowiedzi w EITC/AI/GCML Google Cloud Machine Learning