Uczenie się nadzorowane i nienadzorowane to dwa podstawowe typy paradygmatów uczenia maszynowego, które służą różnym celom w zależności od charakteru danych i celów danego zadania. Zrozumienie, kiedy stosować szkolenie nadzorowane, a kiedy szkolenie bez nadzoru, ma kluczowe znaczenie w projektowaniu skutecznych modeli uczenia maszynowego. Wybór między tymi dwoma podejściami zależy od dostępności oznaczonych danych, pożądanego wyniku i podstawowej struktury zbioru danych.
Uczenie nadzorowane to rodzaj uczenia maszynowego, w którym model jest szkolony na oznaczonym zbiorze danych. W uczeniu nadzorowanym algorytm uczy się mapować dane wejściowe na prawidłowe dane wyjściowe, prezentując przykłady szkoleniowe. Te przykłady szkoleniowe składają się z par wejście-wyjście, gdzie danym wejściowym towarzyszy odpowiednia prawidłowa wartość wyjściowa lub docelowa. Celem uczenia się nadzorowanego jest nauczenie się funkcji mapowania zmiennych wejściowych na zmienne wyjściowe, które można następnie wykorzystać do przewidywania niewidocznych danych.
Uczenie nadzorowane jest zwykle stosowane, gdy znany jest pożądany wynik, a celem jest poznanie związku między zmiennymi wejściowymi i wyjściowymi. Jest powszechnie stosowany w zadaniach takich jak klasyfikacja, gdzie celem jest przewidzenie etykiet klas nowych instancji, oraz regresja, gdzie celem jest przewidzenie wartości ciągłej. Na przykład w scenariuszu uczenia się nadzorowanego można wytrenować model, aby przewidywał, czy wiadomość e-mail jest spamem, czy nie, na podstawie treści wiadomości e-mail i statusu poprzednich wiadomości e-mail oznaczonych jako spam/niespam.
Z drugiej strony uczenie się bez nadzoru to rodzaj uczenia maszynowego, w którym model jest szkolony na nieoznakowanym zbiorze danych. W przypadku uczenia się bez nadzoru algorytm uczy się wzorców i struktur na podstawie danych wejściowych bez wyraźnej informacji zwrotnej na temat prawidłowego wyniku. Celem uczenia się bez nadzoru jest zbadanie podstawowej struktury danych, odkrycie ukrytych wzorców i wydobycie znaczących spostrzeżeń bez potrzeby etykietowania danych.
Uczenie się bez nadzoru jest powszechnie stosowane, gdy celem jest eksploracja danych, znajdowanie ukrytych wzorców i grupowanie podobnych punktów danych. Jest często stosowany w zadaniach takich jak klastrowanie, gdzie celem jest grupowanie podobnych punktów danych w klastry na podstawie ich cech, oraz redukcja wymiarowości, gdzie celem jest zmniejszenie liczby cech przy jednoczesnym zachowaniu istotnych informacji w danych. Na przykład w scenariuszu uczenia się bez nadzoru można zastosować klastrowanie do grupowania klientów na podstawie ich zachowań zakupowych bez wcześniejszej wiedzy o segmentach klientów.
Wybór pomiędzy uczeniem się pod nadzorem i bez nadzoru zależy od kilku czynników. Jeśli masz oznaczony zbiór danych i chcesz przewidzieć konkretne wyniki, właściwym wyborem będzie uczenie się nadzorowane. Z drugiej strony, jeśli masz nieoznaczony zbiór danych i chcesz zbadać strukturę danych lub znaleźć ukryte wzorce, bardziej odpowiednie jest uczenie się bez nadzoru. W niektórych przypadkach można zastosować kombinację technik nadzorowanych i bez nadzoru, znaną jako uczenie się częściowo nadzorowane, aby wykorzystać zalety obu podejść.
Decyzja o zastosowaniu szkolenia nadzorowanego w porównaniu ze szkoleniem bez nadzoru w uczeniu maszynowym zależy od dostępności oznaczonych danych, charakteru zadania i pożądanego wyniku. Zrozumienie różnic między uczeniem się nadzorowanym i bez nadzoru jest niezbędne do projektowania skutecznych modeli uczenia maszynowego, które mogą wyciągać znaczące wnioski i dokonywać dokładnych przewidywań na podstawie danych.
Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GCML Uczenie Maszynowe Google Cloud:
- Co to jest tekst na mowę (TTS) i jak współpracuje z AI?
- Jakie są ograniczenia w pracy z dużymi zbiorami danych w uczeniu maszynowym?
- Czy uczenie maszynowe może pomóc w dialogu?
- Czym jest plac zabaw TensorFlow?
- Co właściwie oznacza większy zbiór danych?
- Jakie są przykłady hiperparametrów algorytmu?
- Co to jest uczenie się zespołowe?
- Co się stanie, jeśli wybrany algorytm uczenia maszynowego nie będzie odpowiedni i jak można się upewnić, że zostanie on wybrany właściwy?
- Czy model uczenia maszynowego wymaga nadzoru podczas szkolenia?
- Jakie są kluczowe parametry wykorzystywane w algorytmach opartych na sieciach neuronowych?
Zobacz więcej pytań i odpowiedzi w EITC/AI/GCML Google Cloud Machine Learning