Dziedzina uczenia maszynowego obejmuje różnorodne metodologie i paradygmaty, z których każdy jest dostosowany do różnych typów danych i problemów. Spośród tych paradygmatów uczenie nadzorowane i nienadzorowane to dwa z najbardziej podstawowych.
Uczenie nadzorowane polega na trenowaniu modelu na oznaczonym zestawie danych, gdzie dane wejściowe są sparowane z prawidłowym wyjściem. Model uczy się mapować dane wejściowe na dane wyjściowe, minimalizując błąd między przewidywaniami a rzeczywistymi danymi wyjściowymi. Z drugiej strony uczenie nienadzorowane zajmuje się danymi nieoznaczonymi, gdzie celem jest wywnioskowanie naturalnej struktury obecnej w zestawie punktów danych.
Istnieje typ uczenia się, który integruje techniki uczenia nadzorowanego i nienadzorowanego, często określane jako uczenie półnadzorowane. To podejście wykorzystuje zarówno dane oznaczone, jak i nieoznaczone podczas procesu szkolenia. Podstawą półnadzorowanego uczenia się jest to, że dane nieoznaczone, gdy są używane w połączeniu z niewielką ilością danych oznaczonych, mogą przynieść znaczną poprawę dokładności uczenia się. Jest to szczególnie przydatne w scenariuszach, w których dane oznaczone są rzadkie lub drogie w uzyskaniu, ale dane nieoznaczone są obfite i łatwe do zebrania.
Uczenie półnadzorowane opiera się na założeniu, że podstawowa struktura nieoznaczonych danych może dostarczyć cennych informacji, które są uzupełnieniem oznaczonych danych. To założenie może przybierać różne formy, takie jak założenie klastra, założenie rozmaitości lub założenie separacji niskiej gęstości. Założenie klastra zakłada, że punkty danych w tym samym klastrze prawdopodobnie będą miały tę samą etykietę. Założenie rozmaitości sugeruje, że dane o wysokiej liczbie wymiarów leżą na rozmaitości o znacznie niższej wymiarowości, a zadaniem jest nauczenie się tej rozmaitości. Założenie separacji niskiej gęstości opiera się na idei, że granica decyzyjna powinna leżeć w obszarze o niskiej gęstości danych.
Jedną z powszechnych technik stosowanych w uczeniu półnadzorowanym jest samokształcenie. W samokształceniu model jest początkowo trenowany na oznaczonych danych. Następnie używa własnych przewidywań na nieoznaczonych danych jako pseudo-etykiet. Model jest dalej trenowany na tym rozszerzonym zestawie danych, iteracyjnie udoskonalając swoje przewidywania. Inną techniką jest współszkolenie, w którym dwa lub więcej modeli jest trenowanych jednocześnie na różnych widokach danych. Każdy model jest odpowiedzialny za etykietowanie części nieoznaczonych danych, które są następnie wykorzystywane do trenowania pozostałych modeli. Ta metoda wykorzystuje redundancję w wielu widokach danych w celu poprawy wydajności uczenia się.
Metody oparte na grafach są również powszechne w uczeniu półnadzorowanym. Te metody konstruują graf, w którym węzły reprezentują punkty danych, a krawędzie reprezentują podobieństwa między nimi. Zadanie uczenia się jest następnie reformułowane jako problem optymalizacji oparty na grafach, w którym celem jest propagowanie etykiet z węzłów oznaczonych do nieoznaczonych, przy jednoczesnym zachowaniu struktury grafu. Techniki te są szczególnie skuteczne w domenach, w których dane naturalnie tworzą sieć, takich jak sieci społecznościowe lub sieci biologiczne.
Innym podejściem do łączenia uczenia nadzorowanego i nienadzorowanego jest uczenie się wielozadaniowe. W uczeniu się wielozadaniowym wiele zadań uczenia się jest rozwiązywanych jednocześnie, przy jednoczesnym wykorzystaniu podobieństw i różnic między zadaniami. Można to postrzegać jako formę transferu indukcyjnego, w którym wiedza zdobyta z jednego zadania pomaga ulepszyć naukę innego. Uczenie się wielozadaniowe może być szczególnie korzystne, gdy istnieje wspólna reprezentacja lub przestrzeń cech między zadaniami, umożliwiająca transfer informacji.
Praktycznym przykładem uczenia półnadzorowanego jest dziedzina przetwarzania języka naturalnego (NLP). Rozważmy zadanie analizy sentymentu, gdzie celem jest sklasyfikowanie danego tekstu jako pozytywnego lub negatywnego. Oznaczone dane, takie jak recenzje z etykietami sentymentu, mogą być ograniczone. Jednak dostępna jest ogromna ilość nieoznaczonego tekstu. Podejście uczenia półnadzorowanego może obejmować trenowanie klasyfikatora sentymentu na oznaczonych danych i używanie go do przewidywania sentymentu nieoznaczonych danych. Te prognozy mogą być następnie używane jako dodatkowe dane treningowe, co poprawia wydajność klasyfikatora.
Inny przykład można znaleźć w klasyfikacji obrazów. W wielu przypadkach uzyskanie oznaczonych obrazów jest pracochłonne i kosztowne, podczas gdy obrazów nieoznaczonych jest pod dostatkiem. Podejście półnadzorowane może obejmować użycie małego zestawu oznaczonych obrazów do wytrenowania początkowego modelu. Model ten można następnie zastosować do nieoznaczonych obrazów w celu wygenerowania pseudo-etykiet, które są następnie wykorzystywane do ponownego wytrenowania modelu.
Integracja uczenia nadzorowanego i nienadzorowanego poprzez uczenie półnadzorowane i powiązane metodologie stanowi potężne podejście w uczeniu maszynowym. Wykorzystując mocne strony obu paradygmatów, możliwe jest osiągnięcie znaczących ulepszeń w wydajności modelu, szczególnie w domenach, w których dane oznaczone są ograniczone, a dane nieoznaczone są obfite. To podejście nie tylko zwiększa zdolność modeli do generalizacji z ograniczonych danych, ale także zapewnia bardziej solidne ramy do zrozumienia podstawowej struktury złożonych zestawów danych.
Inne niedawne pytania i odpowiedzi dotyczące EITC/AI/GCML Uczenie Maszynowe Google Cloud:
- Wspomniałeś o wielu rodzajach algorytmów, takich jak regresja liniowa, drzewa decyzyjne. Czy to wszystko sieci neuronowe?
- Jakie są wskaźniki oceny wydajności modelu?
- Czym jest regresja liniowa?
- Czy można połączyć różne modele uczenia maszynowego i zbudować nadrzędną sztuczną inteligencję?
- Jakie są najczęstsze algorytmy stosowane w uczeniu maszynowym?
- Jak stworzyć wersję modelu?
- Jak zastosować 7 kroków ML w przykładowym kontekście?
- W jaki sposób uczenie maszynowe można zastosować do danych dotyczących pozwoleń na budowę?
- Dlaczego tabele AutoML zostały wycofane i co je zastępuje?
- Jakie jest zadanie interpretacji rysunków rysowanych przez graczy w kontekście sztucznej inteligencji?
Zobacz więcej pytań i odpowiedzi w EITC/AI/GCML Google Cloud Machine Learning