×
1 Wybierz Certyfikaty EITC/EITCA
2 Ucz się i zdawaj egzaminy online
3 Zdobądź certyfikat swoich umiejętności informatycznych

Potwierdź swoje umiejętności i kompetencje IT w ramach europejskich ram certyfikacji IT z dowolnego miejsca na świecie, całkowicie online.

Akademia EITCA

Standard poświadczania umiejętności cyfrowych opracowany przez Europejski Instytut Certyfikacji IT, mający na celu wspieranie rozwoju społeczeństwa cyfrowego

ZALOGUJ SIĘ NA SWOJE KONTO

STWÓRZ KONTO ZAPOMNIAŁEŚ HASŁA?

ZAPOMNIAŁEŚ HASŁA?

ACH, CHWILA, TERAZ JUŻ PAMIĘTAM!

STWÓRZ KONTO

MASZ JUŻ KONTO?
EUROPEJSKA AKADEMIA CERTYFIKACJI INFORMATYCZNEJ - POŚWIADCZENIE PROFESJONALNYCH KOMPETENCJI CYFROWYCH
  • ZAREJESTRUJ SIĘ
  • ZALOGUJ
  • INFO

Akademia EITCA

Akademia EITCA

Europejski Instytut Certyfikacji Informatycznej - EITCI Institute

Dostawca Certyfikacji

Instytut EITCI ASBL

Bruksela, Belgia, Unia Europejska

Zarządzanie ramami Europejskiej Certyfikacji IT (EITC) na rzecz wspierania profesjonalizmu IT i społeczeństwa cyfrowego

  • CERTYFIKATY
    • AKADEMIE EITCA
      • KATALOG AKADEMII EITCA<
      • EITCA/CG GRAFIKA KOMPUTEROWA
      • EITCA/IS BEZPIECZEŃSTWO IT
      • EITCA/BI INFORMATYKA BIZNESOWA
      • EITCA/KC KLUCZOWE KOMPETENCJE
      • EITCA/EG E-ADMINISTRACJA
      • EITCA/WD PROJEKTOWANIE STRON
      • EITCA/AI SZTUCZNA INTELIGENCJA
    • CERTYFIKATY EITC
      • KATALOG CERTYFIKATÓW EITC<
      • GRAFIKA KOMPUTEROWA
      • PROJEKTOWANIE STRON WWW
      • PROJEKTOWANIE 3D
      • OPROGRAMOWANIE BIUROWE
      • CERTYFIKAT BITCOIN BLOCKCHAIN
      • CERTYFIKAT WORDPRESS
      • CERTYFIKAT PLATFORM CLOUDNOWY
    • CERTYFIKATY EITC
      • TECHNOLOGIE INTERNETOWE
      • TECHNIKI KRYPTOGRAFICZNE
      • TECHNOLOGIE BIZNESOWE
      • SYSTEMY TELEPRACY
      • PROGRAMOWANIE
      • RYSUNEK PORTRETOWY
      • CERTYFIKATY ROZWOJU SIECI
      • CERTYFIKATY DEEP LEARNINGNOWY
    • CERTYFIKATY DZIEDZINOWE
      • ADMINISTRACJA PUBLICZNA W UE
      • NAUCZYCIELE I EDUKATORZY
      • SPECJALIŚCI BEZPIECZEŃSTWA IT
      • PROJEKTANCI I ARTYŚCI GRAFIKI
      • BIZNESMENI I MENEDŻEROWIE
      • DEWELOPERZY BLOCKCHAIN
      • PROJEKTANCI STRON WWW
      • EKSPERCI CLOUD AINOWY
  • PROMOWANE
  • SUBSYDIUM
  • JAK TO DZIAŁA?
  •   IT ID
  • O EITCA
  • KONTAKT
  • MOJE ZAMÓWIENIE
    Twoje obecne zamówienie jest puste.
EITCIINSTITUTE
CERTIFIED

Jaki jest wzór matematyczny operacji splotu na obrazie 2D?

by Akademia EITCA / Czwartek, 23 maja 2024 / Opublikowano w Artificial Intelligence, EITC/AI/ADL Zaawansowane Głębokie Uczenie, Zaawansowana wizja komputerowa, Konwolucyjne sieci neuronowe do rozpoznawania obrazów

Operacja splotu jest podstawowym procesem w dziedzinie splotowych sieci neuronowych (CNN), szczególnie w dziedzinie rozpoznawania obrazów. Ta operacja ma kluczowe znaczenie w wydobywaniu cech z obrazów, umożliwiając modelom głębokiego uczenia się zrozumienie i interpretację danych wizualnych. Matematyczne sformułowanie operacji splotu na obrazie 2D jest niezbędne do zrozumienia, w jaki sposób CNN przetwarzają i analizują obrazy.

Matematycznie operację splotu obrazu 2D można wyrazić w następujący sposób:

[ (I * K)(x, y) = suma_{i=-m}^{m} suma_{j=-n}^{n} I(x+i, y+j) cdot K(i, j ) ]

Gdzie:
– (I) reprezentuje obraz wejściowy.
– ( K ) oznacza jądro lub filtr.
– ( (x, y) ) to współrzędne piksela wyjściowego.
– ( m ) i ( n ) to odpowiednio połowa szerokości i połowa wysokości jądra.

W tym równaniu jądro ( K ​​) przesuwa się po obrazie wejściowym ( I ), wykonując elementarne mnożenie i sumując wyniki, aby uzyskać pojedynczą wartość wyjściową w pikselach. Proces ten jest powtarzany dla każdego piksela wyjściowej mapy cech, w wyniku czego powstaje przekształcony obraz, który podkreśla określone cechy w oparciu o wartości jądra.

Operację splotu można lepiej zrozumieć na przykładzie krok po kroku. Rozważmy proste jądro 3×3 ( K ) i obraz wejściowy 5×5 ( I ):

[ K = początek{bmacierz}
1 i 0 i -1 \
1 i 0 i -1 \
1 i 0 i -1
koniec{bmatrix} ] [ I = początek{bmatrix}
1 i 2 i 3 i 4 i 5 \
6 i 7 i 8 i 9 i 10 \
11 i 12 i 13 i 14 i 15 \
16 i 17 i 18 i 19 i 20 \
21 i 22 i 23 i 24 i 25
koniec{bmacierz} ]

Aby obliczyć splot, umieszczamy środek jądra w każdym pikselu obrazu wejściowego i wykonujemy następujące kroki:

1. Umieścić jądro: Umieść środek jądra w lewym górnym rogu obrazu.
2. Mnożenie elementarne: Pomnóż każdy element jądra przez odpowiedni element obrazu.
3. Podsumowanie: zsumuj wyniki mnożenia elementarnego.
4. Przesuń jądro: Przesuń jądro do następnej pozycji i powtórz kroki 2-3.

Dla pierwszej pozycji (lewy górny róg) obliczenie wygląda następująco:

[ rozpocznij{wyrównane}
(I * K)(1, 1) &= (1 cdot 1) + (2 cdot 0) + (3 cdot -1) \
&quad + (6 cdot 1) + (7 cdot 0) + (8 cdot -1) \
&quad + (11 cdot 1) + (12 cdot 0) + (13 cdot -1) \
&= 1 + 0 – 3 + 6 + 0 – 8 + 11 + 0 – 13 \
&= -6
koniec{wyrównany}]

Ten wynik, -6, jest wartością wyjściowej mapy cech w pozycji (1, 1). Powtarzanie tego procesu dla każdej pozycji jądra na obrazie wejściowym generuje całą wyjściową mapę cech.

Operacji splotu zazwyczaj towarzyszą dodatkowe pojęcia, takie jak dopełnienie i krok:

- Wyściółka: Dodanie dodatkowych pikseli wokół krawędzi obrazu wejściowego, często z zerami (wypełnienie zerami), w celu kontrolowania wymiarów przestrzennych wyjściowej mapy obiektów. Dopełnienie zapewnia, że ​​wyjściowa mapa obiektów ma takie same wymiary jak obraz wejściowy, zachowując informacje przestrzenne.
- Krok: Rozmiar kroku, o jaki jądro porusza się po obrazie wejściowym. Krok o wartości 1 oznacza, że ​​jądro przesuwa się o jeden piksel na raz, natomiast krok o wartości 2 oznacza, że ​​jądro przesuwa się o dwa piksele na raz. Krok wpływa na wymiary przestrzenne wyjściowej mapy cech, przy czym większe kroki skutkują mniejszymi wymiarami wyjściowymi.

Wymiary wyjściowe operacji splotu można obliczyć za pomocą następującego wzoru:

[ tekst{Szerokość wyjściowa} = lewy podłoga frac{tekst{Szerokość wejściowa} – tekst{Szerokość jądra} + 2 cdot tekst{Padding}}{tekst{Krok}} prawe piętro + 1 ] [ tekst{Wysokość wyjściowa} = lewy frac{tekst {Input Height} – tekst{Wysokość jądra} + 2 cdot tekst{Padding}}{text{Stride}} prawa podłoga + 1 ]

Formuły te zapewniają prawidłowe określenie wymiarów przestrzennych wyjściowej mapy cech na podstawie wymiarów obrazu wejściowego, rozmiaru jądra, wypełnienia i kroku.

W kontekście splotowych sieci neuronowych wiele warstw splotowych jest ułożonych razem, a każda z nich ma własny zestaw możliwych do nauczenia się jąder. Warstwy te stopniowo wyodrębniają cechy wyższego poziomu z obrazu wejściowego, umożliwiając sieci rozpoznawanie złożonych wzorców i obiektów. Jądra w każdej warstwie uczą się podczas procesu uczenia poprzez propagację wsteczną, optymalizując wydajność sieci w zadaniu.

Po warstwach splotowych często następują funkcje aktywacyjne, takie jak ReLU (Rectified Linear Unit), które wprowadzają do modelu nieliniowość. Ta nieliniowość pozwala sieci uczyć się bardziej złożonych reprezentacji. Ponadto warstwy łączenia, takie jak łączenie maksymalne lub łączenie średnie, są używane w celu zmniejszenia wymiarów przestrzennych map obiektów, dzięki czemu model jest bardziej wydajny obliczeniowo i mniej podatny na nadmierne dopasowanie.

Praktycznym przykładem splotowej sieci neuronowej do rozpoznawania obrazów jest słynna architektura LeNet-5, przeznaczona do rozpoznawania cyfr pisanych odręcznie. LeNet-5 składa się z wielu warstw splotowych i pulujących, po których następują warstwy w pełni połączone. Warstwy splotowe wyodrębniają cechy z obrazów wejściowych, podczas gdy w pełni połączone warstwy dokonują ostatecznej klasyfikacji.

Aby zilustrować operację splotu w kontekście LeNet-5, rozważ pierwszą warstwę splotową, która pobiera obraz wejściowy o wymiarach 32 × 32 i stosuje sześć jąder 5 × 5 z krokiem 1 i bez dopełnienia. Wyjściowe mapy obiektów mają wymiary 28×28, obliczone w następujący sposób:

[ tekst{Szerokość wyjściowa} = lewe piętro frac{32 – 5 + 2 cdot 0}{1} prawe piętro + 1 = 28 ] [ tekst{Wysokość wyjściowa} = lewe piętro frac{32 – 5 + 2 cdot 0}{1} prawe piętro + 1 = 28]

Każde z sześciu jąder tworzy osobną mapę funkcji o wymiarach 28 × 28, przechwytującą różne aspekty obrazu wejściowego. Te mapy obiektów są następnie przepuszczane przez funkcję aktywacji ReLU i warstwę łączenia o maksymalnym rozmiarze 2×2 z krokiem 2, w wyniku czego powstają mapy obiektów o wymiarach 14×14.

Kolejne warstwy LeNet-5 w dalszym ciągu stosują operacje splotu i łączenia, stopniowo redukując wymiary przestrzenne, jednocześnie zwiększając głębokość map obiektów. Końcowe, w pełni połączone warstwy przeprowadzają klasyfikację w oparciu o wyodrębnione cechy, dając w rezultacie przewidywaną klasę cyfr.

Operacja splotu jest kamieniem węgielnym sieci neuronowych splotowych, umożliwiając ekstrakcję znaczących cech z obrazów. Matematyczna formuła operacji splotu obejmuje przesuwanie jądra nad obrazem wejściowym, wykonywanie mnożenia elementów i sumowanie wyników. Dodatkowe koncepcje, takie jak wypełnienie i krok, odgrywają ważną rolę w kontrolowaniu wymiarów przestrzennych mapy cech wyjściowych. Warstwy splotowe, w połączeniu z funkcjami aktywacji i warstwami łączenia, tworzą podstawowe elementy potężnych modeli rozpoznawania obrazów, takich jak LeNet-5, zdolnych do rozpoznawania złożonych wzorców i obiektów w danych wizualnych.

Inne niedawne pytania i odpowiedzi dotyczące Zaawansowana wizja komputerowa:

  • Jaki jest wzór na funkcję aktywacji, taką jak wyprostowana jednostka liniowa, aby wprowadzić nieliniowość do modelu?
  • Jaki jest wzór matematyczny na funkcję straty w splotowych sieciach neuronowych?
  • Jakie jest równanie na maksymalne łączenie?
  • Jakie są zalety i wyzwania związane z wykorzystaniem splotów 3D do rozpoznawania działań w filmach i w jaki sposób zbiór danych Kinetics wnosi wkład w tę dziedzinę badań?
  • W kontekście szacowania przepływu optycznego, w jaki sposób FlowNet wykorzystuje architekturę kodera-dekodera do przetwarzania par obrazów i jaką rolę odgrywa zbiór danych Flying Chairs w szkoleniu tego modelu?
  • W jaki sposób architektura U-NET wykorzystuje pomijane połączenia w celu zwiększenia precyzji i szczegółowości wyników segmentacji semantycznej i dlaczego te połączenia są ważne dla propagacji wstecznej?
  • Jakie są kluczowe różnice między detektorami dwustopniowymi, takimi jak Faster R-CNN, a detektorami jednostopniowymi, takimi jak RetinaNet, pod względem wydajności uczenia i obsługi nieróżnicowalnych komponentów?
  • W jaki sposób koncepcja Intersection over Union (IoU) poprawia ocenę modeli wykrywania obiektów w porównaniu z wykorzystaniem straty kwadratowej?
  • W jaki sposób połączenia resztkowe w architekturach ResNet ułatwiają uczenie bardzo głębokich sieci neuronowych i jaki miało to wpływ na wydajność modeli rozpoznawania obrazów?
  • Jakie główne innowacje wprowadzone przez AlexNet w 2012 roku znacząco przyczyniły się do rozwoju dziedziny splotowych sieci neuronowych i rozpoznawania obrazów?

Zobacz więcej pytań i odpowiedzi w Zaawansowane widzenie komputerowe

Więcej pytań i odpowiedzi:

  • Pole: Artificial Intelligence
  • Program: EITC/AI/ADL Zaawansowane Głębokie Uczenie (przejdź do programu certyfikacji)
  • Lekcja: Zaawansowana wizja komputerowa (przejdź do odpowiedniej lekcji)
  • Wątek: Konwolucyjne sieci neuronowe do rozpoznawania obrazów (przejdź do powiązanego tematu)
Tagged under: Artificial Intelligence, CNN, Skręt, Ekstrakcja cech, Przetwarzanie obrazu, Jądro
Strona Główna » Artificial Intelligence » EITC/AI/ADL Zaawansowane Głębokie Uczenie » Zaawansowana wizja komputerowa » Konwolucyjne sieci neuronowe do rozpoznawania obrazów » » Jaki jest wzór matematyczny operacji splotu na obrazie 2D?

Centrum Certyfikacji

MENU UŻYTKOWNIKA

  • Moje Konto

KATEGORIA CERTYFIKATU

  • Certyfikaty EITC (105)
  • Certyfikaty EITCA (9)

Czego szukasz?

  • Wprowadzenie
  • Jak to działa?
  • Akademie EITCA
  • Dotacja EITCI DSJC
  • Pełny katalog EITC
  • Zamówienie
  • Promowane
  •   IT ID
  • Recenzje EITCA (średnia publikacja)
  • O EITCA
  • Kontakt

Akademia EITCA jest częścią europejskich ram certyfikacji IT

Europejskie ramy certyfikacji IT zostały ustanowione w 2008 roku jako europejski i niezależny od dostawców standard szeroko dostępnej internetowej certyfikacji umiejętności i kompetencji cyfrowych w wielu obszarach profesjonalnych specjalizacji cyfrowych. Ramy EITC są regulowane przez Europejski Instytut Certyfikacji Informatycznej (EITCI), nienastawiony na zysk urząd certyfikacji wspierający rozwój społeczeństwa informacyjnego i niwelujący lukę w umiejętnościach cyfrowych w UE.

Uprawnienie do Akademii EITCA 90% wsparcia EITCI DSJC Subsydium

90% opłat za Akademię EITCA dotowane w rejestracji przez

    Biuro Sekretarza Akademii EITCA

    Europejski Instytut Certyfikacji IT ASBL
    Bruksela, Belgia, Unia Europejska

    Operator Ram Certyfikacji EITC/EITCA
    Nadzorująca Standard Europejskiej Certyfikacji IT
    Uzyskiwania dostępu formularza kontaktowego lub zadzwoń +32 25887351

    Obserwuj EITCI na X
    Odwiedź Akademię EITCA na Facebooku
    Współpracuj z Akademią EITCA na LinkedIn
    Obejrzyj filmy EITCI i EITCA na YouTube

    Finansowane przez Unię Europejską

    Finansowane przez Europejski Fundusz Rozwoju Regionalnego (EFRR) i Europejski Fundusz Społeczny (EFS) w serii projektów od 2007 r., obecnie regulowanych przez Europejski Instytut Certyfikacji Informatycznej (EITCI) od 2008 r.

    Polityka bezpieczeństwa informacji | Polityka DSRRM i RODO | Polityka ochrony danych | Rejestr czynności przetwarzania | Polityka BHP | Polityka antykorupcyjna | Współczesna polityka dotycząca niewolnictwa

    Przetłumacz automatycznie na swój język

    Regulamin usług | Polityka prywatności
    Akademia EITCA
    • Akademia EITCA w mediach społecznościowych
    Akademia EITCA


    © 2008-2025  Europejski Instytut Certyfikacji IT
    Bruksela, Belgia, Unia Europejska

    WRÓĆ
    CZAT Z POMOCĄ
    Czy masz jakieś pytania?