Podstawy teorii złożoności obliczeniowej EITC/IS/CCTF

by Akademia EITCA / Poniedziałek, 03 maja 2021 / Opublikowano w

Obecny status

Nie zapisany

Cena

€110.00

Zacznij już dziś

Zapisz się na ten program

EITC/IS/CCTF Computational Complexity Theory Fundamentals to europejski program certyfikacji IT dotyczący teoretycznych aspektów podstaw informatyki, które są również podstawą klasycznej asymetrycznej kryptografii klucza publicznego szeroko stosowanej w Internecie.

Program studiów EITC/IS/CCTF Computational Complexity Theory Fundamentals obejmuje wiedzę teoretyczną dotyczącą podstaw informatyki i modeli obliczeniowych w zakresie podstawowych pojęć, takich jak deterministyczne i niedeterministyczne maszyny skończone, języki regularne, gramery bezkontekstowe i teoria języków, teoria automatów, Turing Maszyny, rozstrzygalność problemów, rekurencja, logika i złożoność algorytmiki dla podstawowych zastosowań bezpieczeństwa w ramach poniższej struktury, obejmującej obszerne treści dydaktyczne wideo jako odniesienie dla certyfikacji EITC.

Złożoność obliczeniowa algorytmu to ilość zasobów potrzebnych do jego obsługi. Szczególną uwagę przywiązuje się do zasobów czasu i pamięci. Złożoność problemu jest definiowana jako złożoność najlepszych algorytmów do jego rozwiązania. Analiza algorytmów to badanie złożoności jawnie podanych algorytmów, natomiast teoria złożoności obliczeniowej to badanie złożoności rozwiązań problemów za pomocą najlepiej znanych algorytmów. Obie dziedziny są ze sobą powiązane, ponieważ złożoność algorytmu jest zawsze górnym ograniczeniem złożoności problemu, który rozwiązuje. Ponadto często przy konstruowaniu wydajnych algorytmów konieczne jest porównanie złożoności danego algorytmu ze złożonością problemu do rozwiązania. W większości przypadków jedyną dostępną informacją dotyczącą trudności problemu jest to, że jest on mniejszy niż złożoność najbardziej wydajnych znanych technik. W rezultacie analiza algorytmów i teoria złożoności w dużym stopniu pokrywają się.

Teoria złożoności odgrywa ważną rolę nie tylko w podstawach modeli obliczeniowych jako podstaw informatyki, ale także w podstawach klasycznej kryptografii asymetrycznej (tzw. kryptografii klucza publicznego), która jest szeroko rozpowszechniona w nowoczesnych sieciach, zwłaszcza w Internecie. Szyfrowanie kluczem publicznym opiera się na trudnych obliczeniowo pewnych asymetrycznych problemach matematycznych, takich jak na przykład faktoryzacja dużych liczb na ich czynniki pierwsze (operacja ta jest trudnym problemem w klasyfikacji teorii złożoności, ponieważ nie są znane wydajne klasyczne algorytmy do rozwiązania to z zasobami skalowanymi wielomianowo, a nie wykładniczo wraz ze wzrostem wielkości wejściowej problemu, co jest w przeciwieństwie do bardzo prostej odwrotnej operacji mnożenia do znanych czynników pierwszych, aby uzyskać oryginalną dużą liczbę). Wykorzystując tę asymetrię w architekturze kryptografii klucza publicznego (definiując obliczeniowo asymetryczną relację między kluczem publicznym, którą można łatwo obliczyć z klucza prywatnego, podczas gdy klucz prywatny nie może być łatwo skomputeryzowany z klucza publicznego, można publicznie ogłosić klucz publiczny i umożliwić innym stronom komunikacji wykorzystanie go do asymetrycznego szyfrowania danych, które następnie można odszyfrować tylko za pomocą sprzężonego klucza prywatnego, niedostępnego obliczeniowo dla stron trzecich, dzięki czemu komunikacja jest bezpieczna).

Teoria złożoności obliczeniowej została opracowana głównie na podstawie osiągnięć pionierów informatyki i algorytmiki, takich jak Alan Turing, którego praca miała kluczowe znaczenie dla złamania szyfru Enigmy nazistowskich Niemiec, które odegrały głęboką rolę w zwycięstwie sojuszników w II wojnie światowej. Kryptoanaliza mająca na celu opracowanie i automatyzację procesów obliczeniowych analizowania danych (głównie zaszyfrowanej komunikacji) w celu wykrycia ukrytych informacji była wykorzystywana do włamywania się do systemów kryptograficznych i uzyskiwania dostępu do treści zaszyfrowanej komunikacji, zwykle o strategicznym znaczeniu militarnym. Była to również kryptoanaliza, która była katalizatorem rozwoju pierwszych nowoczesnych komputerów (które początkowo były stosowane do strategicznego celu łamania kodów). Brytyjski Colossus (uważany za pierwszy nowoczesny komputer elektroniczno-programowy) poprzedziła polska „bomba”, elektroniczne urządzenie obliczeniowe zaprojektowane przez Mariana Rejewskiego do pomocy w łamaniu szyfrów Enigmy i przekazane Wielkiej Brytanii przez polski wywiad wraz z przechwyconą niemiecką maszynę szyfrującą Enigma, po napaści Niemiec na Polskę w 1939 roku. Na podstawie tego urządzenia Alan Turing opracował jego bardziej zaawansowany odpowiednik, aby skutecznie łamać niemiecką szyfrowaną komunikację, którą później rozwinięto w nowoczesne komputery.

Ponieważ ilość zasobów wymaganych do uruchomienia algorytmu różni się w zależności od wielkości danych wejściowych, złożoność jest zwykle wyrażana jako funkcja f(n), gdzie n jest wielkością danych wejściowych, a f(n) jest złożonością najgorszego przypadku ( maksymalna ilość zasobów wymaganych dla wszystkich nakładów wielkości n) lub złożoność średniego przypadku (średnia ilość zasobów dla wszystkich nakładów wielkości n). Liczba wymaganych operacji elementarnych na wejściu o rozmiarze n jest powszechnie określana jako złożoność czasowa, gdzie uważa się, że operacje elementarne zajmują stałą ilość czasu na określonym komputerze i zmieniają się tylko o stały współczynnik, gdy są wykonywane na innej maszynie. Ilość pamięci wymaganej przez algorytm na wejściu o rozmiarze n jest znana jako złożoność przestrzeni.

Czas jest najczęściej branym pod uwagę zasobem. Kiedy termin „złożoność” jest używany bez kwalifikatora, zwykle odnosi się do złożoności czasu.

Tradycyjne jednostki czasu (sekundy, minuty itd.) nie są wykorzystywane w teorii złożoności, ponieważ są zbyt zależne od wybranego komputera i zaawansowania technologii. Na przykład, dzisiejszy komputer może wykonać algorytm znacznie szybciej niż komputer z lat sześćdziesiątych, jednak jest to spowodowane przełomem technologicznym w sprzęcie komputerowym, a nie nieodłączną jakością algorytmu. Celem teorii złożoności jest ilościowe określenie nieodłącznych potrzeb czasowych algorytmów lub podstawowych ograniczeń czasowych, które algorytm nałożyłby na dowolny komputer. Osiąga się to poprzez zliczenie, ile podstawowych operacji jest wykonywanych podczas obliczeń. Procedury te są powszechnie określane jako kroki, ponieważ uważa się, że zajmują one stały czas na określonej maszynie (tj. nie ma na nie wpływu ilość danych wejściowych).

Innym ważnym zasobem jest ilość pamięci komputera wymaganej do wykonywania algorytmów.

Innym często używanym zasobem jest ilość operacji arytmetycznych. W tym scenariuszu używany jest termin „złożoność arytmetyczna”. Złożoność czasowa jest generalnie iloczynem złożoności arytmetycznej przez stały czynnik, jeśli znane jest górne ograniczenie rozmiaru binarnej reprezentacji liczb, które występują podczas obliczeń.

Wielkość liczb całkowitych wykorzystywanych podczas obliczeń nie jest ograniczona dla wielu metod i nierealistyczne jest założenie, że operacje arytmetyczne wymagają ustalonej ilości czasu. W rezultacie złożoność czasowa, znana również jako złożoność bitowa, może być znacznie wyższa niż złożoność arytmetyczna. Arytmetyczna trudność obliczenia wyznacznika nn macierzy liczb całkowitych, na przykład, wynosi O(n^3) dla standardowych technik (eliminacja Gaussa). Ponieważ wielkość współczynników może rozszerzać się wykładniczo podczas obliczeń, złożoność bitowa tych samych metod jest wykładnicza w n. Jeśli te techniki są używane w połączeniu z arytmetykami wielomodułowymi, złożoność bitową można zmniejszyć do O(n^4).

Formalnie złożoność bitowa odnosi się do liczby operacji na bitach wymaganych do uruchomienia algorytmu. Równa się złożoności czasowej do stałego współczynnika w większości paradygmatów obliczeniowych. Liczba operacji na słowach maszynowych wymaganych przez komputery jest proporcjonalna do złożoności bitowej. W przypadku realistycznych modeli obliczeń złożoność czasowa i złożoność bitowa są zatem identyczne.

Zasobem często branym pod uwagę przy sortowaniu i wyszukiwaniu jest ilość porównań wpisów. Jeśli dane są dobrze uporządkowane, jest to dobry wskaźnik złożoności czasowej.

Na wszystkich potencjalnych wejściach zliczanie liczby kroków w algorytmie jest niemożliwe. Ponieważ złożoność danych wejściowych rośnie wraz z ich rozmiarami, jest ona powszechnie reprezentowana jako funkcja rozmiaru danych wejściowych n (w bitach), a więc złożoność jest funkcją n. Jednak w przypadku danych wejściowych o tej samej wielkości złożoność algorytmu może się znacznie różnić. W rezultacie rutynowo stosuje się różne funkcje złożoności.

Złożoność najgorszego przypadku jest sumą całej złożoności dla wszystkich wielkości n danych wejściowych, podczas gdy średnia złożoność jest sumą całej złożoności dla wszystkich wielkości n danych wejściowych (ma to sens, ponieważ liczba możliwych danych wejściowych o danym rozmiarze wynosi skończone). Kiedy termin „złożoność” jest używany bez dalszego definiowania, bierze się pod uwagę najgorszy przypadek złożoności czasowej.

Złożoność najgorszego i średniego przypadku jest bardzo trudna do prawidłowego obliczenia. Co więcej, te dokładne wartości mają niewielkie zastosowanie praktyczne, ponieważ każda zmiana w maszynie lub paradygmacie obliczeniowym może nieznacznie zmienić złożoność. Co więcej, użycie zasobów nie jest kluczowe dla małych wartości n, dlatego łatwość implementacji jest często bardziej atrakcyjna niż niska złożoność dla małych n.

Z tych powodów najwięcej uwagi poświęca się zachowaniu złożoności dla wysokiego n, to jest jej zachowaniu asymptotycznemu, gdy n zbliża się do nieskończoności. W rezultacie duża notacja O jest powszechnie używana do wskazania złożoności.

Modele obliczeniowe

Wybór modelu obliczeniowego, który polega na określeniu podstawowych operacji wykonywanych w jednostce czasu, ma kluczowe znaczenie dla określenia złożoności. Jest to czasami określane jako wielotaśmowa maszyna Turinga, gdy paradygmat obliczeniowy nie jest szczegółowo opisany.

Deterministyczny model obliczeń to taki, w którym kolejne stany maszyny i operacje do wykonania są całkowicie określone przez stan poprzedni. Funkcje rekurencyjne, rachunek lambda i maszyny Turinga były pierwszymi modelami deterministycznymi. Maszyny o dostępie swobodnym (znane również jako maszyny RAM) są popularnym paradygmatem symulacji komputerów w świecie rzeczywistym.

Gdy model obliczeniowy nie jest zdefiniowany, zwykle zakłada się wielotaśmową maszynę Turinga. Na wielotaśmowych maszynach Turinga złożoność czasowa jest taka sama jak na maszynach z pamięcią RAM w przypadku większości algorytmów, chociaż może być wymagana znaczna uwaga w sposobie przechowywania danych w pamięci, aby osiągnąć tę równoważność.

Na niektórych etapach obliczeń można dokonać różnych wyborów w niedeterministycznym modelu obliczeniowym, takim jak niedeterministyczne maszyny Turinga. W teorii złożoności wszystkie możliwe opcje są rozważane w tym samym czasie, a niedeterministyczna złożoność czasowa to ilość czasu wymagana, aby zawsze dokonywać najlepszych wyborów. Innymi słowy, obliczenia są wykonywane jednocześnie na tylu (identycznych) procesorach, ile jest wymaganych, a niedeterministyczny czas obliczeń to czas, w którym pierwszy procesor wykonuje obliczenia. Ten paralelizm może być wykorzystany w obliczeniach kwantowych poprzez użycie nałożonych stanów splątanych podczas uruchamiania wyspecjalizowanych algorytmów kwantowych, takich jak na przykład faktoryzacja Shora małych liczb całkowitych.

Nawet jeśli taki model obliczeniowy nie jest obecnie wykonalny, ma on znaczenie teoretyczne, szczególnie w odniesieniu do problemu P = NP, który pyta, czy klasy złożoności utworzone przy użyciu „czasu wielomianu” i „czasu wielomianu niedeterministycznego” jako najmniej granice są takie same. W komputerze deterministycznym symulacja algorytmu NP wymaga „czasu wykładniczego”. Jeśli zadanie można rozwiązać w czasie wielomianowym w układzie niedeterministycznym, należy ono do klasy trudności NP. Jeśli problem jest NP i nie jest łatwiejszy niż jakikolwiek inny problem NP, mówi się, że jest NP-zupełny. Problem plecakowy, problem komiwojażera i problem spełnialności Boole'a to wszystkie problemy kombinatoryczne NP-zupełne. Najbardziej znany algorytm ma złożoność wykładniczą dla wszystkich tych problemów. Gdyby którekolwiek z tych zagadnień można było rozwiązać w czasie wielomianowym na maszynie deterministycznej, to wszystkie problemy NP mogłyby być również rozwiązane w czasie wielomianowym i ustalono by P = NP. Od 2017 r. powszechnie przyjmuje się, że P NP, co oznacza, że najgorsze sytuacje problemów NP są zasadniczo trudne do rozwiązania, tj. trwają znacznie dłużej niż jakikolwiek możliwy przedział czasu (dziesiątki) przy interesujących długościach wejściowych.

Obliczenia równoległe i rozproszone

Przetwarzanie równoległe i rozproszone obejmuje dzielenie przetwarzania na wiele procesorów, które działają w tym samym czasie. Podstawowym rozróżnieniem pomiędzy różnymi modelami jest sposób przesyłania danych pomiędzy procesorami. Transmisja danych między procesorami jest zwykle bardzo szybka w przypadku obliczeń równoległych, podczas gdy przesyłanie danych między procesorami w obliczeniach rozproszonych odbywa się przez sieć, a zatem jest znacznie wolniejsze.

Obliczenia na N procesorach zajmują co najmniej iloraz N czasu, jaki zajmuje pojedynczy procesor. W rzeczywistości, ponieważ niektóre podzadania nie mogą być zrównoleglone, a niektóre procesory mogą potrzebować czekać na wynik z innego procesora, ta teoretycznie idealna granica nigdy nie zostanie osiągnięta.

Kluczową kwestią złożoności jest więc opracowanie algorytmów tak, aby iloczyn czasu obliczeń przez liczbę procesorów był jak najbardziej zbliżony do czasu wymaganego do wykonania tych samych obliczeń na pojedynczym procesorze.

Obliczenia kwantowe

Komputer kwantowy to komputer z modelem obliczeniowym opartym na mechanice kwantowej. Teza Churcha-Turinga jest prawdziwa dla komputerów kwantowych, sugerując, że każdy problem, który komputer kwantowy może rozwiązać, może być również rozwiązany przez maszynę Turinga. Jednak niektóre zadania można teoretycznie rozwiązać za pomocą komputera kwantowego, a nie klasycznego komputera o znacznie mniejszej złożoności czasowej. Na razie jest to czysto teoretyczne, bo nikt nie wie, jak zbudować praktyczny komputer kwantowy.

Teoria złożoności kwantowej została stworzona w celu zbadania różnych rodzajów problemów, które mogą być rozwiązywane przez komputery kwantowe. Jest on wykorzystywany w kryptografii post-kwantowej, czyli w procesie tworzenia protokołów kryptograficznych odpornych na ataki komputerów kwantowych.

Złożoność problemu (dolne granice)

Sednem złożoności algorytmów, które mogą rozwiązać problem, w tym nieodkrytych technik, jest złożoność problemu. W rezultacie złożoność problemu jest równa złożoności dowolnego algorytmu, który go rozwiązuje.

W rezultacie każda złożoność podana w dużym notacji O reprezentuje złożoność zarówno algorytmu, jak i towarzyszącego mu problemu.

Z drugiej strony uzyskanie nietrywialnych dolnych granic złożoności problemu jest często trudne i istnieje niewiele strategii, aby to zrobić.

Aby rozwiązać większość problemów, wszystkie dane wejściowe muszą zostać odczytane, co zajmuje czas proporcjonalny do wielkości danych. W rezultacie takie problemy mają co najmniej liniową złożoność lub, w notacji big omega, złożoność Ω(n).

Niektóre problemy, takie jak te z algebry komputerowej i obliczeniowej geometrii algebraicznej, mają bardzo duże rozwiązania. Ponieważ dane wyjściowe muszą być zapisane, złożoność jest ograniczona przez maksymalny rozmiar danych wyjściowych.

Liczba porównań wymaganych przez algorytm sortowania ma nieliniową dolną granicę Ω(nlogn). W rezultacie najlepsze algorytmy sortowania są najbardziej wydajne, ponieważ ich złożoność wynosi O(nlogn). Fakt, że nie ma n! sposoby organizowania n rzeczy prowadzą do tej dolnej granicy. Ponieważ każde porównanie dzieli ten zbiór n! zamówień na dwie części, liczba N porównań wymaganych do rozróżnienia wszystkich zamówień musi wynosić 2N > n!, co implikuje O(nlogn) według wzoru Stirlinga.

Redukcja problemu do innego problemu jest powszechną strategią uzyskiwania ograniczeń o zmniejszonej złożoności.

Rozwój algorytmu

Ocena złożoności algorytmu jest ważnym elementem procesu projektowania, ponieważ dostarcza użytecznych informacji o wydajności, której można się spodziewać.

Częstym nieporozumieniem jest to, że w wyniku prawa Moore'a, które przewiduje wykładniczy wzrost mocy nowoczesnych komputerów, ocena złożoności algorytmów stanie się mniej istotna. Jest to błędne, ponieważ zwiększona moc pozwala na przetwarzanie ogromnych ilości danych (big data). Na przykład każdy algorytm powinien działać poprawnie w czasie krótszym niż sekundę podczas sortowania alfabetycznie listy kilkuset wpisów, takich jak bibliografia książki. Z drugiej strony, dla miliona wpisów (na przykład numerów telefonów dużego miasta), podstawowe algorytmy wymagające porównań O(n2) musiałyby wykonać bilion porównań, co zajęłoby trzy godziny z prędkością 10 miliony porównań na sekundę. Z drugiej strony sortowanie szybkie i sortowanie przez scalanie wymagają jedynie porównań typu nlogn (jako złożoność przeciętnego przypadku dla pierwszego, jako złożoność najgorszego przypadku dla drugiego). Daje to około 30,000,000 1,000,000 3 porównań dla n = 10 XNUMX XNUMX, co zajęłoby tylko XNUMX sekundy przy XNUMX milionach porównań na sekundę.

W rezultacie ocena złożoności może pozwolić na wyeliminowanie wielu nieefektywnych algorytmów przed wdrożeniem. Można to również wykorzystać do dostrojenia złożonych algorytmów bez konieczności testowania wszystkich możliwych wariantów. Badanie złożoności pozwala skoncentrować wysiłek na zwiększeniu wydajności implementacji poprzez określenie najbardziej kosztownych kroków złożonego algorytmu.

Aby dokładnie zapoznać się z programem certyfikacji, możesz rozwinąć i przeanalizować poniższą tabelę.

EITC/IS/CCTF Computational Complexity Theory Fundamentals Certification Curriculum odwołuje się do ogólnodostępnych materiałów dydaktycznych w formie wideo. Proces uczenia się podzielony jest na etapy (programy -> lekcje -> tematy) obejmujące odpowiednie części programu nauczania. Zapewnione są również nieograniczone konsultacje z ekspertami dziedzinowymi.
Aby uzyskać szczegółowe informacje na temat procedury certyfikacji, sprawdź Wygodna Subskrypcja.

Podstawowe materiały pomocnicze do programu nauczania

S. Arora, B. Barak, Złożoność obliczeniowa: nowoczesne podejście
https://theory.cs.princeton.edu/complexity/book.pdf

Pomocnicze materiały do czytania dla szkół średnich

O. Goldreich, Wprowadzenie do teorii złożoności:
https://www.wisdom.weizmann.ac.il/~oded/cc99.html

Materiały pomocnicze do programu nauczania dotyczące matematyki dyskretnej

J. Aspnes, Uwagi na temat matematyki dyskretnej:
https://www.cs.yale.edu/homes/aspnes/classes/202/notes.pdf

Pomocne materiały do programu nauczania dotyczące teorii grafów

R. Diestel, Teoria grafów:
https://diestel-graph-theory.com/

Pobierz kompletne materiały przygotowawcze do samodzielnego uczenia się w trybie offline dla programu EITC/IS/CCTF Computational Complexity Theory Fundamentals w pliku PDF

Materiały przygotowawcze EITC/IS/CCTF – wersja standardowa

Materiały przygotowawcze EITC/IS/CCTF – wersja rozszerzona z pytaniami kontrolnymi