materialyPSR

SYSTEMY ROZPROSZONE

SYSTEMY ROZPROSZONE

1. Procesy i wątki.

1.1 Procesy.

Procesem nazywamy program sekwencyjny, kt�ry jest wykonywany (jest w trakcie wykonywania). Proces jest sekwencją zmian systemu komputerowego, kt�re zachodzą zgodnie z algorytmem zapisanym w programie. Aby zaistniała możliwość wykonywania procesu, niezbędne są dwa urządzenia, tj. procesor, kt�rego zadaniem jest wykonywanie operacji zgodnych z algorytmem oraz pamięć operacyjna, w kt�rej przechowywany jest kod (algorytm) programu. Przykładem procesu skończonego może być np. rozwiązanie r�wnania matematycznego, a zakończenie procesu następuje w chwili uzyskania wyniku (zgodnie z algorytmem). Natomiast przykładem procesu nieskończonego może być system operacyjny, kt�rego podstawową cechą jest praca ciągła i nie może dojść do sytuacji, kiedy nagle system operacyjny przestanie działać i zaprzestanie przyjmowania komend od użytkownika. W przypadku, kiedy jeden proces jest wykonywany przed rozpoczęciem drugiego, m�wimy o procesach wsp�łbieżnych. Doskonałym przykładem jest właśnie system operacyjny, w kt�rym procesy składające się na działanie systemu operacyjnego wykonywane są wsp�łbieżnie z procesami inicjowanymi przez użytkownika. Procesy mogą ze sobą wsp�łpracować lub być niezależne. Aby działanie wielu proces�w możliwe było na maszynie posiadającej jeden procesor, konieczny jest przydział czasu, w jakim może być dany proces wykonywany. Dzieje się tak dlatego, że w danej chwili procesor jest w stanie wykonywać jeden proces. Przydzielanie czasu umożliwia wykonywanie proces�w sekwencyjnie, niejako po kawałku procesu, w ustalonych przedziałach czasu przypadających na dany proces. W ten spos�b możliwa jest praca wieloprocesowa na maszynie jednoprocesowej. Działanie wsp�łbieżne bezpośrednio wiąże się ze wzrostem wydajności. Na stacjach wieloprocesorowych każdy proces wykonywany jest na innym procesorze i jeśli ilość proces�w nie przekracza ilości procesor�w, w�wczas nie ma potrzeby stosowania przydziału czasu.

Stan procesu określa się następująco:

� running - wykorzystywany jest kod procesu, proces jest w trakcie wykonywania

� waiting – oczekiwanie (zablokowanie), proces czeka na wystąpienie ustalonego zdarzenia

� ready – proces czeka na przydział procesora, resztę zasob�w ma przydzielone

W danym momencie tylko jeden proces może być aktywny, natomiast może istnieć wiele proces�w oczekujących lub gotowych. Możliwość wykonywania wsp�łbieżnego proces�w pociąga za sobą konieczność zbudowania jednostki odpowiedzialnej za tworzenie i kończenie proces�w. Proces może utworzyć nowy proces. Jest to możliwe za pomocą funkcji systemowej create. Proces taki nazywa się procesem macierzystym, natomiast proces przez niego utworzony nazywamy procesem potomnym. Proces macierzysty może pracować r�wnocześnie ze swymi procesami potomnymi (kt�re zresztą r�wnież mogą tworzyć swoje procesy potomne) lub oczekiwać na wykonanie wszystkich czynności, kt�re miały wykonać podprocesy i dalej kontynuować działanie. Tworzenie proces�w potomnych wiąże się jednak z koniecznością przydzielania nowych zasob�w, kt�re może otrzymać od systemu operacyjnego lub od procesu macierzystego. Ilość zasob�w jest więc ograniczona. Ponadto ilość proces�w ograniczona zostaje poprzez rozmiar tablicy rozkaz�w. Proces potomny nie może zostać zakończony dop�ki, dop�ty nie wykona wszystkich zaprogramowanych czynności. Następnie proces potomny przekazuje swoje informacje swojemu „przodkowi” poprzez wywołanie funkcji exit. Ten z kolei wywołując funkcję abort powoduje zakończenie procesu potomnego. Istnieją r�wnież inne możliwości zakończenia działania procesu potomnego. Ma to miejsce w przypadku, kiedy podproces nadużył przydzielonych zasob�w, bądź stwierdzono, że jego działanie jest już zbędne. Wsp�łczesne systemy operacyjne zapewniają ponadto automatyczne zakończenie proces�w potomnych, jeśli nie działa już proces macierzysty (zakończenie kaskadowe).

Wspomniany wcześniej proces niezależny charakteryzuje się tym, że wyniki działania innych proces�w nie wpływają w żaden spos�b na jego działanie. W takim przypadku stan procesu nie jest w żaden spos�b wsp�łdzielony z innymi procesami. Wynik działania takiego procesu jest zależny wyłącznie od jego danych początkowych, czyli wielokrotne działanie procesu z identycznymi danymi wejściowymi spowoduje uzyskanie zawsze takich samych danych wynikowych. Ponadto zatrzymywanie i ponowne uruchamianie procesu nie powoduje żadnych zmian.

Proces wsp�łpracujący charakteryzuje się tym, iż może wpływać na działanie innych proces�w, bądź sam jest zależny od innych proces�w. Stan takiego procesu może być wsp�łdzielony i innymi procesami. Nie można przewidzieć wyniku działania takiego procesu, ponieważ jest on zależny od innych proces�w, ponadto nawet przy tych samych danych wejściowych można uzyskać r�żne wyniki (nie można przewidzieć działanie innych proces�w, z kt�rymi dzielone są zasoby).

1.2 Wątki.

Wątek to podstawowa jednostka wykorzystująca procesor (inaczej nazywany lekkim procesem). Wątkami nazywa się takie procesy, kt�re są wykonywane we wsp�lnej przestrzeni adresowej. Jest dynamiczną częścią procesu, kt�ra zawiera licznik rozkaz�w, rejestry oraz stos. Wątki wsp�łdzielą pomiędzy sobą przestrzeń adresową, kod i zasoby systemu operacyjnego. W systemach wieloprocesorowych wątki umożliwiają wykorzystanie przez proces wszystkich procesor�w. Stosowanie wątk�w w programach owocuje zwiększona efektywnością działania a także pozwala na uproszczenie struktury programu. Używanie wątk�w przyśpiesza działanie programu, ponieważ przełączanie pomiędzy wątkami jest szybsze niż pomiędzy procesami wykorzystującymi jeden wątek, co wiąże się z obniżeniem koszt�w.

Wątki charakteryzują się następującymi cechami:

� wykonywane są sekwencyjnie

� każdy wątek posiada własny licznik rozkaz�w i stos

� w systemach jednoprocesorowych podobnie jak procesy dzielą pomiędzy sobą czas przydziału do procesora

� w systemach wieloprocesorowych wykonywane są r�wnolegle (jeden wątek na jednym procesorze)

� podobnie jak procesy mogą tworzyć wątki pochodne

� posiada dostęp do dowolnego adresu w zakresie procesu, więc może pracować na stosie innego wątku

� informacja o stanie wątku zajmuje niewielką ilość pamięci

� wątki mogą znajdować się w jednym z trzech stan�w: zawieszony, wykonywany, zakończony

� wątki nie wsp�łzawodniczą między sobą

1.3 Wątki a zdalne wywoływanie procedur.

Jedną z najpopularniejszych form usługi zdalnej jest wzorzec postępowania określany jako RPC, czyli zdalne wywoływanie procedury. Wywołanie RPC zaprojektowano jako spos�b uog�lnienia mechanizmu wywołania procedury na użytek system�w połączonych siecią. Pod wieloma względami jest ono podobne do mechanizmu komunikacji międzyprocesowej. W przeciwieństwie do komunikacji międzyprocesowej komunikaty wymieniane w trybie RPC mają ściśle określoną budowę i nie są już zwykłymi pakietami danych. Są one adresowane do demona RPC, kt�ry prowadzi nasłuch portu RPC w odległym systemie i zawierają identyfikator funkcji do wykonania, jak r�wnież parametry, kt�re należy jej przekazać. Funkcja taka zostanie następnie wykonana zgodnie z życzeniem, a wszystkie wyniki będą odesłane do zamawiającego w oddzielnym komunikacie. System zazwyczaj posiada tylko jeden adres sieciowy, ale może pod tym adresem udostępniać wiele port�w (port jest numerem umieszczonym na początku pakietu z komunikatem), aby rozr�żniać swoje liczne usługi sieciowe. Jeśli proces zdalny potrzebuje obsługi, to adresuje komunikat do właściwego portu. Mechanizm RPC jest powszechnie stosowany w systemach sieciowych. Jednym z istotnych związanych z nim zagadnień jest semantyka wywołania. Procedura lokalna ulega awarii jedynie w wyjątkowych sytuacjach, natomiast wywołania RPC mogą zawodzić albo być podwajane i wykonywane więcej niż jednokrotnie z powodu typowych niedomagań sieci. Ponieważ często mamy do czynienia z przesyłaniem komunikat�w przez zawodne łącza komunikacyjne, więc z tego powodu łatwiej jest zapewniać w systemie operacyjnym co najwyżej jednokrotne wystąpienie danego komunikatu, niż gwarantować, że komunikat pojawi się dokładnie jeden raz. Inne ważne zagadnienie dotyczy komunikacji między serwerem a klientem. W standardowych wywołaniach procedur dochodzi do wiązań podczas konsolidacji, ładowania lub wykonywania, co powoduje, że nazwa wywołania procedury jest zastępowana przez adres wywołania danej procedury w pamięci.

W systemach rozproszonych r�wnie częste zastosowanie jak zdalne wywołania procedur znajdują wątki. Nadają się one do wysyłania i przyjmowania komunikat�w w spos�b umożliwiający asynchroniczne wykonywanie innych operacji w zadaniu. Ułatwiają one zaprogramowanie i zwiększenie wydajności docelowego procesu, co z kolei pozwala na obsługiwanie zam�wienia od początku do końca w jednym wątku i jednoczesne wykonywanie przez jego sąsiad�w tych samych czynności w odniesieniu do innych zam�wień.

1.4 Szeregowanie proces�w, podstawowe algorytmy szeregowania
i ich własności.

Właściwe przydzielanie procesor�w i decydowanie o kolejności wykonywania proces�w należy do podstawowych zadań systemu operacyjnego. System operacyjny posiada odpowiednie moduły rozwiązujące ten problem. Procesy, kt�rych status jest określony jako gotowy umieszczane są w kolejce. Z reguły to procesy systemowe obsługiwane są niejako „poza kolejnością”, natomiast konkurujące między sobą procesy użytkownik�w obsługiwane zostają zgodnie z pewnymi regułami.

Istnieją trzy podstawowe etapy szeregowania:

� wysoki – określa kolejkę zadań, kt�re chcą skorzystać z zasob�w systemu

� pośredni – obsługa proces�w, kt�re posiadają status gotowy lub zawieszony

� niski – decyduje kt�remu procesowi będącemu w stanie gotowości zostaje przydzielony procesor

Podstawą procesu szeregowania są tzw. kolejki zadań, do kt�rych trafiają zadania lub procesy. Proces po wprowadzeniu do systemu trafia do kolejki zadań. Kolejka zawiera wszystkie procesy oczekujące na przydział pamięci. Jest on następnie w odpowiedni spos�b porządkowana. Kolejka ta związana jest wysokim poziomem szeregowania.
W kolejnym kroku tworzona jest kolejka proces�w gotowych (poziom niski). W tej kolejce zapada decyzja, kt�remu z gotowych proces�w przydzielony zostanie procesor.

Algorytmy szeregowania dzielą się pod względem cech ich działania:

� efektywność – utrzymywanie pełnego obciążenia procesora

� przepustowość – polega na wymuszeniu wykonania jak największej ilości obliczenie w jednostce czasu

� czas oczekiwania – minimalizowanie czasu oczekiwania użytkownika na wyniki działania ich zadań

� czas odpowiedzi – minimalizacja czasu odpowiedzi dla użytkownik�w interakcyjnych

Algorytmy przydziału procesora podzielić można r�wnież na algorytmy z wywłaszczaniem i bez wywłaszczania. Pierwszy z nich charakteryzuje się tym, iż procesor może zostać odebrany procesowi nawet w trakcie jego wykonywania, natomiast w drugim przypadku proces utrzymuje procesor aż do jego zakończenia

Algorytm FCFS (First Come First Served).

Jak wskazuje nazwa obsługuje najpierw te procesy, kt�re zostały w pierwszej kolejności wprowadzone do kolejki. Nie jest dobrym algorytmem, ponieważ w przypadku, kiedy w kolejce znajduje się jakiś duży proces, kt�ry będzie wymagał długiego czasu na jego zrealizowanie, powstanie blokada na czas wykonywania tego procesu, więc inne procesy w kolejce będą musiały długo czekać. Jest nieprzydatny w systemach interakcyjnych z podziałem czasu, natomiast jest często stosowany w systemach, w kt�rych procesy posiadają taki sam priorytet. Jest algorytmem bez wywłaszczania.

Algorytm SJF (Shortest Job First) - szereguje zadania zgodnie z porządkiem określonym przez czasy ich wykonywania - najpierw wykonywane jest zadanie najkr�tsze. Algorytm więc faworyzuje zadania kr�tkie. Udowodniono, że jest to algorytm optymalny ze względu na średni czas przebywania proces�w w systemie. Wadą tego algorytmu jest to, iż zadanie wymagające długiego obsługiwania przez procesor długo czekają na swoje wykonanie.

Algorytmy priorytetowe - każdemu procesowi przydziela się pewien priorytet, po czym procesor przydziela się temu procesowi, kt�rego priorytet jest najwyższy. Procesy o r�wnych priorytetach są porządkowane na og�l według algorytmu FCFS. Priorytety mogą być definiowane w spos�b statyczny lub dynamiczny oraz mogą być przydzielane dynamicznie po to, aby osiągnąć określone cele systemowe, np. jeśli specjalny proces zażąda przydziału procesora, powinien go otrzymać natychmiast. Planowanie priorytetowe może być wywłaszczające lub niewywłaszczające. Podstawowym problemem w planowaniu priorytetowym jest stałe blokowanie (ang. indefinite blocking, starvation, livelock).

Algorytm rotacyjny - procesor jest przydzielany zadaniom kolejno na określony odcinek czasu (kwant). Kwant czasu przydziału procesora jest najczęściej rzędu 10 do 100 msek. Kolejka proces�w gotowych jest traktowana jak kolejka cykliczna - nowe procesy są dołączane na koniec kolejki proces�w gotowych. W przypadku, kiedy proces ma fazę procesora kr�tszą niż przydzielony kwant czasu, to w�wczas z własnej inicjatywy zwalnia procesor. Jeśli faza procesora procesu jest dłuższa niż przydzielony kwant czasu, to nastąpi przerwanie zegarowe i przełączenie kontekstu, a proces przerwany trafia na koniec kolejki. Podstawowym problemem przy konstrukcji algorytmu RR jest określenie długości kwantu czasu. (jeśli kwant czasu jest bardzo mały to algorytm RR nazywa się dzieleniem procesora).

Algorytm wielopoziomowego planowania

Kolejkę proces�w gotowych rozdziela się na kilka kolejek, z reguły w zależności od procesu. Procesy zostają na stałe przydzielone są do tych kolejek. Każda kolejka ma własny alg. planowania. Najczęściej jest to implementowane jako dwie kolejki: procesy pierwszoplanowe (alg. rotacyjny) i drugoplanowe (alg. FCFS). Musi istnieć alg. planowania między kolejkami. Stałopriorytetowe planowanie wywłaszczające: każda kolejka ma bezwzględne pierwszeństwo przed kolejkami o niższych priorytetach tzn., że żaden z proces�w z kolejki o danym priorytecie nie może pracować dop�ki kolejki znajdujące się nad tą kolejką nie są puste. Jeśli podczas wykonywania procesu do systemu zostanie wprowadzony nowy proces o wyższym priorytecie, to aktualnie wykonywany proces zostanie wywłaszczony; Planowanie ze sprzężeniem zwrotnym: pomiędzy kolejki rozdziela się procesy o r�żnych fazach procesora. Jeśli proces używa zbyt dużo czasu procesora, to zostaje przesunięty do kolejki o niższym priorytecie. Proces zbyt długo oczekujący w kolejce i niskim priorytecie może zostać przeniesiony do kolejki o wyższym priorytecie. Rozwiązuje to problem głodzenia proces�w.

1.4 Projekt laboratoryjny - Budowa prostej aplikacji wielowątkowej w języku C.

2. Problem wzajemnego wykluczania.

2.1 Pojęcie sekcji krytycznej, protok�ł wstępny i protok�ł końcowy.

Procesy wsp�łbieżne mogą ze sobą wsp�łzawodniczyć o dostęp do wsp�lnie użytkowanych zasob�w. Chodzi tu o takie zasoby, kt�re w danej chwili mogą być wykorzystywane tylko przez jeden proces (lub ograniczoną ich liczbę, mniejszą od liczby chętnych). Jest to sytuacja dość często spotykana w życiu. Każdemu zdarzyło się, że chciał skorzystać z łazienki właśnie wtedy, gdy była ona zajęta, zadzwonić, gdy ktoś już rozmawiał przez telefon. Skądinąd wiadomo, że w każdej takiej sytuacji trzeba po prostu zaczekać (na zwolnienie łazienki, zakończenie rozmowy). Natomiast wtedy, gdy dwie osoby jednocześnie chcą wejść do pustej łazienki, zadzwonić z tego samego telefonu, trzeba zastosować zasadę uprzejmości i dobrych obyczaj�w. W teorii proces�w wsp�łbieżnych wsp�lny obiekt, z kt�rego może korzystać w spos�b wyłączny wiele proces�w (np. łazienka, telefon) nazywa się zasobem dzielonym, natomiast fragment procesu, w kt�rym korzysta on z obiektu dzielonego (mycie się, telefonowanie), nazywa się sekcją krytyczną tego procesu. Ponieważ w danej chwili z obiektu dzielonego może korzystać tylko jeden proces, wykonując swoją sekcję krytyczną uniemożliwia on wykonanie sekcji krytycznych innym procesom. Problem wzajemnego wykluczania definiuje się następująco: zsynchronizować N proces�w, z kt�rych każdy w nieskończonej pętli na przemian zajmuje się własnymi sprawami i wykonuje sekcję krytyczną, w taki spos�b, aby wykonanie sekcji krytycznych jakichkolwiek dw�ch lub więcej proces�w nie pokrywało się w czasie. Aby ten problem rozwiązać, należy do treści każdego procesu wprowadzić, dodatkowe instrukcje poprzedzające sekcję krytyczną (nazywa się je protokołem wstępnym - przy wejściu do sekcji proces wykonuje protok�ł wejścia w kt�rym sprawdza czy może wejść do sekcji krytycznej.) i instrukcje następujące bezpośrednio po sekcji krytycznej (protok�ł końcowy - po wyjściu z sekcji wykonuje protok�ł wyjścia aby poinformować inne procesy ze opuścił już sekcje krytyczna i inny proces może ja zająć.). Protok�ł wstępny i końcowy to po prostu programowa realizacja czekania i stosowanej w życiu zasady uprzejmości.

2.2 Blokada i zagłodzenie procesu.

Blokada.

Powiemy, że zbi�r proces�w znajduje się w stanie blokady, jeśli każdy z tych proces�w jest wstrzymany w oczekiwaniu na zdarzenie, kt�re może być spowodowane tylko przez jakiś inny proces z tego zbioru. Zjawisko blokady, zwane także zastojem, zakleszczeniem lub martwym punktem, jest przejawem braku bezpieczeństwa programu, jest to bowiem stan niepożądany. Zjawisko to może wystąpić r�wnież w systemie złożonym z proces�w, kt�re są powiązane jedynie przez to, że korzystają z tych samych zasob�w komputera. Zauważmy, że jeśli w jakimś programie wsp�łbieżnym może wystąpić blokada, nie oznacza to, że wystąpi ona przy każdym wykonaniu tego programu. Dlatego testowanie nie jest dobrą metodą stwierdzania, czy dany zbi�r proces�w może się zablokować. Czasami unikanie blokady może być bardzo kosztowne. Jeśli jej wystąpienie jest mało prawdopodobne, lepiej godzić się na nią, ale trzeba uruchomić mechanizmy jej wykrywanie i usuwania.

Zagłodzenie.

Specyficznym przypadkiem nieskończonego wstrzymywania procesu jest zjawisko zagłodzenia zwane także wykluczenie. Jeśli komunikat lub sygnał synchronizacyjny może być odebrany tylko przez jeden z nań proces�w, powstaje problem, kt�ry z proces�w wybrać. Zjawisko zagłodzenia występuje w�wczas, gdy proces nie zostaje wznowiony, mimo że zdarzenie, na kt�re czeka, występuje dowolną liczbę razy. Za każdym razem, gdy proces ten m�głby być wznowiony, jest wybierany jakiś inny czekający proces. Zagłodzenie jest przejawem braku żywotności programu. Zależy ono od strategii wznawiania proces�w. Jeśli procesy będą wznawiane zawsze w kolejności, w jakiej zostały wstrzymane (kolejka prosta), to zjawisko zagłodzenia nie wystąpi. Jeśli jednak o kolejności wznawiania decydują priorytety proces�w (kolejka priorytetowa), to jest możliwe, że procesy o niższym priorytecie zostaną zagłodzone przez procesy o wyższym priorytecie. O ile istnieją algorytmy pozwalające wykrywać zjawisko blokady w trakcie wykonywania programu, o tyle wykrycie zagłodzenia jest praktycznie niemożliwe. Łatwo, co prawda zaobserwować, że pewien proces czeka bardzo długo na jakieś zdarzenie, kt�re wystąpiło już wiele razy, ale nie wiadomo, jak system zachowa się w przyszłości. Można natomiast wykazać, że w programie wsp�łbieżnym jest możliwe zagłodzenie, przez pokazanie nieskończonego ciągu zdarzeń w tym programie, w wyniku kt�rego jeden proces (lub więcej) pozostanie na zawsze wstrzymany.

2.3 Wzajemne wykluczanie dla dw�ch proces�w (N proces�w) – operacje czytaj – zapisz do wsp�lnej pamięci.

Wzajemne wykluczanie - wymaganie aby ciąg operacji na pewnym zasobie (zwykle pamięci) był wykonany w trybie wyłącznym przez tylko jeden z potencjalnie wielu proces�w. Problem wzajemnego wykluczania pojawia się w systemie w momencie gdy istnieje w nim choć jeden zas�b niepodzielny; to znaczy, że zasobu tego może używać w danym czasie tylko jeden proces. Jeżeli inny proces zamawia dany zas�b, to proces ten musi być op�źniany do czasu, aż zas�b zostanie zwolniony. Najszybszym sposobem wymieniania danych pomiędzy procesami jest wsp�łdzielenie przez nie pewnego obszaru pamięci. W ten spos�b dane umieszczone przez nadawcę są natychmiast dostępne dla odbiorcy. Jednak by zapewnić, prawidłowe odczytywanie
i zapisywanie wsp�łdzielonych danych należy wprowadzić mechanizmy, kt�re ograniczą do nich dostęp tak by w jednym momencie operacje na danych wykonywał wyłącznie jeden proces. Jest to jeden z przykład�w problemu wzajemnego wykluczania. Dany jest zbi�r proces�w sekwencyjnych komunikujących się przez wsp�lną pamięć. Każdy z proces�w zawiera sekcję krytyczną , w kt�rej następuje dostęp do wsp�lnej pamięci. Procesy te są procesami cyklicznymi. Zakłada się ponadto:

� zapis i odczyt wsp�lnych danych jest operacją niepodzielną, a pr�ba jednoczesnych zapis�w lub odczyt�w realizowana jest sekwencyjnie w nieznanej kolejności

� sekcje krytyczne nie mają priorytetu

� względne prędkości wykonywania proces�w są nieznane

� proces może zostać zawieszony poza sekcją krytyczna

� procesy realizujące instrukcje poza sekcją krytyczną nie mogą uniemożliwiać innym procesom wejścia do sekcji krytycznej

� procesy powinny uzyskać dostęp do sekcji krytycznej w skończonym czasie

2.4 Projekt laboratoryjny – Algorytm Petersona.

Jest to rozwiązanie programowe pozbawione wad i można je stosować w systemach rozproszonych. Procesy korzystają z dw�ch procedur: wchodzę i wychodzę odnoszących się do sekcji krytycznej. Przed wejściem do sekcji krytycznej proces wywołuje procedurę enter_region z własnym numerem jako parametrem, pokazując w ten spos�b innym procesom, że wsp�łdzielony zas�b jest zajęty. Po wyjściu z sekcji krytycznej proces wywołuje procedurę leave_region z własnym numerem jako parametrem, pokazując w ten spos�b innym procesom, że zas�b jest wolny. Zał�żmy, że proces 0 wywołuje procedurę enter_region i nadaje zmiennej interested wartość true. Proces wskazuje tym samym, że jest zainteresowany wejściem do sekcji krytycznej. Zmienna turn przyjmuje wartość 0 - identyfikator procesu wchodzącego do sekcji krytycznej. Następnie proces wchodzi w pętlę testującą możliwość wejścia do sekcji krytycznej. Testowanie polega na sprawdzeniu, czy konkurencyjny proces nie jest zainteresowany wejściem do sekcji krytycznej. Jeśli nie, to proces 0 wchodzi do sekcji krytycznej. Wychodząc z niej proces wywołuje procedurę leave_region, kt�ra ustawia odpowiadającą procesowi zmienną interested na false.

3. Synchronizacja proces�w i wątk�w.

3.1 Pojęcie sekcji krytycznej.

Sekcja krytyczna (SK) to sekwencja rozkaz�w, kt�rej wykonanie, jeśli zostanie rozpoczęte, musi być doprowadzone do końca zanim inny proces wystąpi z żądaniem dostępu do tego wsp�lnego zasobu. Jeśli jesteśmy w stanie tak zorganizować wykonywanie wielu proces�w, że nigdy jednocześnie nawet dwa nie znajdą się w swoich sekwencjach krytycznych, to jesteśmy w stanie ominąć problem sytuacji hazardowej. Instrukcje sekcji krytycznej muszą być ujęte w jakieś „ogrodzenie” gwarantujące spełnienie warunk�w wzajemnego wykluczania. Ponieważ w danej chwili z obiektu dzielonego może korzystać tylko jeden proces, wykonując swoją sekcję krytyczną uniemożliwia on wykonanie sekcji krytycznych innym procesom.

Mechanizm realizacji sekcji krytycznej powinien spełniać poniższe założenia:

� wewnątrz SK może przebywać tylko jeden proces,

� jakikolwiek proces znajdujący się poza SK, nie może zablokować innego procesu chcącego wejść do SK,

� każdy proces oczekujący na wejście do SK powinien otrzymać prawo dostępu w rozsądnym czasie

3.2 Narzędzia umożliwiające synchronizację proces�w i wątk�w.

Semafory.

Semafor jest zmienną całkowitą, kt�ra z punktu widzenia programisty przyjmuje wartości nieujemne (.0) lub — w przypadku semafor�w binarnych — logiczne. Zmienna semaforowa musi mieć nadaną początkową wartość (oczywiście nieujemną). Po nadaniu początkowej wartości zmiennej semaforowej można na niej wykonywać tylko dwie operacje:

P — opuszczanie semafora (hol. proberen testować)

V — podnoszenie semafora (hol. verhogen zwiększać)

Synchronizacja za pomocą semafor�w polega na blokowaniu procesu w operacji opuszczania semafora, gdy wartość zmiennej semaforowej jest 0 (false w przypadku semafor�w binarnych) do czasu, aż wartość ta zostanie zwiększona.

Rodzaje semafor�w:

� semafory binarne — zmienna semaforowa przyjmuje tylko wartości true (stan podniesienia) lub false (stan opuszczenia).

� semafory og�lne — zmienna semaforowa przyjmuje wartości całkowite nieujemne, a jej bieżąca wartość jest zmniejszana lub zwiększana o 1 w wyniku wykonania odpowiednio operacji opuszczenia lub podniesienia semafora.

� semafory uog�lnione — semafory og�lne, w kt�rych zmienną semaforową można zwiększać lub zmniejszać o dowolną wartość

� semafory dwustronnie ograniczone — zmienna semaforowa ma g�rne ograniczenia po osiągnięciu kt�rego następuje blokowanie procesu r�wnież w operacji podnoszenia.

Wady semafor�w:

� semafor jest wysokopoziomową abstrakcją opartą na niskopoziomowych

mechanizmach elementarnych, kt�re dostarczają niepodzielność i mechanizmy wstrzymywania

� wstrzymywanie i wznawianie wymaga przełączania kontekstu i zmian
w kolejkach modułu szeregowania i kolejkę wątk�w wstrzymanych; operacje na semaforze są powolne

Monitory.

Monitory to konstrukcje zdefiniowane przez programistę w języku wysokiego poziomu służące do synchronizacji proces�w. Z tej konstrukcji nie mogą bezpośrednio korzystać dowolne procesy. Mają one tylko dostęp do swych zmiennych lokalnych i wartości parametr�w formalnych.

� nie wykorzystuje się funkcji systemowych;

� nie wykorzystuje się żadnych zmiennych;

� jest to technika odpowiedniego oprogramowywania proces�w;

� podstawowa wada: większość język�w wysokiego poziomu nie rozpoznaje konstrukcji monitora;

Konstrukcja monitora gwarantuje, że w jego wnętrzu może być aktywny w jednym czasie tylko jeden proces. W związku z tym programista nie musi kodować barier synchronizacyjnych w spos�b jawny. Pozostaje jednak problem synchronizacji wielu monitor�w. Mechanizm ich synchronizacji dostarcza konstrukcja pod nazwą warunek. Mianowicie programista może zdefiniować jedną lub kilka zmiennych tego typu. Jedynymi operacjami kt�re mogą dotyczyć warunku są: wait(x) i signal(x). Operacja x.wait oznacza, że proces ją wywołujący zostaje zawieszony aż do chwili gdy inny proces wykona operację x.signal. Operacja x.signal wznawia jeden z zawieszonych proces�w, a jeśli żaden z proces�w nie jest zawieszony, to operacja ta nie ma żadnych skutk�w.

W implementacji monitor�w konieczne jest posłużenie się wstawkami assemblerowymi i instrukcją TSL lub semaforami aby zagwarantować atomowość operacji wait i signal. Procedury te należy dołączyć do monitor�w w trakcie ich kompilacji.

3.3 Pojęcie zakleszczenia oraz warunki konieczne, aby zjawisko zakleszczenia wystąpiło.

Definicja klasyczna zakleszczenia: (zakleszczenie dotyczy zasob�w nieprzywłaszczalnych). Zakleszczenie jest konfliktem zasobowym, kt�ry może powstać przy rozdziale zasob�w nieprzywłaszczalnych i definiowany jest jako stan rozdziału zasob�w w systemie, w kt�rym dokończenie wykonywania pewnych proces�w jest niemożliwe ze względu na to, że każdy z nich żąda przydział�w zasob�w nieprzywłaszczalnych przydzielonych innemu procesowi.

Definicja uniwersalna zakleszczenia: Zbi�r proces�w znajduje się w stanie zakleszczenia, jeżeli każdy proces z tego zbioru czeka na zdarzenie, kt�re może być spowodowane tylko przez inny proces z tego samego zbioru proces�w - zdarzeniami tymi są najczęściej zwalnianie i przydzielanie zasob�w.

Martwy punkt może wystąpić wtedy i tylko wtedy gdy w systemie wystąpią jednocześnie 4 następujące warunki.

Warunki Coffmana zaistnienia stanu zakleszczenia:

1. Wzajemne wykluczanie (mutual exclusion). W danej chwili czasu jednostka zasobu może być przydzielona tylko do jednego procesu.

2. Przytrzymywanie w stanie zawieszenia (hold and wait). Proces oczekuje na zwolnienie potrzebnych mu jednostek zasob�w, kt�re są przydzielone do innych proces�w. Podczas tego oczekiwania proces nie zwalnia dotychczas przydzielonych mu jednostek zasob�w.

3. Bez wywłaszczenia (no preemption). Jednostka zasobu przydzielona do danego procesu może być zwolniona tylko przez ten proces. Inaczej m�wiąc proces nie może zostać wywłaszczony wbrew swej woli.

4. Cykliczne oczekiwanie (circular wait). Łańcuch proces�w oczekujących wzajemnie na uwolnienie przydzielonych do nich jednostek zasob�w musi się zamknąć, tzn. musi istnieć zbi�r {P₀, P₁, ... , P_n} czekających proces�w takich, że P_o czeka na zas�b przydzielony do P₁, P₁ czeka na zas�b przydzielony do P₂, itd., P_n-1 czeka na zas�b przydzielony do P_n, a P_n czeka na zas�b przydzielony do P₀.

Do opisywania martwego punktu powszechnie stosuje się metodę graf�w. Zakleszczenie może być opisane precyzyjnie z wykorzystaniem pojęcia grafu skierowanego nazywanego w tym przypadku grafem alokacji zasob�w. Graf G = (V,E) składa się ze zbioru wierzchołk�w V i zbioru krawędzi E. Zbi�r wierzchołk�w jest podzielony na dwa typy.

1. P = {P₁, P₂, ... , P_n} oznacza zbi�r wszystkich proces�w wykonywanych aktualnie w systemie.

2. R = {R₁, R₂, ... , R_m} oznacza zbi�r wszystkich typ�w zasob�w występujących w systemie.

Krawędź skierowaną P_i � R_j będziemy nazywać krawędzią żądań. Oznacza ona, że proces P_i żąda przydziału jednostki zasobu typu R_j. Inaczej m�wiąc proces ten aktualnie czeka na przydział tej jednostki. Krawędź skierowaną R_i � P_j będziemy nazywać krawędzią przydziału. Oznacza ona, że pewna jednostka zasobu typu R_i jest przydzielona aktualnie do procesu P_j. Biorąc pod uwagę definicję grafu oraz teorię graf�w można łatwo wykazać, że jeśli graf alokacji zasob�w nie zawiera cykli, to w�wczas żaden proces w systemie nie znajduje się w stanie zakleszczenia. Z drugiej strony, jeśli graf alokacji zasob�w zawiera cykle, to martwy punkt może zaistnieć . Jeśli każdy z typ�w zasob�w zawiera tylko po jednej jednostce danego zasobu, oraz w grafie występują cykle, to oznacza to wystąpienie martwego punktu. Cykl, zgodnie z warunkami Coffmana, jest warunkiem niezbędnym do zaistnienia martwego punktu, natomiast nie jest warunkiem wystarczającym. Jeśli bowiem cykl istnieje, a każdy typ zasobu posiada kilka jednostek, to prawdopodobieństwo wystąpienia martwego punktu gwałtownie spada.

3.4 Projekt laboratoryjny – Problem pięciu filozof�w – rozwiązanie za pomocą semafor�w i monitora. Analiza przypadku 2, 3 i 4 filozof�w.

Problem jedzących filozof�w jest jednym z najbardziej znanych przykład�w nieustającej wsp�łbieżności. Mamy st�ł, wok�ł kt�rego posadzono pięciu filozof�w, kt�rych cykl życia składa się z myślenia i jedzenia. Pośrodku stołu stoi duży talerz z nieograniczona ilością spagetti. W połowie odległości pomiędzy dwoma talerzami leży jeden widelec. I tu powstaje problem, ponieważ żaden filozof nie może jeść spagetti jednym widelcem. Gdy zgłodnieje, podnosi widelec, jeśli jest wolny, następnie podnosi drugi. Jeżeli kt�ryś z widelc�w jest zajęty, filozof czeka. Jedzenie można potraktować, jako rodzaj sekcji krytycznej, gdyż dw�ch sąsiad�w nie może jeść jednocześnie. W przypadku, kiedy pozwolimy filozofom samowolnie podnosić widelce może się zdarzyć, ze wszystkich pięciu podniesie jeden widelec i będą czekać w nieskończoność. Można zdecydować się na inne rozwiązanie każące filozofowi sprawdzać, czy oba widelce są wolne i dopiero w�wczas je podnosić. Może się jednak zdarzyć, że będzie on miął wyjątkowo żarłocznych sąsiad�w jedzących na przemian i dojdzie do zagłodzenia. Rozwiązaniem poprawnym jest zatrudnienie lokaja, kt�ry będzie pilnował, aby przy stole siedziało tylko czterech filozof�w, a pozostały czekał na swoją kolej. Jak kt�ryś z nich skończy, musi opuścić pok�j, aby ponownie ustawić się w kolejce. Dow�d poprawności rozwiązania opiera się na zasadzie szufladkowej Dirichleta: ponieważ mamy czterech filozof�w przy stole, a jest piec widelc�w, to jeden z nich dostanie dwa widelce. Ponieważ proces jedzenia jest skończony, a potem najedzony filozof musi opuścić st�ł, jest gwarancja, że czekający w kolejce także zasiądzie do stołu.

4. Budowa aplikacji klient – serwer wykorzystującej protok�ł TCP.

4.1 Architektura system�w rozproszonych, architektura system�w sieciowych – struktura i własności.

Coraz częściej mamy do czynienia z rozdzielaniem obliczeń między wieloma fizycznymi procesorami. Możemy wyr�żnić dwa podstawowe schematy budowy takich system�w. Pierwszym z nich jest system wieloprocesorowy, czyli ściśle powiązany, w kt�rym procesory dzielą pamięć i zegar, co powoduje, że komunikacja w nim odbywa się najczęściej poprzez pamięć dzieloną. Drugim z nich jest system rozproszony. Jest to system luźno powiązany, w kt�rym procesory nie dzielą pamięci ani zegara - każdy procesor posiada własną pamięć lokalną, a komunikowanie między procesorami odbywa się za pomocą r�żnych sieci komunikacyjnych, takich jak szyny szybkiego przesyłania danych lub linie telefoniczne.

System rozproszony jest to zbi�r luźno powiązanych ze sobą procesor�w połączonych za pomocą sieci komunikacyjnej. Dla danego procesora wchodzącego w skład systemu rozproszonego pozostałe procesy i ich zasoby są zdalne, natomiast jego własne zasoby są lokalne. Procesory w systemie rozproszonym mogą r�żnić się mocą obliczeniową i funkcjami. Mogą znajdować się wśr�d nich małe mikroprocesory, stacje robocze i wielkie systemy komputerowe og�lnego przeznaczenia. Takie procesory określa się za pomocą kilku r�żnych nazw, takich jak stanowiska, węzły, komputery, maszyny, komputery sieciowe lub macierzyste. W momencie kiedy zwracamy uwagę na położenie maszyn, wtedy najczęściej używamy terminu stanowisko, gdy odnosimy się do konkretnego systemu w danym miejscu, używamy zaś nazwy komputer (sieciowy). Pewien proces na jakimś stanowisku, kt�ry nazywamy serwerem, dysponuje zasobem, kt�rego potrzebuje inny proces na innym stanowisku – klient. Zadanie jakie stawiamy przed systemem rozproszonym jest stworzenie wydajnego i wygodnego środowiska umożliwiającego ten spos�b dzielenia zasob�w. Rozproszony system operacyjny powinien umożliwić użytkownikom dostęp do r�żnych zasob�w, nad kt�rymi sprawuje nadz�r. Poprzez zas�b należy rozumieć zar�wno urządzenia sprzętowe, np. drukarki, jak i oprogramowanie – np. pliki, programy, a dostęp do tych zasob�w jest nadzorowany przez system operacyjny. Możemy wyr�żnić dwa zasadnicze, uzupełniające się schematy dostarczania takich usług:

Sieciowe systemy operacyjne - użytkownicy są świadomi ilości maszyn. W celu dostępu do zasob�w są zmuszeni rejestrować się na zdalnych maszynach lub przesyłać dane z odległych maszyn do swoich.

Rozproszone systemy operacyjne - tym systemie użytkownicy nie muszą być świadomi ilości maszyn, a dostęp do zasob�w zdalnych uzyskują oni tak samo jak do zasob�w lokalnych.

Możemy wyr�żnić cztery gł�wne powody, kt�re przemawiają za budową system�w rozproszonych. Należą do nich: dzielenie zasob�w, przyspieszenie obliczeń, niezawodność i komunikacja.

� dzielenie zasob�w – jest to mechanizm pozwalający na wsp�lne korzystanie z plik�w na zdalnych stanowiskach, przetwarzanie informacji w rozproszonych bazach danych, drukowanie plik�w na zdalnych stanowiskach, używanie zdalnych wyspecjalizowanych urządzeń oraz wykonywanie innych operacji (dla przykładu użytkownik stanowiska A może korzystać z drukarki dostępnej tylko na stanowisku B, a w tym samym czasie użytkownik stanowiska B może sięgać po plik rezydujący w A).

� przyspieszanie obliczeń – jeśli jakieś konkretne obliczenie można podzielić na pewną liczbę obliczeń cząstkowych, kt�re mogłyby być wykonywane wsp�łbieżnie, to system rozproszony może umożliwić rozdzielenie obliczeń między r�żne stanowiska w celu ich wsp�łbieżnego wykonywania. Poza tym jeśli jakieś stanowisko jest w danej chwili obciążone zbyt dużą liczbą zadań, to niekt�re z tych zadań mogą zostać przesunięte do mniej obciążonych stanowisk. To przemieszenie zadań nazywamy dzieleniem obciążeń.

� niezawodność – jeśli system składa się z pewnej liczby dużych, autonomicznych instalacji, w�wczas awaria jednego z nich nie ma wpływu na resztę. Jeśli natomiast system składa się z pewnej liczby małych maszyn, z kt�rych każda odpowiada za jakąś ważną funkcje systemu, to pojedyncze uszkodzenie może spowodować zatrzymanie całego systemu. Awaria stanowiska powinna zostać wykryta przez system, przy czym należy liczyć się z podjęciem odpowiednich działań zmierzających do usunięcia jej skutk�w. System powinien wstrzymać korzystanie z usług uszkodzonego stanowiska, a jeśli istnieje taka możliwość to zadanie uszkodzonego stanowiska powinno zostać przejęte przez inne stanowisko.

� komunikacja – w przypadku gdy wiele stanowisk jest połączonych ze sobą za pomocą sieci komunikacyjnej, wtedy użytkownicy rożnych stanowisk mają możliwość wymieniania informacji (na niskim poziomie systemy przekazują między sobą komunikaty). Zaletą systemu rozproszonego jest to, że działania mogą być wykonywane na wielkie odległości, dzięki czemu nad jednym projektem może pracować wiele os�b, przesyłając sobie pliki projektu, dane, czy też wymieniając pocztę.

4.2 Pojęcie protokołu sieciowego, model warstwowy protokołu sieciowego.

Protokoły sieciowe.

Zapewniają usługi łączy dla system�w komunikacyjnych, obsługują adresowanie
i informację routingu, weryfikację błęd�w oraz żądania retransmisji. Obejmują r�wnież procedury dostępu do sieci określone przez wykorzystywany rodzaj sieci (IP, IPX);

Protok�ł jest realizowany przez parę moduł�w programowych zlokalizowaną w komputerach nadawczych i odbiorczych. Na przykład protok�ł transportu służy do przesyłania dowolnej długości komunikat�w od procesu nadawczego do procesu odbiorczego. Proces chcący wysłać wiadomość do innego procesu wywołuje moduł protokołu transportu, przekazując mu komunikat w określonym formacie. Odtąd obowiązek przesłania komunikatu do celu przejmuje na siebie oprogramowanie transportowe, dzieląc ten komunikat na pakiety ustalonego rozmiaru i formatu. zdalne do przesyłania do celu za pomocą protokołu sieciowego czyli innego protokołu niższego poziomu. Odpowiedni protok�ł transportu w komputerze odbiorczym przyjmuje pakiety i wykonuje działania odwrotne w celu odtworzenia komunikatu przed przekazaniem go do procesu odbiorczego.

Model warstwowy protokołu sieciowego.

Programowanie sieciowe ma posiać hierarchii warstw. Każda warstwa jest interfejsem dla warstw leżących ponad nią. rozszerzającym i uog�lniającym pewne właściwości systemu komunikacyjnego będącego jej podłożem. W każdym komputerze przyłączonym do sieci warstwa jest reprezentowana przez moduł oprogramowania. Tak więc każda warstwa dostarcza usług warstwie leżącej ponad nią i rozszerza usługi przez warstwę leżąca, od niej niżej. Na spodzie znajduje się warstwa fizyczna, stanowią ją środki komunikacyjne (kable miedziane lub światłowodowe, łącza satelitarne lub radiowe) oraz odpowiednie układy w każdym komputerze, transmitujące sygnały przez środki komunikacji. Porcje danych są odbierane w miejscu przeznaczenia i przekazywane w g�rę hierarchii moduł�w programowych, ulegając na każdym etapie transformacjom aż przyjmą postać zdatną do przekazania docelowemu procesowi odbiorczemu

4.3 Protok�ł OSI oraz protok�ł TCP/IP.

Protok�ł OSI.

Og�lnie przyjętym modelem sieci jest model warstwowy. Wymienione wyżej funkcje dzieli się na rozłączne podzbiory i powierza poszczeg�lnym warstwom. Najwyższa warstwa jest odpowiedzialna za konwersje protok�ł�w użytkownika lub funkcje zarządzania urządzeniami, najniższa warstwa za sterowanie fizycznym medium transmisji danych. W modelu warstwowym pełny zbi�r funkcji komunikacyjnych zostaje podzielony na podzbiory w taki spos�b, by było możliwe traktowanie każdego podzbioru jako pewnej całości wykonującej autonomiczne zadanie. Wyodrębnione podzbiory funkcji są powiązane ze sobą tak, że tworzą strukturę hierarchiczna w postaci uporządkowanych warstw. Każda warstwa składa się z w obiektach rozproszonych w r�żnych urządzeniach sieci komputerowej. Podstawowa zasada jest to, ze komunikują się ze sobą tylko r�wnorzędne pary obiekt�w jednej warstwy korzystając jedynie z usług transmisji danych oferowanych przez warstwy niższe. Każda warstwa modelu jest opisana przez protok�ł wymiany informacji pomiędzy r�wnorzędnymi obiektami warstwy oraz przez zbi�r usług komunikacyjnych pełnionych dla warstwy znajdującej się bezpośrednio nad nią.

Warstwy OSI.

WARSTWA FIZYCZNA

WARSTWA ŁĄCZA DANYCH

WARSTWA SIECIOWA

WARSTWA TRANSPORTOWA

WARSTWA SESJI

WARSTWA PREZENTACJI

WARSTWA APLIKACJI

Warstwa fizyczna: (physical layer)

Jest odpowiedzialna za transmisję strumienia bit�w między węzłami sieci. Definiuje protokoły opisujące interfejsy fizyczne, to jest ich aspekty: mechaniczny, elektryczny, funkcjonalny i proceduralny. Do funkcji tej warstwy należą: sprzęgniecie z medium transmisji danych, dekodowanie sygnał�w, określanie zakresu amplitudy prądu lub napięcia i określanie parametr�w mechanicznych łącz�wek (kształtu, wymiar�w i liczby styk�w) oraz inne kwestie związane z transmisją bit�w.

Warstwa łącza danych: (data link layer)

Zapewnia niezawodne łącze pomiędzy sąsiednimi węzłami. Nadzoruje przepływ informacji przez łącze i w związku z podatnością warstwy fizycznej na zakł�cenia i wynikające stąd błędy oferuje własne mechanizmy kontroli błęd�w w przesyłanych ramkach lub pakietach (CRC - Cyclic Redundancy Check).

Warstwa sieciowa: (network layer)

Dostarcza środk�w do ustanawiania, utrzymania i rozłączania połączeń sieciowych miedzy systemami otwartymi, w kt�rych rezydują komunikujące się aplikacje, i odpowiada, za obsługę błęd�w komunikacji. Ponadto warstwa sieciowa jest odpowiedzialna za funkcje routingu, kt�ry wyznacza optymalną pod względem liczby połączeń drogę przesyłania pakietu przez sieć.

Warstwa transportowa: (transport layer)

Zapewnia przezroczysty transfer danych między stacjami sesyjnymi, odciąża je od zajmowania się problemami niezawodnego i efektywnego pod względem koszt�w transferu danych. Warstwa ta zapewnia usługi połączeniowe. Wszystkie protokoły w warstwie transportowej są typu “od końca do końca”(end-to-end). Oznacza to, że działają one tylko między końcowymi systemami otwartymi.

Warstwa sesji: (session layer)

Umożliwia aplikacjom organizację dialogu oraz wymianę danych między nimi. Do najważniejszych usług warstwy sesji należą: sterowanie wymianą danych, ustalanie punkt�w synchronizacji danych (dla cel�w retransmisji w wypadku przemijających przekłamań na łączach) oraz umożliwienie odzyskania danych (utraconych w wyniku przerwy w łączności) przez ponowne ich przesłanie.

Warstwa prezentacji: (presentation layer)

Zapewnia możliwość reprezentowania informacji, kt�rą się posługują stacje aplikacyjne podczas komunikacji Zapewnia tłumaczenie danych, definiowanie ich formatu oraz odpowiednią składnię.

Warstwa aplikacji: (application layer)

Dostarcza procesom aplikacyjnym metod dostępu do środowiska OSI, pełni rolę okna między wsp�łdziałającymi procesami aplikacyjnymi.

Protok�ł TCP/IP.

Architektura protokoł�w.

Zestaw protokoł�w został opracowany w celu umożliwienia komunikacji miedzy r�żnymi typami system�w komputerowych, jak r�wnież pomiędzy r�żnymi sieciami. Agencja DARPA oraz Stanford University rozpoczęły pracę nad protokołem TCP
w 1973 r. Badania prowadzone w ciągu pięciu lat doprowadziły do opracowania dw�ch wzajemnie uzupełniających się protokoł�w. Pierwszy z nich TCP jest protokołem połączeniowym, natomiast drugi protok�łem bezpołączeniowy IP (stąd nazwa TCP/IP). Protokoły TCP/IP wykorzystywane są obecnie w systemach UNIX-owych, sieciach lokalnych (LAN) oraz w sieciach rozległych (WAN). Pozwalają r�wnież na łączenie oddzielnych sieci fizycznych w jedną logiczną.

Zalety protokoł�w TCP/IP:

� uniwersalność pod względem specyfikacji system�w komputerowych

� integracja r�żnych rodzaj�w sieci komputerowych

� przydzielenie unikatowego adresu każdej maszynie dzięki wsp�lnemu schematowi adresacji

� standardowe protokoły warstw wyższych

Protok�ł TCP/IP umożliwia realizację wielu usług, oto niekt�re z nich:

� transfer danych (IP, TCP, UDP)

� kontrola poprawności połączeń (ICMP)

� zarządzanie siecią (SNMP)

� zdalne łączenie (TELNET, SSH)

� przesyłanie plik�w (FTP)

Architektura protokołu TCP/IP składa się z czterech warstw ułożonych hierarchicznie

WARSTWA APLIKACJI

WARSTWA TRANSPORTOWA

WARSTWA INTERNET

WARSTWA DOSTĘPU DO SIECI

Dane generowane przez programy aplikacyjne są przekazywane w d�ł stosu, jeśli maja być przesyłane w sieć i w g�rę stosu w przypadku odbioru. Każda warstwa stosu dodaje do danych przekazywanych z warstwy wyższej informacje sterujące w postaci nagł�wk�w (headers). Nagł�wek dodany w warstwie wyższej jest traktowany jako dane w warstwie niższej. Warstwy protokoł�w TCP/IP używają r�żnych nazw do określenia przekazywanych danych. Aplikacje stosujące w warstwie transportowej protok�ł TCP nazywają swoje dane strumieniem. Protok�ł TCP nazywa swoje dane segmentem. Aplikacje wykorzystujące w warstwie transportowej protok�ł UDP określają swoje dane jako wiadomości, a dane protokołu UDP to pakiety. W warstwie Internet protok�ł IP traktuje swoje dane jako bloki zwane inaczej datagramami. W najniższej warstwie bloki danych to ramki lub pakiety w zależności od używanego protokołu.

Warstwa dostępu do sieci.

Najniższą warstwą w hierarchii architektury TCP/IP jest warstwa dostępu do sieci. W warstwie tej do datagram�w IP dodaje się nagł�wki oraz zakończenie i w ten spos�b otrzymuje się ramki przesyłane w sieci. Funkcje tej warstwy odpowiadają w przybliżeniu funkcjom trzech najniższych warstw modelu ISO/OSI. Do komunikacji w sieciach rozległych lub przez łącza szeregowe mogą byś stosowane takie protokoły jak X25, PPP lub SLIP. Te dwa ostatnie protokoły zostały opracowane specjalnie do przesyłania datagram�w pomiędzy dwoma punktami łączem szeregowym. W sieciach rozległych stosuje się protokołu PPP, natomiast protok�ł SLIP używa się do prostego połączenia dw�ch komputer�w łączem szeregowym.

Warstwa Internet.

Zasadniczym protokołem w tej warstwie jest protok�ł IP. Odpowiedzialny jest on za przesyłanie pakiet�w zwanych datagramami, pomiędzy użytkownikami sieci. Jest to protok�ł bezpołączeniowy, co oznacza, że datagramy są przesyłane przez się bez kontroli poprawności i dostarczenia. W tym przypadku może dojść do sytuacji, kiedy
datagram może ulec przekłamaniu lub zostanie zagubiony w sieci. Dlatego protok�ł IP przeznaczony jest do używania w sieciach bardzo dobrej jakości i niezawodnych łączach transmisyjnych. Drugim protokołem tej warstwy jest ICMP, związany ściśle
z IP. Zadaniem jego jest informowanie o nieprawidłowościach w pracy sieci. Pozwala na przesyłanie komunikat�w sterujących między węzłami sieci, kt�re umożliwiają sterowanie przepływem, testowanie urządzeń, wskazywanie alternatywnych połączeń także wykrywanie niedostępnych użytkownik�w.

Warstwa transportowa.

Zapewnia bezpośrednie połączenie między końcowymi użytkownikami (systemami) wymieniającymi informacje. Do najważniejszych protokoł�w w tej warstwie zalicza się protok�ł TCP oraz UDP. Protok�ł TCP jest typu połączeniowego, umożliwia wykrywanie błęd�w na obu końcach połączenia. Ma on możliwość ustanowienia i utrzymania połączenia wirtualnego między dwoma użytkownikami w celu przesyłania danych, sterowania przepływem, przesyłania potwierdzeń oraz kontroli i korekcji błęd�w (CRC). Protok�ł UDP jest protokołem bezpołączeniowym, nie posiada mechanizm�w korekcyjnych. Segmenty TCP oraz pakiety UDP w celu dalszego przesłania umieszczane są wewnątrz datagramu IP.

Warstwa aplikacji.

Warstwa ta zawiera procesy wykorzystujące protokoły TCP lub UDP. Protokoły tej warstwy dostarczają użytkownikom r�żnych usług. Do najbardziej znanych i rozpowszechnionych aplikacji korzystających z TCP należą:

� TELNET, SSH – dla usług terminalowych, pozwalają na rozpoczęcie sesji poprzez sieć

� TFTP – dla prostych usług transferu plik�w (uproszczona wersja FTP)

� FTP – umożliwia interakcyjne przesyłanie plik�w

� SMTP – poczta elektroniczna, działa na zasadzie „zapamiętaj i prześlij” między systemami poczty korzystającymi z serwer�w pocztowych

Do bardziej znanych usług protokołu UDP należą:

� DNS – serwery przechowujące dane o domenach i przypadających im adresach sieciowych

� RIP – służy do wymiany informacji związanych z aktualizacją reguły doboru tras w węzłach sieci

� NFS – umożliwia wsp�łdzielenie plik�w przez wiele komputer�w dołączonych do sieci, jest to rozproszony system plik�w działających według modelu „klient – serwer”

Protokoły TCP/IP wyr�żniają dwa typy urządzeń sieciowych: routery (lub gatewaye) oraz hosty (komputery). Routery służą do przesyłania pakiet�w między sieciami a na hostach instalowane jest oprogramowanie aplikacyjne dla użytkownik�w

4.4 Komunikacja strumieniowa oraz komunikacja datagramowa – własności.

Możliwe są dwa rodzaje usług transportu danych:

� połączeniowe, w kt�rych między procesem nadawczym a odbiorczym tworzy się „połączenie wirtualne" i używa się go do przesyłania strumienia (ang. Stream) danych;

� bezpołączeniowe w kt�rym do określonych miejsc przeznaczenia przesyła się indywidualne komunikaty- nazywane datagramami (ang. Datagrames)

Komunikacja datagramowa

Datagramy przesyłane za pomocą usług bezpołączeniowych są podobne do pakiet�w. Są one adresowane do proces�w, natomiast pakiety przesyłane przez warstwę sieci są adresowane tylko do komputer�w macierzystych. Usługi bezpołączeniowe mogą być zawodne, toteż wykrywanie strat lub złego porządku datagram�w oraz podejmowanie działań naprawczych należy do oprogramowania warstwy zastosowań.

Komunikacja strumieniowa

Komunikacja w trybie połączeniowym jest przydatna do wdrażania usług wymagających przesyłania strumieni danych o nieograniczonej wielkości, takich jak zdalne sesje konwersacyjne lub transmisje wielkich plik�w. Usługi bezpołączeniowe są prostsze i wymagają mniej zachodu. Stosuje się je często do realizacji komunikacji klient-serwer w systemach rozproszonych zbudowanych z sieci lokalnych, ponieważ ustanowienie połączenia jest dość pracochłonne,

u konwersacja między klientem a serwerem może się sprowadzać do wymiany zaledwie pary komunikat�w.

4.5 Pojęcie portu, pojęcie pary gniazdowej.

Każda aplikacja korzystająca z protokoł�w TCP/IP jest identyfikowana za pomocą numeru portu. Z kolei protokoły transportowe są określone za pomocą numer�w protokoł�w. Pozwala to łączyć dane generowane przez r�żne aplikacje z kilkoma protokołami transportowymi i z kolei te protokoły z protokołem IP. Takie podejście daje możliwość multipleksacji danych, czyli np. umożliwia r�wnoczesną komunikację wielu aplikacji z TCP. W Internecie niekt�re numery port�w są zarezerwowane i wstępnie przypisane do tzw. dobrze znanych usług (przyjmują numery 0 – 255). Zaliczyć można do nich takie protokoły sieciowe jak FTP, TELNET, SSH, HTTP, STMP.

Gniazdo to kombinacja adresu IP i numeru portu. W związki z tym gniazdo jednoznacznie określa proces w Internecie. Gniazdo to r�wnież zakończenie logicznego łącza komunikacyjnego pomiędzy dwoma aplikacjami. Jeśli aplikacje realizowane są na dw�ch komputerach, to para odpowiadających im gniazd definiuje połączenie w protokole połączeniowym TCP.

4.6 Mechanizm ustanowienia połączenia – uzgadnianie tr�jfazowe.

� ustanawianie połączenia TCP przebiega według poniższego scenariusza.

� serwer musi być przygotowany na przyjęcie nadchodzącego połączenia. W tym celu zazwyczaj wywołuje funkcje: socket, bind i listen Nazywa się to otwarciem biernym (ang- passive open) połączenia.

� klient rozpoczyna otwarcie aktywne (ang. active open) połączenia, wywołując funkcję connect. To powoduje, że oprogramowanie TCP klienta wysyła segment danych SYN (nazwa tego segmentu pochodzi od słowa ang- synchronize), zawierający początkowy numer kolejny danych, kt�re ten klient będzie przesyłać przez to połączenie. Zazwyczaj w tym segmencie SYN nie przesyła się danych; zawiera on tylko nagł�wek IP, nagł�wek TCP i ewentualne opcje TCP

� serwer musi potwierdzić przyjęcie segmentu SYN od klienta i wysłać własny segment SYN, zawierający początkowy numer kolejnych danych, kt�re serwer będzie wysyłać przez to połączenie. Serwer wysyła w jednym segmencie SYN r�wnież potwierdzenie ACK (ang. acknowledgrnent).

� klient musi potwierdzić przyjęcie segmentu SYN od serwera.

4.7 Mechanizm zakończenia połączenia.

Podczas gdy do ustanowienia połączenia potrzeba trzech segment�w, to czterech segment�w używa się do jego zakończenia.

� jeden program użytkowy najpierw wywołuje funkcję close; m�wimy w�wczas, że ten punkt końcowy połączenia wykonuje zamknięcie aktywne (ang. active close).

� oprogramowanie TCP po tej stronie połączenia wysyła segment danych FIN (ang. finish), oznaczający zakończenie wysyłania danych.

� drugi punkt końcowy połączenia, kt�ry odbiera segment FIN, wykonuje zamknięcie bierne (ang. passive close). Oprogramowanie TCP potwierdza przyjęcie segmentu FIN. Informacja o otrzymaniu segmentu FIN jest r�wnież przesyłana do programu użytkowego jako znacznik końca pliku (po wszystkich danych, kt�re mogą już oczekiwać w kolejce na pobranie przez program użytkowy), ponieważ odebranie segmentu FIN oznacza, że ten program użytkowy już nie otrzyma żadnych dodatkowych danych poprzez to połączenie.

� po pewnym czasie ten drugi program użytkowy, kt�ry odebrał znacznik końca pliku, wywołuje funkcję close, aby zamknąć swoje gniazdo. To powoduje/ że jego warstwa TCP wysyła segment FIN.

� oprogramowanie TCP w tym systemie, kt�ry odebrał ten ostatni segment FIN (w tym punkcie końcowym połączenia, kt�ry wykonuje zamknięcie aktywne), potwierdza przyjęcie segmentu FIN.

4.8 Architektura programu klienta i serwera funkcjonujących w oparciu o protok�ł TCP.

4.9 Budowa serwera iteracyjnego.

4.10 Budowa serwera wsp�łbieżnego opartego na:

� Procesach

� Watkach

4.11 Funkcje w języku C: socket, connect, accept, listen, bind, close, read, write.

socket - Funkcja socket tworzy internetowe gniazdo strumieniowe (SOCK_STREAM), czyli gniazdo obsługiwane przez warstwę TCP. Funkcja ta przekazuje małą liczbę całkowita, kt�ra służy jako deskryptor identyfikujący to gniazdo we wszystkich następnych wywołaniach funkcji systemowych (np. funkcji connect oraz read).

Connect - Stosując funkcję connect do gniazda TCP, powodujemy ustanowienie połączeniaTCP z serwerem określonym przez gniazdową strukturę adresową, wskazywaną poprzez drugi argument wywołanej funkcji. Musimy r�wnież jako trzeci argument tej funkcji określić rozmiar gniazdowej struktury adresowej; pozwalamy zawsze kompilatorowi obliczyć rozmiar struktury dla adres�w gniazd internetowych, używając w tym celu operatora sizeof w języku C.

accept - Zazwyczaj funkcja accept powoduje, że proces serwera popada w stan uśpienia

w oczekiwaniu na nadejście i zaakceptowanie połączenia z klientem. W celu ustanowienia połączenia obsługiwanego zgodnie z protokołem TCP stosuje się tzw. uzgodnienie tr�jfazowe po czym następuje powr�t z funkcji accept.

Wartością przekazywaną przez tę funkcję jest nowy deskryptor, cockfd, zwany deskryptorem gniazda połączonego ,kt�ry służy do komunikowania się z nowym klientem, Funkcja accept przekazuje nowy deskryptor odpowiadający każdemu klientowi, kt�ry łączy się z naszym serwerem.

listen - Wywołując funkcję listen, przekształcamy gniazdo w gniazdo nasłuchujące,

w kt�rym przychodzące od klient�w połączenia będą akceptowane przez jądro systemu.

bind - funkcja nadaje nazwę gniazdka, gdyż aby inny proces m�gł zaadresować gniazdko musi ono mieć nazwę.

write - funkcje do czytania i przesyłania.

close - zakończenie połączenia. Serwer zamyka połączenie z klientem, wywołując funkcję close. Rozpoczyna to zwykłą sekwencję kończąca połączenie zgodnie z protokołem TCP: w każdym kierunku jest wysyłany segment FIN, a przyjęcie każdego segmentu FIN jest potwierdzane na drugim końcu połączenia.

read – funkcja służy do pobierania danych z gniazda TCP. Musimy zawsze wywołanie funkcji read umieścić w pętli., kt�rej wykonywanie zakończy się wtedy, kiedy funkcja read przekaże albo 0 (oznaczające zakończenie połączenia), albo liczbę ujemna (wskazującą na wystąpienie błędu).

4.12 Projekt laboratoryjny – Aplikacja klient – serwer w języku C.

Bibliografia:

1. Zbigniew Weiss , Tadeusz Gruźlewski - „Programowanie Wsp�łbieżne i Rozproszone” Wydawnictwo Naukowo – Techniczne – 1.1, 1,2, 3

2. http://www.astagor.net/putinf/data/SysOper/ - 1.4, 4

3. http://www.algorytm.cad.pl/Algorithms/51-60/algorithm55.html - 2.4

4. http://www.kik.pcz.czest.pl/so/mainpage/subject20/index20.htm - 1.3, 4.1

5. www.ia.pw.edu.pl/~tkruk/edu/sop2a/w5.doc – 2.1, 2.2, 2.3

6. Jędrzej Ulasiewicz - „Programownie aplikacji wsp�łbieżnych”

7. Janina Mincer – „Systemy operacyjne”