World Wide Web (WWW)
Pagina principala | Curs | Laborator | Proiect |
Metode de cautare >> |
Notiuni introductive
World Wide Web este unul din cele mai populare servicii de pe Internet, ce ofera
o multime de colectii de documente disponibile pe diverse calculatoare pe tot
globul, numite servere web.
Modul de functionare este foarte simplu din punctul de vedere al utilizatorului: folosind un client web introduce adresa (URL-ul) resursei pe care doreste sa o acceseze. Clientul trimite adresa prin protocolul HTTP la serverul de web de la acea adresa, care intoarce la client resursa (pagina) ceruta. Elementele din figura sunt descrise mai jos:
Server-ul web este un program ce ruleaza pe un calculator conectat permanent la Internet, si care serveste cererile de pagini web primite de la diferitele calculatoare conectate la Internet, cereri trimise prin intermediul navigatorului.
Clientul web (Internet Explorer, Netscape Navigator, Opera, Mozilla, etc.) este browser-ul (navigatorul) care permite accesarea informatiilor pe diferitele servere web din Internet. Acesta permite vizualizarea unei pagini de la o anumita adresa, memoreaza paginile vizitate recente, pentru a fi accesate mai rapid cand utilizatorul cere o pagina deja vizitata (cu butoanele Back si Forward), memorarea anumitor adrese (Bookmark sau Favorites) pentru vizitare ulterioara etc.
Protocoalele in general sunt un set de reguli, comenzi folosite pentru a schimba informatii intre calculatoare. Protocolul HTTP (HyperText Transfer Protocol) este folosit pentru schimbul de fisiere cum ar fi text, imagini, sunet, video intre serverul si clientul web. Cand utilizatorul introduce adresa unei pagini web sau face click pe o legatura hypertext navigatorul trimite o cerere HTTP catre serverul care se afla la adresa respectiva. Serverul primeste cererea si dupa procesarea ei trimite fisierul cerut la clientul care a facut cererea.
URL (Uniform Resource Locator) este adresa unei resurse, unui fisier accesibil pe Internet. Forma generala a URL-lui este:
protocol://nume.de.domeniu/nume_fisier
Tipul resursei depinde de protocolul folosit. Daca protocolul este HTTP (implicit, daca nu se specifica nimic la protocol) atunci aceasta este o pagina web, in limbaj HTML. Daca protocolul este FTP atunci resursa este un fisier oarecare (text, executabil, arhiva zip, imagine etc.) de pe un server ftp. Exemple de URL-ri:
pagina web | http://www.unitbv.ro |
fisier text | http://vega.unitbv.ro/~jipa/coduri.txt |
continutul unui director | ftp://vega.unitbv.ro/pub/win95 |
Un nume de domeniu localizeaza un calculator (host) pe
Internet. De exemplu www.unitbv.ro indica calculatorul numit www
din domeniul unitbv.ro (mai multe detalii despre nume de domenii in cursul
2). Ultima parte din adresa (partea din dreapta) "ro" este
numit nivelul de domeniu superior si indica tara sau in unele cazuri tipul organizatiei
(educational, comercial, militar, etc.).
A doua parte reprezinta nivelul al doilea (unitbv) si indica numele organizatiei,
in general o abreviere a acesteia. In acest caz este perscurtarea de la "Universitatea
Transilvania Brasov", iar www" este un
calculator in acest domeniu. Un nume de domeniu poate fi format si din mai multe
subdomenii, de exemplu www.eeng.dcu.ie.
In fisierul coduri.txt
gasiti semnificatia nivelului superior de domenii.
NOTA: In general numele de domeniu al unei adrese web incepe cu www, dar acest lucru nu este obligatoriu, si nu este intotdeauna asa, cum se vede si in ultimele 2 exemple de mai sus.
Un site web este o colectie de documente web (in format HTML) ce includ o pagina de intrare, de start numita home page. Site-ul web a unei persoane sau a unei firme poate fi accesata prin adresa "home page"-ului. De acolo dupa aceea se poate accesa restul site-ului. De exemplu site-ul web al universitatii este:
Practic "home page"-ul include si un nume de fisier,
care in general este numit index.html sau index.htm (sau index.php,
index.asp si alte cateva variante, dar cele mentionate sunt cele mai
des intalnite), insa acesta nu trebuie specificat in adresa pentru ca serverul
web este setat sa caute implicit unul din aceste nume de fisiere. Deci adresa
siteului corect ar fi http://www.unitbv.ro/index.html, insa nu trebuie
specificata si numele fisierului, pentru ca este incarcat automat de catre serverul
web. Site-ul web se poate afla pe mai multe servere web in diferite locatii
geografice, nu este neaparat localizat pe un singur server web.
Un sinonim mai putin folosit pentru "site web" este "prezenta
web".
Site-urile web pentru firmele sau companiile binecunoscute sunt usor de intuit, cum ar fi:
CNN | www.cnn.com |
FBI | www.fbi.gov |
site-ul oficial al dictionarului Webster | www.webster.com |
Discovery | www.discovery.com |
Informatia de pe Internet poate fi cautata cu ajutorul asa-numitelor servere de cautare (search engines) care sunt de fapt niste baze de date imense in care face cautarea pe baza cuvintelor introduse de utilizator. Cele mai cunoscute motoare de cautare sunt:
AllTheWeb | |
Yahoo | Lycos |
Altavista | Askjeeves |
Looksmart | Excite |
Mamma | MSN Search |
Hotbot | Profusion |
Si mai sunt si altele ca: Search,
Infoseek, Webcrawler,
Metacrawler, Alexa.
La acest
link unde se descriu caracteristicile principalelor motoare de cautare.
Iar la link-ul de mai jos gasiti o lista a altor motoare de cautare:
http://dmoz.org/Computers/Internet/Searching/Search_Engines/
NOTA: De preferat sa nu folositi numai cu un singur motor de cautare! Ceea ce nu gasiti la un motor de cautare poate fi gasit la altul, sau pot fi gasite informatii diferite la alte motoare de cautare.
Metode de cautare >> |