Minggu, 27 Maret 2011

BAB IV - ANALISIS WEB


NAMA       : ANNISA PARASAYU
NPM          : 55409220
KELAS      : 2IA13
TUGAS SOFTSKILL (PENGANTAR WEB SCIENCE) BAB IV


4.   Analisis WebSimak
Baca secara fonetik


4.1 Web Topologi
4.1.1 Struktur Web
Investigasi Topological merupakan upaya untuk memahami struktur dari dasar unsur-unsur arsitektur dan hubungan antara mereka. Penyelidikan struktur dari web selalu tergantung pada tingkat abstraksi dari deskripsi saja. Struktur pada gilirannya memberikan bukti percakapan apa yang sedang berlangsung melalui web. Oleh karena itu pemahaman struktur adalah penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau ameliorating efek dari perubahan mendadak dalam permintaan informasi. Web adalah demokratis sejauh bahwa tidak ada sentralisasi atau pusat koordinasi yang menghubungkan. Dipahami sebagai struktur hypertext, kegunaannya bergantung sangat besar pada efektif menghubungkan. Setelah rantai link, juga diberikan kurang berisiko oleh Web browser yang berisi tombol 'kembali' yang berlaku memberikan kebalikan dari hyperlink apapun. Topologi web berisi kompleksitas lebih dari rantai linier sederhana.
Pada bagian ini, kita akan membahas upaya untuk mengukur struktur global dari Web, dan bagaimana halaman web individu masuk ke dalam konteks itu.  Sebagai contoh, mungkin itu mungkin untuk pengetahuan peta di theWeb? Seperti peta memungkinkan pemahaman komunitas online, atau untuk terlibat dalam 'membanggakan melacak'. Mengingat peta tersebut, kita dapat membayangkan bercak masalah seperti Slashdot surge (yang memperlambat atau penutupan sebuah website setelah baru dan besar. Populasi pengguna mengikuti link dari sebuah website populer, sebagaimana terjadi dari situs dari majalah online Slashdot) sebelum mereka terjadi - atau setidaknya mampu mengintervensi cukup cepat untuk memulihkan normal atau jasa dapat diterima segera setelah itu. Memang, kita bahkan mungkin menemukan berkat apakah dampak lonjakan Slashdot telah menolak
ekspansi konstan dari Web, seperti yang telah dikatakan baru-baru ini. Awal conceptualisers hubungan meluas antara pengetahuan dan pengetahuan representasi, pencetus yang kuat
standar dan bahasa yang mendasari Web seperti yang kita tahu, banyak profesional saat ini dan tanpa pamrih melakukan negosiasi telaten pada badan standar W3C, atau para penulis konten yang sebenarnya yang kita lihat online) tidak mengontrol struktur makroskopik. Ini
model sangat kuat, tetapi itu tidak berarti bahwa Web telah tentu menjadi halaman yang terhubung.
Metode analisis web melihat pola link ternyata sangat menarik, mencerahkan dan kuat dalam struktur yang mereka temukan. Sebagai contoh, beberapa situs sepertinya harus diambil karena berwibawa dalam beberapa cara - dengan kata lain, banyak situs lain link
ke dalamnya. Situs lain mengandung banyak link keluar yang berwenang seperti indeks situs mengenai topik tertentu dan situs ini bertindak sebagai hub. Hub tersebut juga dapat otoritas, tetapi oleh mereka mungkin ditunjukkan oleh beberapa halaman atau bahkan tidak ada halaman sama sekali.  Ketika metode seperti yang dipelopori oleh Kleinberg, Brin dan Page
mengambil link matriks Web dan menemukan vektor eigen, ternyata bahwa mereka sesuai dengan cluster sekitar konsep tentang halaman. Seperti otoritas-hub struktur sangat penting untuk kami analisis pemahaman dari Web, dan membutuhkan dari link matriks temukan. Memang, niat asli Kleinberg adalah untuk menemukan otoritas, dan online mana-mana dari struktur otoritas-hub lebih kompleks awalnya mengejutkan. Beberapa pihak berwenang pada topik yang sama kasar mungkin menunjuk oleh semua atau sebagian besar hub yang mengkhususkan diri di daerah tersebut. Oleh karena itu bahkan jika berbagai pihak berwenang tidak menunjuk satu sama lain (mungkin karena dari persaingan komersial), mereka semua masih terkait dalam subnetwork yang cukup ketat oleh hub. Struktur tersebut dapat dilihat sebagai mendefinisikan de facto subjek atau topik, seperti yang diciptakan oleh komunitas penulis halaman aktual.
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah grafik teori. Web dapat dilihat sebagai grafik yang node halaman dan yang (diarahkan) tepi adalah link. Karena weblinks sangat sedikit acak, jelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang sama pentingnya. Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimana node yang terhubung. Berbagai makroskopik struktur telah dilihat dan diukur, misalnya satu
merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung, jika link diambil sebagai non-directional, dan bahwa 56m dari halaman ini sangat berhubungan. Implikasi dari penemuan ini masih topologi
perlu dipahami. Terlalu banyak koneksi menghasilkan overhead yang tinggi untuk komunikasi, sementara terlalu sedikit berarti bahwa komunikasi penting mungkin gagal terjadi. Asumsinya bahwa tingkat konektivitas yang cukup konstan pada setiap tingkat skala adalah penting untuk perencanaan jangka panjang dan jangka pendek kapasitas bandwidth,
misalnya. Web berkembang sebagai akibat dari sejumlah dasarnya proses stokastik independen yang berevolusi pada berbagai skala, yang mengapa sifat struktural tetap konstan seperti yang kita perubahan skala. Jika kita berasumsi bahwa Web memiliki semacam ini properti fraktal, maka untuk merancang algoritma yang efisien untuk layanan data di Web pada berbagai skala itu sudah cukup untuk memahami struktur yang muncul dari satu sederhana proses stokastik.
Ada beberapa metrik yang tersedia untuk teori grafik. Langkah-langkah Sentralisasi memberitahu kita bagaimana tersambung sebuah node dibandingkan dengan node lain grafik, dan karena itu dapat membantu memberitahu kita mana yang paling "pusat" node. Jumlah jarak ke node lain (jarak keluar) dan jumlah jarak dari yang lain node (dalam jarak), di normalkan untuk ukuran grafik itu sendiri, dapat menjadi informatif. Sebuah node sentral akan menjadi salah satu yang memiliki relatif total rendah masuk dan keluar jarak, dalam kontras node terkubur jauh dari node pusat kurang mungkin dicapai oleh suatu rantai link. Pengetahuan yang merupakan node pusat, khususnya node yang relatif outcentral (Misal ada banyak link dari yang node ke node lain), adalah suatu langkah penting pertama untuk menavigasi melalui hyperspace. Pusat tersebut node berguna untuk mencapai poin sewenang-wenang dalam grafik. Global metrik melihat penggalian informasi tentang grafik sebagai
keseluruhan. Kekompakan adalah ukuran tentang bagaimana terhubung grafik, sebuah
grafik kompak berarti bahwa, secara umum, adalah mudah untuk mencapai suatu randomlychosen node dari yang lain. Ukuran biasa memiliki jangkauan antara 0 (benar-benar terputus node) dan 1 (sambungan universal). Kekompakan dari 0 jelas harapan untuk ruang informasi, tapi mungkin kurang jelas grafik tidak boleh terlalu kompak baik, jika penulis halaman Web yang hemat dan bijaksana tentang apa yang mereka link ke, mereka link yang lebih mungkin untuk digunakan. Ada juga metode untuk menemukan apakah grafik seimbang atau tidak seimbang, yaitu beberapa bagian grafik kurang baik terhubung dibandingkan dengan orang lain, dan karena itu mungkin hilang informasi. Saldo adalah properti dari sebuah node individu pada grafik, dan dimaksudkan untuk mengekspresikan intuisi bahwa, dalam cukup sumber daya ekspresif Web, link dapat diartikan sebagai lebih lanjut perkembangan ide-ide dalam sumber daya, dan oleh karena itu jika beberapa dari hubungan yang sangat luas dan lainnya agak jarang berhubungan, maka mungkin saja kasus yang menunjukkan mantan sangat baik dikembangkan topik sementara yang kedua dapat ditingkatkan dengan penambahan lebih lanjut link.
Struktur Web adalah hipotesis menjadi grafik dunia kecil, di mana jalur terpendek antara node lebih kecil dari satu mungkin mengharapkan grafik yang ukuran. Bersamaan dengan wawancara pakar, analisis itu digunakan untuk mengungkap pola penggunaan, dan melemparkan cahaya pada pertanyaan apakah struktur Web menciptakan ilmu pengetahuan, demokratis terdesentralisasi mana pemasok berbagai informasi yang digunakan, atau alternatif pemenang-mengambil-semua Web di mana ada pusat informasi yang penting
mendapatkan pasokan diperkuat. Perbedaan topologi yang mengikuti yang signifikan;
misalnya, dengan jaringan dengan distribusi Poisson, maka akan secara eksponensial jarang ditemukan node dengan link substansial lebih dari mean, sedangkan distribusi kuasa hukum menentukan sebuah topologi mana banyak node beberapa link, dan sejumlah kecil tapi signifikan sudah sangat banyak. Dalam jenis grafik yang biasa acak, jumlah rata-rata link per node sangat penting untuk menentukan struktur, karena Distribusi Poisson jumlah link. Bahkan, konektivitas Web tidak seperti itu. Apa yang kita lihat adalah bahwa kebanyakan node terhubung untuk beberapa node lain, tetapi beberapa node (hub) memiliki besar
jumlah koneksi, kadang-kadang dalam jutaan. Tampaknya tidak ada batasan untuk jumlah koneksi yang hub memiliki, dan tidak ada simpul khas yang lain, sehingga dalam pengertian ini adalah skala jaringan bebas. Skala bebas jaringan memiliki beberapa properti diprediksi, meskipun - mereka menolak disengaja kegagalan, tetapi rentan terhadap serangan terkoordinasi di hub. Menariknya jaringan fisik itu sendiri juga merupakan jaringan skala bebas yang mengikuti suatu distribusi kuasa hukum dengan eksponen G = 2,5 untuk
jaringan router dan G = 2,2 untuk peta domain. Selain itu, juga telah melaporkan bahwa probabilitas untuk menemukan situs web yang dibuat dari laman web n lagi didistribusikan menurut kuasa hukum.
Konektivitas dari Web juga terdistorsi oleh clustering, sedangkan  probabilitas dari dua tetangga dari node yang diberikan juga dihubungkan  jauh lebih tinggi daripada acak. Clustering ini menyumbang dengan nilai dari Web sebagai ruang informasi, bahkan acak eksplorasi dari cluster dihubungkan erat-kemungkinan (a) untuk menjaga pengguna dalam cluster halaman Web yang relevan, dan (b) memberikan beberapa baru pengetahuan atau miring menarik pada topik di tangan. Berbagai jenis cluster, atau pola-pola interaksi, dapat menghasilkan menarik yang berbeda subgraphs dengan distribusi potensial yang berbeda. Misalnya, beberapa bagian dari Web ditujukan untuk bekerja kolaboratif, seperti disiplin akademis. Lain terutama dalam mempublikasikan modus, seperti dengan besar media. Yang lain dimaksudkan untuk interaksi pribadi yang bisa sangat dinamis dan kompleks, seperti topik blogging. Pemetaan invariants tidak hanya membawa kita lebih dekat dengan gambaran yang jelas fenomena Web, tetapi juga memungkinkan standar untuk generasi berikutnya dari Web untuk dikembangkan yang melestarikan aspek-aspek penting struktur Web saat memungkinkan untuk pertumbuhan dan peningkatan kegunaan, expressivity dan desiderata lainnya. Sebagai contoh, pemahaman jaringan sifat dari Web akan membantu menyediakan model-model untuk keamanan persyaratan dan kerentanan, kecenderungan untuk kemacetan, maka tingkat demokratisasi itu akan mendukung, atau apa yang akan terjadi jika 'Dua-kecepatan' Web muncul menjadi ada sebagai hasil dari perlakuan istimewa  yang ditawarkan kepada pengguna Web tertentu dan berakhirnya netralitas bersih. Teori graph tradisional cenderung bekerja dengan model ukuran tetap.  Namun, pertumbuhan web tidak hanya menuntut grafik yang dinamis teori, juga membutuhkan model yang menghormati kualitas pertumbuhan itu. Jadi, misalnya, link baru tidak secara acak, lagi dari link lama kemungkinan adalah bahwa link baru akan tersambung ke halaman yang tersambung sendiri sangat sudah (dengan demikian menampilkan konektivitas preferensial).
Model skala-bebas seperti itu adalah contoh sederhana dari jaringan. Secara khusus, asumsi kuasa hukum mungkin terlalu rapi, dan pembagian derajat node, meskipun sangat bervariasi, mungkin tidak cocok dengan kuasa hukum. Struktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda, dalam hal ukuran, konektivitas, koherensi dan mencari properti; beberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan atas struktur kontras, meskipun melihat untuk investigasi Intranet, dan [252] untuk subgraphs sesuai dengan tertentu ilmiah topik.

4.2 Web matematika
L'opez-Ortiz, dalam survei yang berguna, terlihat di sejumlah paradigma
berguna untuk memahami dasar-dasar algoritmik Internet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan, dalam konteks protokol tertentu mendasari Web, berpotensi sangat bermanfaat. Dan konteks yang sangat penting - fungsi (atau sebaliknya) dari algoritma dalam konteks Web menyediakan beberapa bukti yang paling meyakinkan bagi mereka yang ingin berpendapat bahwa itu adalah lingkungan yang penting unik. Pertumbuhan dari theWeb, sebagai L'opez-Ortiz menunjukkan, adalah seperti yang paling canggih teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995, namun berjuang keras pada akhir tahun itu.

4.2.1 Model Rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, matematika diskrit,
pilihan rasional teori dan teori permainan.
Meskipun pengguna individu  mungkin atau mungkin tidak "rasional", itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini, pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkan perilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yang bisa sistem mendukung perilaku tersebut. Web tidak memiliki mekanisme koordinasi pusat, namun menghasilkan sistematis perilaku menarik berkat insentif dan kendala dikenakan baik oleh arsitektur, protokol dan standar, dan mereka interaksi dengan sifat sosial atau psikologis dari pengguna atau desainer (Memang, hal ini bisa dibilang fakta bahwa Web dibangun, dikelola dan digunakan oleh banyak pengguna dunia nyata dengan kepentingan hampir terbayangkan beragam dan preferensi yang yang terpenting untuk aplikasi paradigma / ekonomi teori permainan).
Kunci keberhasilan dari Web terletak pada efek jaringan menghubungkan ke sumber daya, jika yang baik memiliki efek jaringan, kemudian nilai itu meningkat baik untuk pemilik individu pemilik semakin banyak adalah, dan semua hal yang sama dengan lebih kaya set link besarnya penggunaan Penyambungan. Jaringan efek dapat berupa langsung atau tidak langsung. A langsung efek adalah di mana permintaan untuk barang dihubungkan dengan jumlah orang yang memilikinya - telepon dan email menjadi contoh utama. Secara intuitif,
kita dapat melihat bahwa model pasar untuk barang-barang tersebut bermasalah, sebagai
permintaan tampaknya tergantung pada sejumlah keputusan tampaknya tidak berhubungan
(Untuk mengadopsi atau tidak dalam tahap awal), jika 'cukup' orang pergi untuk lebih dini di pasar akan melambung, jika tidak. Tapi bagaimana kita mendefinisikan 'Cukup' di sini? Memasukkan lebih teknis, apa artinya ini adalah bahwa pasar dengan efek jaringan memiliki beberapa kesetimbangan. Karena jumlah pengadopsi (Ukuran jaringan) meningkat, kesediaan marjinal konsumen membayar meningkat karena keuntungan yang lebih besar akan mereka terima dari layanan untuk harga yang diberikan - keuntungan, ditentukan oleh tindakan pihak ketiga daripada kedua pihak transaksi yang sebenarnya, adalah disebut eksternalitas positif. Tapi di luar batas tertentu, keinginan untuk membayar jatuh, sebagai pengadopsi kemudian biasanya mendapatkan kurang dari jaringan. Jadi, misalnya, mempertimbangkan layanan VOIP berlangganan dengan gratis panggilan ke sesama pelanggan. Sejumlah kecil pelanggan umumnya mengurangi nilai pelayanan kepada pengguna potensial, tetapi jika kita asumsikan harga tetap stabil, jika meningkatnya jumlah pengguna, jumlah orang siap untuk membayar harga akan meningkat, dan akan ada saleh lingkaran pertumbuhan. Namun, mereka bergabung nantinya akan mereka yang lebih skeptis tentang nilai layanan - sangat mungkin bahwa mereka tidak terlalu memiliki banyak kebutuhan untuk VOIP. Jadi di beberapa titik maksimum akan tercapai, bahkan ketika jaringan sangat besar, dengan banyak
kemungkinan komunikasi, tidak akan menarik pengguna baru apapun tanpa menurunkan harga. layanan online Banyak struktur jaringan, misalnya untuk jaringan mobile atau poker interaktif atau situs perjudian.
Menafsirkan grafik inWeb istilah ini, 'jaringan ukuran' bisa diberi glos sebagai 'jumlah node dalam webgraph yang' atau 'jumlah link' alternatif. 'Kesediaan untuk membayar' mengacu pada biaya yang pengguna Web adalah siap menyerap. Ini termasuk biaya keuangan rutin seperti menyewa sebuah broadband line, biaya keuangan dimuka seperti pembelian komputer, muka biaya non-keuangan, seperti upaya yang terlibat dalam mendaki kurva belajar yang terkait dengan formalisms tertentu atau aplikasi, dan teratur biaya non-keuangan seperti terus-menerus memastikan bahwa seseorang sistem aman. 'User' itu yang dimaksud juga akan bervariasi: grafik bisa merujuk ke pengguna web biasa (konsumen konten, yang biaya biasanya akan keuangan), tetapi mungkin juga merujuk kepada penulis web (pencipta isi, biaya yang biasanya akan dalam hal waktu dan usaha). Tapi either way, kelanjutan dari efek jaringan yang positif diamati di Web tergantung pada mempertahankan kinerja luar
itu, keseimbangan kedua tidak stabil.
Jaringan efek tidak langsung juga berlaku ke Web. Jaringan tidak langsung efek ditemukan dalam industri seperti DVD - saya beli DVD pemain tidak dipengaruhi oleh siapa lagi yang memiliki satu, tetapi semakin besar jumlah pemilik DVD player, segala sesuatunya sama yang lebih besar dan lebih kaya yang jumlah konten DVD yang tersedia akan (dan memang lebih murah itu akan). Pemodelan efek tidak langsung seperti juga merupakan bagian penting dari memahami bagaimana Web dapat terus berkembang. Bagaimana itu akan mudah untuk menggambarkan Web dalam permainan teori / rasional pilihan kata? Apakah ada perbedaan intrinsik antara, katakanlah, 'biasa' pengguna dan penyedia layanan? Dan lagi, bagaimana kita memahami, pada paradigma ini, pertumbuhan Web dan invariants dari Web pengalaman? Ini adalah kunci untuk pemodelan evolusi pandangan pemain diberikan umpan balik yang mereka terima dari pengalaman. Bagaimana kita menilai tetap titik-titik dalam sistem? Atau membangun kesetimbangan untuk tertentu game setup? Atau mekanisme desain untuk menegakkan "baik" perilaku? Atau model perilaku evolusi kelompok sedemikian sistem skala besar? Mungkin yang paling penting, bagaimana kita melakukan kebalikannya
teori permainan kesetimbangan mengidentifikasi masalah biaya terjangkau dan mekanisme insinyur untuk mencegah mereka datang tentang?
Jawaban untuk pertanyaan-pertanyaan tersebut muncul pada (setidaknya) dua tingkat. Pertama semua, perilaku pengguna dalam hal (netral-dikandung) tuntutan untuk informasi perlu dikoordinasikan dalam kemampuan jaringan fisik arus informasi di sepanjang kabel fisik yang sebenarnya. Koordinasi dan routing informasi perlu terjadi tanpa gesekan, dan teori permainan harus nilai dalam pemodelan tersebut. Dan kedua, menafsirkan perilaku pengguna Web harus sedemikian rupa sehingga potensi penipuan dan bentuk lain dari perilaku mahal diminimalkan. Tidak ada solusi rekayasa untuk masalah kepercayaan, namun di sisi lain mungkin ada cara-cara teknik Web sehingga dapat dipercaya bahwa perilaku bisa adil dihargai tanpa membebankan biaya terlalu banyak pada pengguna atau mengurangi jumlah interaksi sehingga drastis bahwa efek jaringan menguntungkan diminimalkan.

4.2.2 Informasi pengambilan model
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjata antara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar dan lebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu atau kompleksitas dari query). Satu masalah yang jelas berkenaan dengan IR melalui Web adalah bahwa Web tidak memiliki otoritas QA. Siapapun dengan account ISP dapat menempatkan halaman di Web, dan dikenal Web telah menjadi situs proliferasi sebuah teori konspirasi, legenda perkotaan, trivia dan fantasi, serta sebagai penderitaan dari semua gejala informasi unmanaged seperti out-of-date halaman dan duplikasi, semua kesulitan yang berkaitan dengan multimedia representasi, dan semua indeterminacies diperkenalkan oleh  kurangnya ketat terkendala representasi pengetahuan. Memahami persis informasi apa yang tersedia pada halaman yang menunggu untuk diambil tetap menjadi masalah serius. Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuk nugget akal; masalah khas adalah kompleksitas dan kurangnya pola. Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi karya ilmiah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat
digunakan, seperti Intranet, juga ditandai dengan itikad baik dengan
informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IR sistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skala dan kompleksitas informasi, tetapi upaya potensi untuk condong hasilnya dengan konten
dimaksudkan untuk menyesatkan.

4.2.3 Struktur berbasis pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untuk membuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, dan mereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur link subgraphs lokal. Tak usah dikatakan bahwa apa yang mesin pencari sendiri mencari (di metalevel, sehingga untuk berbicara) adalah kombinasi ajaib presisi tinggi dan recall tinggi - meskipun menentukan recall meliputi penentuan, setidaknya sekitar, jumlah yang relevan halaman di seluruh Web secara keseluruhan, yang perlu untuk mengatakan sebuah terutama keras masalah. Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsisten dengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah. Search engine dapat dibandingkan dengan menggunakan berbagai parameter, baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai oleh mesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satu harapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

4.2.4 Matematika metode untuk menggambarkan struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalaman Web dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yang memiliki Web adalah ketahanan dalam menghadapi meruntuhkan pengaruh; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router
dalam empat puluh turun di setiap saat satu.
Barab'asi dan rekan advokat penggunaan teori perkolasi, studi tentang proses dalam ideal acak 2 (atau lebih) media dimensi, untuk melihat topologi kontribusi terhadap toleransi kesalahan. Sebagai contoh telah ditunjukkan bahwa untuk bebas skala jaringan, untuk konektivitas eksponen G <3 (dengan asumsi konektivitas node didistribusikan menurut kuasa hukum), acak menghapus node tidak akan fragmen jaringan menjadi terputus pulau. Sebagaimana telah kita lihat, pada asumsi bahwa Web adalah jaringan skala bebas dengan distribusi power law, eksponen G secara signifikan kurang dari tiga, dan Web harus sangat sulit untuk fragmen (walaupun difokuskan pada menunjukkan ketahanan Internet secara keseluruhan). Para teoritis hasil simulasi komputer kembali empiris menunjukkan bahwa menghapus sampai 80% dari node dari yang besar jaringan skala bebas masih menyisakan cluster dihubungkan kompak. Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas jaringan agak lebih rentan terhadap terarah, serangan terkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika mereka menargetkan situs yang sangat-tersambung pada khususnya; kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acak lain), dan kegagalan dari sejumlah besar situs yang sangat-terhubung dapat menyebabkan fragmentasi.

4.2.5 Matematika metode untuk menggambarkan layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Web akan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klien menghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.  Teori Petri jaring sistem terdistribusi [269, 298] model diskrit, yang Web adalah contoh utama. Teori yang berlaku menambahkan pengertian concurrency dengan ide dari mesin negara, dan telah disarankan sebagai sarana penting model layanan Web [296]. Proses
aljabar, seperti CSP [141] atau CCS [203] juga dapat model paralel pengolahan. Mereka menyediakan sebuah array konstruksi untuk model dinamika pengolahan informasi dan komunikasi output dan meminta input, seperti kebijakan, urutan tindakan, fungsi pilihan, proses dan metode sinkronisasi. Salah satu perkembangan terbaru adalah π-kalkulus (bernama analogi ke λ-kalkulus), yang merupakan pengembangan aljabar proses (khusus suatu cabang CCS) dirancang untuk menyediakan mobilitas dalam pemodelan proses.
The π-kalkulus sengaja minim (mengandung sedikit lebih dari saluran komunikasi, variabel, replikasi dan concurrency), tetapi dapat diperluas dengan mudah untuk mencakup fungsi urutan pertama dan dasar
pemrograman konstruksi. Sebagaimana telah kita lihat ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri dan π-kalkulus, berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual, linier, aljabar proses-event.