NAMA : ANNISA PARASAYU
NPM : 55409220
KELAS : 2IA13
TUGAS SOFTSKILL (PENGANTAR WEB SCIENCE) BAB V
5. Aspek Sosial
Web adalah bagian dari komputasi tertanam dalam pengaturan sosial dan perkembangannya banyak mendapat hak embedding seperti melakukan rekayasa. Pada bagian ini kita akan melihat sosial, kognitif, dan konteks moral dari web.
5.1 Arti, Supervenience, dan landasan simbol
Web sering disebut sebagai seperangkat lapisan sengan standar, bahasa dan protokol yang bertindak sebagai platform baru yang lebih kaya, lebih ekspresif, dan formalis. Platform tersebut seperti TCP / IP. Web Semantic sudah jelas contoh arsitektur berlapis namun unprescriptive. Representasi berlapis tersebut tidak reduktif yaitu bagian atas tingkat tidak hanya singkatan ekspresi di tingkat yang lebih rendah.Secara khusus, semakin dekat dengan puncak ekspresi ditemukan, maka semakin besar kemungkinan untuk memiliki makna. Berarti meskipun bahasa ekspresif perlu memiliki sintaks formal untuk menjadi signifikan masih perlu memetakan ke wacana manusia dalam cara yang dimengerti. Dalam model web semantik, ontologi dimaksudkan untuk melkukan pemetaan dan untuk membuat dialog yang bermakna antara manusia dan mesin. Ontologi sebagai ciptaan buatan, hanya berdiri dalam kebutuhan banyak pemetaan kewcana manusia. Dalam hal ini mereka tidak berbeda dengan struktur formalis lainnya seperti query.
Satu pandangan mengingatkan pada gagasan filosofis supervenience, salah satu wacana atau serangkaian ekspresi A memerlukan perubahan dalam B namun tidak sebaliknya. Jadi pada teori pikiran supervenience, setiap perubahan dalam mental memerlukan beberapa perubahan di bagian otak, namun perubahan di otak tidak perlu mengakibatkan perubahan pada kondisi mental. Supervenience adalah sebuah konsep yang kurang kuat dari pengurangan (teori reduksionis dari pikiran / otak berarti orang bisa menyimpulkan keadaan mental dari negara bagian otak, psikologi bahwa berikut dari neuroscience). Dalam dunia pengolahan mesin dan interoperabilitas data, banyak penggunaan atau wacana adalah secara otomatis oleh komputer. Untuk alasan itu, tidak jelas bahwa definisi dalam kata-kata, atau kode, atau menggunakan cukup spesifik, tidak akan cukup untuk dijabarkan istilah untuk Web Semantic dengan akurasi yang cukup untuk memungkinkan deduksi logis untuk mengambil tempat. Stabilitas dari referen kunci URI, misalnya, bisa memungkinkan banyak otomasi dalam spesifik topik daerah - gagasan ilmu sebagai makna mendasari mengingatkan
dari teori Hilary Putnam. Fakta bahwa Semantic Web bekerja di dunia data relasional, dengan mesin melakukan banyak kerja, berarti bahwa tidak selalu berwewenang untuk menyelesaikan masalah definisi dan logika yang telah terbukti sangat tahan terhadap analisis dalam dunia bahasa alamiah.
5.2 Web Penalaran
5.2.1 Ubah Plus ¸ca ?
Sebagaimana telah kita lihat ada berbagai isu dalam ilmu web dengan akar semantik, filosofis atau logis. Ini bukan pertama kalinya bahwa praktisi paradigma komputasi tiba-tiba harus membiasakan diri dengan Philosophical Logic. Proyek umum AI mencoba untuk menghasilkan umum beradaptasi mesalah pemecah berdasarkan deskripsi simbolik dan penalaran yang kuat dari penelitian AI dan akhirnya kandas pada kesulitan menentukan segala sesuatu yang diperlukan untuk komputer untuk alasan tentang situasi sewenang-wenang. Beberapa berpendapat bahwa GOFAI terhambat oleh kegagalan untuk memecahkan bingkai masalah, kenyataan bahwa dunia nyata penalaran tampaknya sangat berada, dan bahwa setiap deskripsi atau representasi tidak pernah dapat dibatasi untuk berdamai dengan signifikansi lokal - untuk mengerti apa-apa komputer harus mengerti segala sesuatu. Lain mengatakan bahwa AI tidak bisa alasan tentang apa-apa sampai ada hubungan yang solid antara syarat dengan mana suatu alasan komputer dan referen nya, sambungan tidak disediakan oleh program programmer.
Secara khusus, kebutuhan untuk menciptakan ontologi untuk membantu berbagi data dan sebagainya pada telah dilihat sebagai memerlukan konteks teori-bebas dari segala sesuatu. Proyek CYC banyak dikutip, untuk menghasilkan sebuah basis pengetahuan raksasa dan penalaran 'akal sehat' mesin inferensi untuk mendukung [183] tidak tampaknya telah rusak bagian belakang masalah, sedangkan ontologi dihasilkan oleh gerakan ontologi formal filosofis tampak agak rumit. Di sisi lain, klaim bahwa Web, dan SW tertentu, akan memukul masalah yang sama seperti GOFAI harus dilihat dalam konteks berbagi, manipulasi dan interogasi dari relasional data seperti yang disebutkan pada program SW. Data yang sudah dibagi dan digabung dalam sejumlah konteks oleh aplikasi tujuan khusus, yang bersama mendasari ontologi dengan pemetaan yang relevan dan terjemahan. Terjemahan ini tidak perlu bersifat universal, dan tidak perlu bertujuan untuk menghasilkan suatu ontologi yang konsisten secara global. SW generalises semacam ini pendekatan untuk sistem data bersama dengan mengembangkan standar untuk pemetaan antara set data; argumen lebih lanjut diperlukan untuk menetapkan bahwa program ini akan jatuh busuk keberatan standar dan praktis hambatan untuk GOFAI. Tujuan SW adalah untuk menghasilkan ekstensi ke Web yang akan memungkinkan lebih informasi yang akan diproduksi lebih mudah dalam menanggapi pertanyaan. GOFAI bertujuan untuk menghasilkan suatu sistem yang cerdas menunjukkan manusia-tingkat intelijen; SW harus membantu sesuatu yang tingkat kecerdasan manusia (Biasanya seorang manusia) dalam akuisisi penemuan informasi sehari-hari, dan pemrosesan. Ada juga argumen bahwa ontologi tampaknya kurang bermasalah bila dilihat dari perspektif ini. Setidaknya satu komentator telah melihat SW sebagai calon penyelamat dari sistem pakar program penelitian.
5.2.2 Alternatif Cara Penalaran
Salah satu kandidat yang jelas adalah penalaran asosiatif, dimana penalaran atas dasar asosiasi - yang dapat sangat tidak terduga dan personalisasi - mengambil satu menuruni kereta pemikiran. Jadi, misalnya, kasus klasik penalaran asosiatif diberikan dalam novel Proust Remembrance of Things Past, di mana narator setengah baya, setelah makan Madeleine yang telah dicelup dalam teh, menemukan dirinya diangkut ke masa kecilnya di Combray, ketika Bibi eonie L'akan memberinya Madeleine pada hari Minggu pagi. Di Web, potensi penalaran asosiatif sangat besar, mengingat jumlah besar hyperlink asosiatif, dan sifat dunia kecil dari Web. Google-seperti pencarian, berharga meskipun mereka diragukan lagi adalah, tidak bisa seluruh cerita di dunia kecil merasuk perangkat, perangkat lunak agen dan sistem terdistribusi. Namun, asosiatif penalaran melalui hyperlink, meskipun yang menarik dan metode penting, bukan satu-satunya cara untuk pergi tentang itu. Jenis inipenalaran tidak sepenuhnya penalaran asosiatif yang tepat, sebagai asosiasi adalah dari penulis, orang yang menempatkan hyperlink ke dokumen. Dalam adegan Proust, hal ini seperti Marcel mengambil gigitan nya Madeleine dan tiba-tiba dan tak terduga mempersepsikan kenangan tukang roti. Buka hyperlink memungkinkan pembaca untuk menempatkan struktur link lebih dari yang ada halaman Web, menggunakan informasi seperti metadata tentang halaman yang dimaksud, ontologi yang relevan dan model user. Associativity jelas salah satu kekuatan pendorong utama dari Web sebagai toko pengetahuan dan sumber informasi.
Asosiatif penalaran, misalnya, telah digunakan untuk kolaborasi dalam sistem penyaringan rekomendasi. Di Web, potensi penalaran asosiatif sangat besar, mengingat jumlah besar hyperlink asosiatif, dan sifat dunia kecil dari Web. Google-seperti pencarian, berharga meskipun mereka diragukan lagi adalah, tidak bisa seluruh cerita di dunia kecil merasuk perangkat, perangkat lunak agen dan sistem terdistribusi. Namun, asosiatif penalaran melalui hyperlink, meskipun yang menarik dan metode penting, bukan satu-satunya cara untuk pergi tentang itu. Jenis ini penalaran tidak sepenuhnya penalaran asosiatif yang tepat, sebagai asosiasi adalah dari penulis, orang yang menempatkan hyperlink ke dokumen. Dalam adegan Proust, hal ini seperti Marcel mengambil gigitan nya Madeleine dan tiba-tiba dan tak terduga mempersepsikan kenangan tukang roti. Buka hyperlink memungkinkan pembaca untuk menempatkan struktur link lebih dari yang ada halaman Web, menggunakan informasi seperti metadata tentang halaman yang dimaksud, ontologi yang relevan dan model user. Associativity jelas salah satu kekuatan pendorong utama dari Web sebagai toko pengetahuan dan sumber informasi. Asosiatif penalaran, misalnya, telah digunakan untuk kolaborasi dalam sistem penyaringan rekomendasi.
Tipe lain dari penalaran adalah penalaran analogis, sangat lain pasti jenis penalaran bahwa manusia sangat berhasil menggunakan. Penalaran dengan bekerja analogi dengan mengenali karakteristik serupa antara dua subyek, dan kemudian dengan asumsi bahwa mereka subyek memiliki karakteristik lebih banyak kesamaan - khusus bahwa jika subjek A memiliki aset P, maka dengan analogi begitu juga subjek B. Kasus berbasis penalaran (CBR) adalah jenis baik dieksplorasi penalaran analogis. Sketsa suatu pendekatan menggunakan penalaran analogi untuk menghasilkan metadata tentang sumber daya telah muncul baru-baru ini, dan penjelasan berbasis kasus dapat berguna dalam domain mana model kausal yang lemah. Dalam sebuah domain dijelaskan oleh beberapa ontologi, teknik penalaran analogi juga mungkin berguna sebagai penalaran yang bergerak dari satu set deskripsi ontologis terhadap lain, meskipun sama perubahan sudut pandang juga dapat mempersulit hal. Ada telah mencoba menarik untuk mendukung analogis penalaran (yaitu CBR) di seluruh pengetahuan desentralisasi seperti kompleks struktur, dan juga ekstensi untuk XML untuk mengungkapkan kasus berbasis pengetahuan.
5.2.3 Penalaran bawah Inkonsistensi
Web adalah media demokratis. Untuk prinsip Web klasik dari quodlibet ex falso, bahwa pernyataan bersama dan penyangkalan memerlukan setiap proposisi apa pun, jelas terlalu kuat. Kemungkinannya kesalahan (entri data yang tidak benar) tentu saja tinggi. . Kekuatan sosial ini membuat inkonsistensi tak terelakkan di setiap bagian yang layak berukuran dari Web - dan memang sudah didorong banyak strategi penalaran di AI, dimana sistem dirancang dengan harapan memiliki untuk mengatasi dengan basis pengetahuan bertentangan, atau di mana kemungkinan ada yang pernyataan yang benar dalam model pada satu titik mungkin tidak benar lebih lanjut. Strategi-strategi semacam menganggap kesimpulan yang terletak, dan bahwa keinginan untuk menemukan dan mengekspos kontradiksi adalah tergantung pada konteks. Keuntungan utama dari logika klasik adalah bahwa hal itu skala. Maka salah satu solusi untuk masalah ketidaksesuaian adalah untuk mengembangkan strategi untuk menangani dengan kontradiksi karena mereka muncul. Misalnya, sesuatu di theWeb ditegaskan oleh beberapa formula dalam dokumen, tetapi berbeda dokumen tidak perlu dipercaya pada tingkat yang sama. Terkait dengan dokumen akan metadata dari berbagai jenis, yang dapat membantu memutuskan apakah pernyataan dalam satu dokumen harus menimpa penyangkalan tempat lain. Atau, ini merupakan kesempatan aplikasi untuk paraconsistent logika, yang memungkinkan ekspresi inkonsistensi tanpa terkait deduktif free-untuk-semua. Logika Paraconsistent melokalisasi efek ketidakkonsistenan, dan sering memerlukan relevansi semantik proposisi digunakan dalam pengurangan.
Pendekatan lainnya termasuk memiliki nilai kebenaran ganda untuk menyulitkan analisis kontradiksi (dan munculnya kontradiksi mungkin memang sering terjadi karena berbagai faktor kontekstual yang sangat sulit untuk menganalisis dan meresmikan). Dan salah satu dari beberapa jenis logika paraconsistent dengan sejarah implementasi terhormat sebagai serta bersih dan teori semantik bukti dijelaskan logika. Modal logika, yang mungkin treatWeb sumber daya sebagai dunia mungkin dalam inkonsistensi yang buruk, tetapi antara yang diperbolehkan, akan sudut lain, tentu pendekatan ini penting dalam agen masyarakat. Dalam istilah Web Science, isu dari "benar" logika untuk Web akan tergantung pada konteks, tujuan analisis dan sebagainya. Tetapi jelas bahwa pemodelan Web adalah penting untuk beberapa tujuan di mana bukti yang diperlukan tentang apa yang mensyaratkan oleh serangkaian laporan (untuk Misalnya, dalam menemukan apakah informasi telah digunakan dengan benar atau salah.
5.3 Web Epistemologi
Komputer telah merevolusi epistemologi, dan yang paling Web dari semua. Gerakan e-science telah terbukti sangat menarik. Filosofis, metode ilmiah telah terbukti sulit untuk memakukan, tapi ini sebagian karena logis struktur penelitian dan kesimpulan yang pasti dirusak oleh manusia dan sifat kolektif dari proses, yang berarti bahwa sosial proses, proses politik dan heuristik penemuan setidaknya sebagai penting sebagai logika. Selain itu, dengan memungkinkan penjelasan tentang asal dan lainnya isu-isu yang mendasari pengetahuan generasi, Web memungkinkan yang kuat dan dilembagakan apresiasi konteks pengetahuan (apa yang mengasumsikan, metode apa yang menciptakannya, dan akhirnya apa politik dan sosial berakhir pengetahuan dikembangkan untuk melayani). metadata tersebut seringkali penting dalam evaluasi heuristik pengetahuan, dan Web memberikan kesempatan untuk memahami sejarah sepotong pengetahuan, dan kontribusi bahwa sejarah yang membuat untuk kepercayaannya. Salah satu tujuan dari Web adalah untuk memfasilitasi diskusi rasional ide-ide, bukan jenis serangan ad hominem yang membentuk agak terlalu banyak dari apa yang secara longgar disebut perdebatan. Dan kedua, Web memiliki struktur desentralisasi radikal.
5.4 Web Sosiologi
Web adalah cermin untuk masyarakat manusia, dan mencerminkan kepentingan, obsesi dan keharusan eksistensi manusia abad ke-21 diperpanjang selama jangkauan yang sangat luas (mungkin jangkauan terluas dari setiap informasi manusia ruang) nilai, budaya set dan asumsi. Analisis pencarian syarat diketik ke Google mungkin menjadi sumber kunci untuk sejarawan masa depan. Pada bagian ini kita akan melihat hubungan antara Web dan penggunanya, pembaca dan penulis. beberapa orang ingin menggunakan Web untuk berbagi informasi, beberapa untuk liburan dan hiburan, beberapa ingin untuk mengeksploitasi informasi yang didistribusikan di Web untuk melakukan ilmu dengan cara-cara baru yang radikal, yang lain menginginkan arena untuk perdagangan, sementara masih lain ingin membuat dan orang-orang semacam utopia anarkis yang telah terbukti offline begitu sulit dipahami.
5.4.1 Komunitas Kepentingan
Web telah melahirkan sejumlah komunitas menarik dan novel dengan sifat menarik. Sebagai contoh, Massively Multiplayer Online Peran-Playing Game (MMORPG), di mana penerbit menyediakan gigih ruang online di mana permainan berlangsung, telah melahirkan raksasa ekonomi dan kode etik saleh sebagai komunitas yang sangat besar pemain (kadang-kadang urutan juta) menghabiskan semakin besar jumlah waktu online. Pada awal 2001, telah dilaporkan bahwa 84% pengguna Internet di Amerika (90m orang) menggunakan internet untuk tetap berhubungan dengan semacam kelompok; bahwa laporan, oleh proyek penelitian Pew Internet, sangat informatif tentang cara-cara yang Amerika menggunakan Web untuk tetap berhubungan dengan segala macam kelompok kepentingan. Sebuah studi blog politik di pemilihan presiden AS tahun 2004 menunjukkan pola yang menarik karakteristik perilaku politik liberal dan konservatif komentator, kedua belah pihak menemukan item berita yang berbeda signifikan, dan dihubungkan lebih erat ke situs ideologis menyenangkan, meskipun blogger konservatif terkait lebih padat baik satu sama lain dan oposisi liberal. Temuan ini sejalan dengan prediksi hukum Cass sarjana Sunstein tentang perilaku orang dalam sebuah online dunia di mana personalisasi konten yang mungkin dan rutin, meskipun survei terbaru dari para ahli terkemuka menunjukkan bahwa prediksi tersebut tetap kontroversial dan diperdebatkan.
Web dan Internet pada umumnya, mendukung jenis baru interaksi, dan memberikan perspektif abad ke-21 pada beberapa lama yang. survei terbaru telah menemukan peningkatan besar dalam jumlah orang menjual sesuatu online, menggunakan mesin pencari, menggunakan Webcam dan mendengarkan podcast. Web, dan lainnya baru teknologi seperti komputer luas telah memungkinkan konsep-konsep baru ruang untuk mengembangkan dan mendukung metode baru berinteraksi online, atau interaksi baru antara ruang virtual, ruang fisik atau ruang teoritis atau diukur seperti peta dan rencana. Web interaksi yang penting sehubungan dengan masyarakat yang ada di tiga cara: meningkatkan transparansi, memungkinkan komunitas offline untuk tumbuh luar 'alami' mereka batas-batas, dan memungkinkan berbeda, lebih dikodifikasikan, jenis komunikasi antara anggota masyarakat. Dan Web Ilmu kebutuhan tidak hanya analisis efektif interaksi pengguna "di alam bebas" sehingga untuk berbicara; ini harus berjalan seiring dengan perkembangan teori (Baik di tingkat sosiologis dan teknis) tentang apa itu tentang sukses partisipatif teknologi seperti RSS, folksonomi, wiki dan blog, yang umum di seluruh ruang.
5.4.2 Informasi Struktur dan Struktur Sosial
Struktur sosial dari Web tergantung pada struktur rekayasa yang mendasari tingkat. Web adalah refleksi dari kehidupan intelektual dan sosial manusia, tetapi juga secara khusus direkayasa untuk menjadi alat. Secara khusus, struktur theWeb adalah sebuah muka lain yang lebih tradisional struktur data. Semua struktur data berskala besar akhirnya pasti dengan beberapa bentuk kongruensi dengan konteks manusia, misalnya dalam suatu organisasi atau perusahaan. Untuk mendapatkan dari satu bagian hirarki informasi satu sama lain biasanya harus naik sampai node umum untuk setiap subtree tercapai dan kemudian turun yang kedua subtree. Untuk terstruktur, lingkungan terpusat di mana kontrol penting, ini adalah inovasi penting. Inovasi rekayasa dari Web adalah apa yang menciptakan nilai tambah untuk pengguna manusianya. Pengembangan URI memungkinkan cepat dan traversal tidak dibatasi ruang informasi ke segala arah; dari setiap titik dalam satu ruang web bisa mencapai titik lain dengan segera (satu dapat memilih untuk dibatasi oleh link berikut atau output dari pencarian
mesin, tentu saja).
5.4.3 Signifikansi dan metrik
Ada beberapa metode untuk memperbaiki penafsiran berbagai potensi intuisi seperti melalui beberapa matematika keras, yang merupakan cara yang baik untuk mulai memahami sosial dimensi Web. Dan pemahaman pentingnya halaman adalah penting untuk tugas non-sepele halaman pemesanan diambil selama Web pencarian dan pengambilan. Signifikansi dapat didekomposisi menjadi dua jenis metrik: relevansi dan kualitas. Relevansi dihubungkan dengan gagasan query. Satu pendekatan adalah untuk melihat struktur hyperlink yang memberikan konteks untuk halaman web, dan mencoba untuk menyimpulkan ukuran relevansi dari struktur-struktur. Jadi, misalnya, model Boolean sederhana menghitung jumlah query istilah yang muncul dalam dokumen, yang dapat peringkat halaman berdasarkan pada permintaan kata penghubung, atau transformasi dari disjunctions atau negations menjadi konjungsi. Maka itu adalah langkah cukup logis untuk menggunakan rekursif menyebarkan algoritma aktivasi untuk menyebarkan query, dengan mencari permintaan ketentuan dalam dokumen tetangga, mengurangi koefisien signifikansi sebagai sumber daya diuji mendapatkan lebih jauh dari aslinya halaman.
Selain konektivitas hyperlink sederhana, lebih canggih langkah-langkah didasarkan pada model ruang vektor yang dokumen dan query dipandang sebagai vektor. Jadi, misalnya, TFxIDF memberikan relevansi sebuah skor ke dokumen berdasarkan jumlah bobot dari istilah permintaan dinormalisasi dengan panjang vektor Euclidian dokumen; bobot istilah dihitung sebagai produk-salib Term Frekuensi (TF) dan Frekuensi Dokumen Invers (IDF). Sebuah TF adalah ukuran dari frekuensi kemunculan istilah dalam dokumen, sedangkan IDF adalah mengukur jumlah dokumen terkait yang berisi istilah. TFxIDF gagal memperhitungkan informasi penting yang disediakan oleh koneksi hyperlink halaman, tapi bahkan termasuk seperti informasi dalam suatu algoritma yang lebih luas tidak mengungguli TFxIDF oleh jarak besar. Lain mengukur relevansi jelas dalam e-commerce atau e-publishing lingkungan adalah untuk mengukur jumlah download per kunjungi. Pola seperti penggunaan dan akuisisi dapat dipelajari untuk menghasilkan peta atau jejak jalan bahwa pengetahuan sedang ditransfer ke dan digunakan oleh komunitas pengguna. Percobaan di sepanjang garis-garis ini telah menunjukkan bahwa perubahan signifikan sering terjadi sangat tiba-tiba, bersama terkait acara-acara seperti pembuatan link ke sumber daya dari luar situs, atau beberapa diskusi situs oleh komentator eksternal. Struktur hyperlink di mana halaman web menemukan konteksnya juga informatif tentang proxy kualitas. Jika ada link dari satu halaman ke lain, yang dapat dibaca sebagai dukungan dari kertas kedua dengan yang pertama. Itu adalah hipotesis yg dpt dibatalkan yang tergantung untuk sebagian besar pada perilaku orang-orang yang benar-benar menciptakan halaman web – ternyata bahwa sejumlah besar link yang memang mendukung dokumen lainnya untuk beberapa derajat, bahkan jika hanya sebagai alternatif sumber informasi tentang topik yang sama. Ukuran matematika ini tertanam dengan kuat di kontingen sosiologi Web. Selanjutnya, metode tersebut dapat diterapkan ke item multimedia di Web yang tidak mungkin mengandung terutama menarik teks yang untuk mencari, seperti misalnya dengan sistem temu bergambar PicASHOW.
Ada dua teknik utama untuk mengekstraksi informasi yang berkualitas dari struktur hyperlink. metode Co-kutipan berbasis didasarkan pada wawasan yang link ke atau dari halaman cenderung berkonotasi beberapa kesamaan jenis. Jika dua halaman menunjuk ke halaman ketiga, maka dua halaman pertama mungkin berbagi topik yang menarik, jika sebuah poin halaman ke dua halaman lainnya, maka dua terakhir juga dapat berbagi topik. Acak metode berjalan berbasis menggunakan model dari Web sebagai grafik dengan halaman sebagai node dan link sebagai ujungnya diarahkan dan mengembangkan probabilitas statistik berdasarkan random walk sekitarnya. Ukuran kualitas halaman keluar dari metode tersebut dengan mengukur kualitas dari halaman lain terhubung ke, dan penyaringan dengan tingkat koneksi tersebut. Bersama dengan metrik relevansi, metrik kualitas kemudian dapat peringkat hasil pencarian. Yang mengukur kualitas yang paling terkenal adalah PageRank. Wawasan dari PageRank adalah bahwa cara yang jelas untuk menumbangkan model yang mengatur beban halaman dummy untuk mengutip halaman mana yang ingin meningkatkan. Tetapi jika halaman yang dikutip oleh halaman lain yang memiliki sendiri PageRank yang tinggi, maka kemungkinan untuk menjadi berkualitas tinggi. PageRank metode memiliki karakterisasi lain intuitif yang pada pandangan pertama tampaknya untuk tidak ada hubungannya dengan kualitas: ini adalah probabilitas bahwa acak surfer akan mencapai halaman. Nilai dari tindakan ini tercermin dalam keberhasilan Google dalam hal umur panjang, nilai pasar dan saham pasar mesin pencari. Selanjutnya, untuk lain kualitas mengeksploitasi ide random walk, kadang-kadang eksplisit memperluas ide-ide mendasari PageRank.
Ide terkait HITS algoritma Kleinberg, berdasarkan ide faktor dampak dari bibliometrics. Penjelasan asli faktor dampak untuk jurnal akademik adalah bahwa orang bisa melihat jumlah kutipan untuk jurnal dalam konteks disiplin sebagai keseluruhan. Satu kemudian dapat model berat pengaruh jurnal sebagai fungsi bobot pengaruh jurnal mengutip dan fraksi kutipan dari jurnal-jurnal tersebut mengutip yang mengutip jurnal yang bersangkutan. Analog penalaran menetapkan sebuah algoritma untuk mengukur laman web kualitas, baik dari segi nilai otoritas dan nilai hub nya. Pola penggunaan dapat dikarakterisasi secara independen dari langkah-langkah kualitas atau relevansi. Prefetching dapat dilakukan pada nama pengguna, berdasarkan menggunakan profil tertentu nya, atau dengan server berdasarkan statistik tentang pola penggunaan dalam populasi secara keseluruhan. Aplikasi lain dari statistik tersebut adalah pengembangan website adaptif, di mana penyajian materi dan hyperlink intra-situs struktur dapat bervariasi secara otomatis berdasarkan situs belajar dari penggunaan sebelumnya. Variabel yang berhubungan dengan pola penggunaan dapat menggali keluar dari log server yang berisi waktu dan URI mengakses permintaan, bersama dengan model bagaimana tergantung probabilitas masa depan pada penggunaan terakhir.
5.4.4 Kepercayaan dan reputasi
Kami telah melihat kecenderungan bagi otoritas dan hub untuk muncul sebagai fokus cybercommunities. Situs tersebut dengan cara-cara penting terpercaya: kewenangan dipercaya oleh penulis laman web lain untuk mengandung informasi yang dapat dipercaya, sedangkan (Berhasil) hub dipercaya oleh pengguna untuk menunjuk ke tempat-tempat yang dapat diandalkan informasi dapat diperoleh. Kepercayaan adalah, tentu saja, merupakan faktor penting dalam pengembangan Web, dengan berbagai bidang. Web services dipercaya untuk melakukan apa yang mereka katakan mereka akan melakukan tanpa kerusakan kepada orang lain. E-commerce situs yang dipercaya untuk membuat penggunaan yang tepat dari rincian kartu kredit, untuk mengirim barang yang dipesan, dan untuk menjaga data yang aman. Arsitektur dari Web, yang secara eksplisit memfasilitasi anonimitas dan menyalin akurat, membuat kepercayaan sangat penting masalah. Belajar online kepercayaan sangat sulit karena beberapa konteks di mana terjadi interaksi secara online. Sebuah survei terbaru menemukan bahwa penelitian sering gagal untuk membedakan antara kepercayaan, penyebab kepercayaan dan pendahulunya yang dapat dipercaya. Kepercayaan adalah berbagai pasti, 'harapan percaya diri' sebagai 'kesediaan menjadi rentan', 'a sikap positif umum '. Kepercayaan adalah juga bukan statis Fenomena, itu adalah dinamis, sering ada periode waktu di mana kepercayaan sebuah situs dibangun. Pengguna web pada berbagai tingkat pengalaman juga memiliki tingkat kepercayaan yang khas yang berbeda.
Trust tidak akan ajaib muncul online. Sama seperti orang tidak akan otomatis mengikuti kode etik, yang lain tidak akan secara otomatis mengasumsikan bahwa orang mengikuti kode etik. Dan karena kepercayaan adalah tidak hanya pribadi baik tapi satu publik, orang akan selalu dapat 'tumpangan gratis' untuk di 'orang lain baik perilaku. Ada dua tingkat signifikansi sehubungan dengan diundangkan kepercayaan di seluruh Web yang menuntut pendekatan yang berbeda. Pertama ada adalah tingkat sistem secara keseluruhan, dimana seseorang mencoba untuk memverifikasi bahwa peraturan yang mengatur gaya interaksi semua aktor untuk jujur. Strategi utama pada tingkat sistem adalah untuk menyediakan infrastruktur untuk menjamin keamanan, misalnya dengan menggunakan skema sertifikasi atau teknologi privasi-meningkatkan, dan mengambil rute Hobbes untuk menghalangi perilaku tidak bermoral - itu membuat terlalu mahal untuk melakukan, untuk satu alasan atau yang lain. Untuk itu, mekanisme tersebut sangat terkait dengan isu-isu yang harus dilakukan dengan Web Pemerintahan. Kedua, ada tingkat individu, di mana satu harapan bahwa mitra interaktif seseorang atau lawan jujur, reciprocative dan aturan-berikut ini. Di sini cenderung mengandalkan pada umpan balik tentang perilaku; entah bagaimana suatu keuntungan pengguna Web reputasi. Reputasi adalah suatu elemen kunci untuk percaya, karena menyajikan sketsa trustee diabstraksikan (mandiri) dari sejarah. Berdasarkan sejarah sebagai itu, reputasi tidak dan tidak dapat mengikat perilaku masa depan, karena itu tidak menghapus risiko.
Reputasi eBay dan mekanisme umpan balik, dimana peringkat yang mentah +1 atau -1 nilai dijumlahkan bersama dengan penjelasan tekstual, adalah tentu saja contoh terbaik dari mekanisme reputasi terkenal. Nya keandalan terbuka untuk menantang: beberapa pembeli tidak kembali peringkat; bisa dapat terjadi (tergantung pada apakah pengalaman baik atau buruk lebih mungkin dilaporkan); bootstrap reputasi, sebelum seseorang berinteraksi sama sekali, mungkin sulit, salah bisa membayangkan cara memanipulasi proses. Di sisi lain, keberhasilan komersial eBay adalah jelas, dan jumlah aktual dari penipuan di eBay, meskipun beberapa kasus dipublikasikan dengan baik, tampaknya tidak menjadi sangat besar. Isu yang terkait dan kompleks adalah menemukan metrik untuk mengukur kepercayaan untuk peringkat individu dan algoritma untuk agregasi masuk akal. Kebanyakan metrik melibatkan beberapa skor antara +1 dan -1, biasanya yang nyata nomor. Dua masalah yang jelas muncul. Pertama, karena kepercayaan kita / ketidakpercayaan adalah jarang sempurna, Dan kedua, bagaimana harus membedakan antara dua interpretasi yang mungkin. Kadang-kadang metrik kuantitatif tidak pantas. Untuk Misalnya, ketika menilai sumber informasi, itu mungkin bahwa pengguna benar-benar perlu melihat penjelasan dan analisis oleh pengguna lain. Pola penggunaan informasi tentu sulit untuk dihitung, dan selanjutnya mungkin bertentangan atau tidak lengkap, dalam kasus mungkin jadi, dalam kompak, domain dipahami dengan baik paling tidak, semantik markup dokumen mungkin cara paling membantu maju.
Struktur Web telah terbukti sugestif dalam hal ini lapangan, dalam struktur yang sangat Web-seperti yang membuat Anda ke sewenang-wenang halaman web di World Wide Web juga bisa membuat Anda cepat untuk kesaksian seseorang yang Anda tidak tahu di Web Trust. Trust, seperti yang sering ditunjukkan, tidak transitif (yaitu, jika A B percaya dan B trust C, itu tidak berarti bahwa A trust C). Itu tampaknya akan melemahkan Web pendekatan Trust. Namun, jika A trust B, B percaya C dan B merekomendasikan C ke A, maka itu merupakan alasan untuk A percaya C. rantai akan memecah akhirnya, tetapi belum tentu segera, dan mungkin menurunkan anggun. Jadi selama pengertian tentang degradasi dibangun ke generasi ukuran kepercayaan berdasarkan Web pendekatan Trust, maka masih mungkin untuk model atau menghasilkan kepercayaan berdasarkan laporan saksi mata atau pendapat disimpan. Ini telah berpendapat bahwa expressivity dari Web Semantic diperlukan untuk memastikan bahwa agregasi informasi kepercayaan tidak hanya heuristic di alam; itu adalah isi dari atribusi dari kepercayaan atau dinyatakan yang diperhitungkan. Setelah seseorang menerbitkan sebuah file yang mengatakan yang mereka tahu dan berapa banyak mereka percaya mereka, bahwa informasi sosial dapat diproses tanpa perantara.
5.4.5 Trust (II): bukti Mechanising
Telah dikatakan bahwa budaya kita sekarang berurusan dengan dua pengertian tentang bukti. Dalam satu tampilan, seperti Wittgenstein berpendapat, sebuah bukti adalah gambar yang berdiri di membutuhkan ratifikasi, yang akan saat kita bekerja melalui itu; itu meyakinkan kita. Ini menjelaskan dan menunjukkan kebenaran proposisi terbukti secara bersamaan. Jenis lain bukti mekanis dan algoritmik, ini mungkin lebih dapat diandalkan daripada bukti-gambar sebagai-, tetapi untuk dapat diterima memerlukan itu diambil pada kepercayaan bahwa langkah-langkah dalam bukti harus dilakukan dengan benar. Kepercayaan diperlukan (a) karena bukti mungkin unsurveyable, dan (b) bahkan jika tidak tidak efisien atau biaya-efektif untuk memeriksa setiap bukti mekanis dengan tangan. Wittgenstein tidak hidup untuk melihat bukti mekanik kompleks menjadi biasa, tapi ia mencurahkan waktu untuk berpikir tentang implikasi, dalam (pada saat itu tidak biasa) pandangannya matematika sebagai kegiatan, dan berhati-hati untuk membedakan antara bukti-gambar sebagai-dan mekanik bukti. Dia menyimpulkan bahwa keputusan kita untuk percaya mekanis bukti secara sukarela dan bahwa hasil mereka tidak dipaksa kami. Saat ini, lebih banyak aspek kehidupan sehari-hari (keuangan, kesehatan dan keamanan, fungsi utilitas) berada di bawah naungan sistem otomatis. Dan ketika Web mengambil lebih banyak informasi rutin pengguna pengolahan tugas (seperti dengan SW), kebutuhan atas kepercayaan manusia dalam sistem mekanik adalah jauh lebih besar. Banyak kepercayaan yang merupakan fungsi tak terduga dari pengalaman, dan kita tidak dapat meniadakan kebutuhan untuk kepercayaan dalam penilaian manusia kolektif serta mesin sendiri. Hubungan antara kepercayaan dalam diri kolektif kami dan kepercayaan di hardware dan software adalah satu sulit untuk menguraikan, namun pengembangan Web akan tergantung krusial di atasnya.
5.4.6 Web Moralitas dan Aspek Konvensional Menggunakan Web
Moral dan pertanyaan etika adalah bagian penting dari Web Science agenda. Kesederhanaan hubungan antara URI dan khusus Web sumber daya merupakan kunci untuk meningkatkan ruang informasi. Upaya untuk menumbangkan hubungan ini bisa sangat merusak dan Semantic Web. Ancaman terhadap struktur yang akan merusak hubungan antara URI dan apa yang ditampilkan pada layar, dan semakin kompleks bahwa teknik mendapatkan, semakin sulit akan untuk mendeteksi seperti subversi. Web adalah struktur sengaja desentralisasi. Sisi lain dari yaitu bahwa tidak ada otoritas untuk menegakkan perilaku yang baik. Meskipun tentu kasus yang banyak jenis perilaku penting untuk Webuntuk bekerja (artinya, konvensi, komitmen) dapat dipahami dari sudut pandang rasional kepentingan diri, jika kita asumsikan ada hadiah untuk perilaku buruk, baik dari komisi (peluang untuk memperoleh oleh kecurangan) atau kelalaian (kegagalan untuk memelihara sebuah website memuaskan), maka rasionalitas kepentingan sendiri tidak bisa sepenuhnya menjelaskan bagaimana seperti koperasi perilaku mendapat dari tanah. Pentingnya Web Ilmu adalah cara bahwa rekayasa, sambungan antara URI dan apa yang ditampilkan pada layar, tergantung pada khususnya konvensi perilaku yang pada suatu tingkat altruistik. Ada mungkin hal-hal untuk mengatakan tentang sanksi untuk menegakkan perilaku yang baik seperti, tetapi bukan tempat suatu ilmu dari Web untuk bekerja tahu cara memberikan kepemimpinan moral, atau bekerja di luar kadang-kadang sulit konflik yang keinginan untuk bertindak secara moral.
Namun ada peran untuk Web Ilmu untuk menentukan apa praktek-praktek rekayasa yang penting, dan bagaimana mereka berhubungan dengan kesediaan orang untuk berperilaku dengan cara yang kooperatif. Analisis semacam itu dapat menyebabkan kode perilaku yang mungkin tidak berlaku tetapi dalam arti menentukan moral perilaku dalam konteks Web. Moralitas dan putar rekayasa keluar yang akan dihubungkan. Beberapa tekanan disebabkan oleh kesulitan rekayasa asli, tekanan beberapa hanya godaan atau kemalasan. Tapi Web akan berfungsi URI lebih baik jika tidak berubah, jika mereka selalu menunjuk ke dokumen yang sama (Yang tentu saja dapat diperbarui secara berkala). Jumlah kerja link sebenarnya menurun cukup pesat. Sebuah eksperimen yang disebutkan sebelumnya merangkak 150m laman web selama 11 minggu, dan pada minggu ke-9 para peneliti telah kehilangan akses ke lebih dari 10% dari mereka halaman (sekitar 4% telah hilang dalam minggu pertama). Sekitar 3% kembali 4XX kesalahan, kebanyakan dari mereka 404 kesalahan (tidak ditemukan), dan sebagian besar the 403s sisanya (dilarang). Sekitar 3% dari halaman diblokir oleh Web
server 'robots.txt file yang terdeteksi dan ditolak crawler Web. 2 - 3% dari kegagalan adalah jaringan terkait, seperti DNS lookup kegagalan, koneksi ditolak atau timeout TCP, sementara sekitar 2% adalah 3xx kesalahan, menunjukkan halaman telah pindah. Yang bersih dan Domain com tampaknya pelanggar terburuk.
Menghindari URI perubahan ini lebih mudah dikatakan daripada dilakukan. Misalnya, ketika website adalah reorganisasi, godaan adalah untuk menyediakan rapi baru rasional (yang tidak sah) set URI mengekspresikan filosofi organisasi baru. Ini yang menggoda, tetapi akhirnya tidak bijaksana. link menggantung membuat frustasi, dan benar-benar melakukan banyak untuk melemahkan kepercayaan dalam website dan perusahaan (a berfungsi, baik disajikan dan website yang tampak profesional menjadi seorang penting penguat kepercayaan online). Namun, mengingat bahwa semua referensi untuk URI oleh pihak yang berkepentingan adalah 'ketinggalan zaman', dalam bahwa mereka catatan, disimpan dalam daftar orang-orang favorit, menulis di atas kertas atau eksplisit link dari situs lain, penemuan yang dibuat di masa lalu, mereka tidak dapat mudah diperbarui. Hal ini sebagian pertanyaan gaya. [27] mencakup seperangkat saran tentang apa yang tidak termasuk dalam penamaan direktori dan file: nama penulis, subyek, status, hak akses, dll Semua yang kedua bisa tampak
cukup masuk akal sebagai nama file, tapi selama skala waktu dari Web ini dapat mengubah, yang bisa menciptakan tekanan untuk mengubah atau membuat URI nama file menyesatkan (yaitu lebih buruk dari artinya). Ini berarti bahwa URI memproduksi kebutuhan berpikir agak lebih dari satu akan sebaliknya bayangkan, dalam bahwa webmaster perlu memikirkan bagaimana untuk menyajikan suite informasi, dan mengatur itu, sedemikian rupa sehingga masuk akal dalam masa depan - setidaknya dalam jangka menengah. Ini adalah biaya yang nyata, tetapi jika Web berfungsi dengan baik, kebanyakan jika tidak semua webmaster harus mengikuti seperti konvensi.
Ini adalah contoh dari cara moralitas hits rekayasa di Web. Berbeda dengan pembangunan suatu artefak kompleks seperti mesin pesawat terbang atau kapal, 'pekerja' individu di Web belum dicabut keputusan hak melalui kontrak. Di Web, semua orang sukarelawan. Tapi ada adalah kewajiban, tugas yang satu incurs dengan menjadi online karena sifat koperasi dari Web, dan pertemuan kewajiban-kewajiban ini adalah bagian dari tugas menciptakan invariants penting dalam pengalaman Web. Contoh lain, pada tingkat pribadi, adalah menjaga konten up to date dan akurat. Sosial, penting untuk mengidentifikasi dan mencoba, jika mungkin, untuk insinyur keluar berbahaya perilaku (berbahaya baik untuk individu dan ke Web secara keseluruhan) seperti phishing, atau hoaxing PageRank dan lainnya algoritma mesin pencari. Tidak akan ada solusi rekayasa yang benar-benar terhadap perilaku tersebut; itu terjadi dalam konteks Web diberikan, dan mereka yang memanjakan diri di dalamnya akan selalu tergoda untuk bekerja di sekitar setiap arus blok. Tapi kode etik dan jenis lain diskusi tentang Web dapat membuat konsensus tentang apa yang merupakan tugas online dan apa yang merupakan perilaku buruk (konteks adalah penting: mengapa spam suatu zat iritasi yang serius, dan surat sampah relatif kecil?) dan, akibatnya, tentang perilaku apa yang harus disahkan, apa yang diamanatkan, dan apa fungsi terkait arsitektur mungkin diharapkan untuk menyediakan. Online hubungan erat antara teknik dan moralitas tidak biasa jika tidak unik. Keluar fleshing kewajiban ini adalah aspek luar biasa pemahaman kita tentang Web, dan di bagian akhir substantif kami kita melihat beberapa masalah yang menimbulkan lebih terinci.