Sunday, 19 June 2016

Identity & Reference

 

2 Referensi & Identitas


Semantic Web mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau yang lain. Masalah dengan label di Web adalah bahwa setiap Sistem pada dasarnya desentralisasi dan tidak diawasi, sesuai dengan prinsip-prinsip yang mengatur Web, tetapi kurangnya sentralisasi memungkinkan skema different dan Konvensi, dan memang kecerobohan, untuk berkembang yang pada gilirannya membuka kemungkinan kegagalan referensi yang unik.


2.1 Referensi: Ketika Dua Benda yang Sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten dan desentralisasi menghalangi Web membuat asumsi nama yang unik.
Di sisi lain, URI menyediakan Web sumber daya untuk menghindari setidaknya beberapa masalah landasan tradisional, ketika dapat diselesaikan bahwa dua istilah yang menunjuk ke URI sama. Jadi jika "bintang pagi" dan "malam bintang" menunjuk langsung ke maka setiap landasan lebih lanjut adalah tak berguna.
 Di sisi lain, perbedaan kedua URI mungkin merujuk kepada objek yang sama bebas yang jelas, dan dapat melakukannya melalui hanya beberapa operasi yang digunakan. Sebuah metode heuristic untuk menyelesaikan bentrokan seperti itu, di dunia nyata, adalah untuk membuat penilaian cerdas yang didasarkan pada informasi agunan, dan ini telah menirukan online oleh perhitungan komunitas praktek nama, berdasarkan jaringan sekitarnya setiap sengketa kejadian hubungan.

2.2 Ketika Dua Halaman yang Sama?
Sebuah halaman mengambil alternatif pada masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan sepele dalam banyak kasus, teks "utama" disalin dari satu halaman ke halaman lain, tetapi dikelilingi oleh berbagai iklan, logo, header, dan footer. Mengambil masalah referensi alternatif adalah menentukan ketika ada dua halaman web yang sama.
Dasar pembuatan kesamaan penilaian tidak hanya perlu konten pada halaman, tapi bisa juga menjadi struktur hyperlink di mana halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu datang dari satu halaman, tetapi sebaliknya dapat dikumpulkan dari gugus dokumen di sekitar topik dasar, dan begitu struktur hubungan yang ada dapat menjadi sangat penting. Dan cara yang lebih lanjut pemahaman kesamaan antara pola penggunaan tertentu halaman dua halaman sering diakses pada titik-titik yang sama dalam sesi menjelajah Web.
Dasar untuk membuat penilaian kemiripan tidak perlu menambah konten pada halaman, tetapi juga bisa menjadi struktur hyperlink dalam yang halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa dipetik dari cluster dokumen seputar topik dasar, dan linkage struktur ada bisa sangat penting. Dan mungkin lebih jauh cara memahami kesamaan antara pola penggunaan tertentu halaman - dua halaman sering diakses pada titik-titik yang sama di Web browser. Kesamaan konten berbasis dapat didekati oleh pencocokan kata atau subsequences dari dua halaman. Teknik relatif sederhana dapat digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran persimpangan subsequences dan ukuran kesatuan mereka), dan penahanan satu dengan yang lain (rasio antara persimpangan dan ukuran dari set lengkap).

3 Web Teknik: Tujuan Baru


Pengembangan Web adalah campuran dari pengaturan standar, aktivitas terstruktur, desentralisasi dan inovasi, dan disengaja rekayasa. Sebagai contoh, PageRank memerlukan merangkak dan caching significant bagian web; Keberhasilan Google tergantung pada mampu menjaga cache tractable sementara juga dari ukuran signifikan. Pertumbuhan Web adalah jelas sesuatu yang diinginkan. Penyimpanan jumlah yang selalu lebih besar dari informasi, dalam konteks percepatan perhitungan, akan penting bagi masa mendatang. Tanpa penyimpanan cerdas dan pengambilan lebih cepat untuk Media memori seperti video, maka akhirnya Web akan tumbuh terlalu besar untuk teknologi sendiri. Pelebaran cakupan pencarian untuk mencakup item seperti multimedia, Layanan atau komponen ontologi, juga akan membutuhkan mengejar program penelitian akademis, effective antarmuka dan model bisnis yang masuk akal, dan mengembangkan pendekatan untuk memanfaatkan Web harus diperpanjang ke lingkungan Web baru ketika mereka diciptakan (seperti jaringan P2P, misalnya).

3.1 Layanan Web
Layanan adalah wilayah kunci dimana model rekayasa kami dari Web butuhkan untuk terlibat dan jasa extended. Web didistribusikan potongan kode ditulis untuk memecahkan tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui pesan. tugas skala besar dapat dianalisis dan secara rekursif dipecah menjadi sub-tugas yang dengan sedikit keberuntungan akan memetakan ke spesifik tugas yang dapat ditangani oleh layanan. Jika itu terjadi, dan jika layanan ditempatkan dalam konteks Web, yang berarti bahwa pengguna bisa memanggil layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka.
Software abstrak jauh dari hardware dan memungkinkan kita untuk menentukan mesin komputasi dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan solusi dalam cara yang relatif intuitif.
Proses algebras juga telah diterapkan ke layanan. BPEL4WS adalah versi panjang dari bisnis proses eksekusi bahasa BPEL, yang menjadi cara yang semakin penting untuk halaman tambahan layanan Web dengan proses bisnis. BPEL memiliki batas-batas, tetapi memungkinkan penciptaan komposit layanan dari layanan yang ada. Tahap berikutnya adalah untuk menyesuaikan pendekatan ini untuk lingkungan P2P, dan saat ini sedang dikembangkan untuk itu CDL, alias WS CDL, alias koreografi (Web Layanan koreografi Deskripsi bahasa), sebuah bahasa berbasis XML untuk defining komplementer dan umum perilaku diamati di P2P kolaborasi. Tujuannya adalah bahwa dioperasikan P2P kolaborasi dapat disusun menggunakan koreografi tanpa seperti specifics sebagai platform yang mendasari yang sedang digunakan; Alih-alih fokus adalah tujuan umum kolaborator. Sedangkan BPEL memungkinkan layanan-layanan existing untuk digabungkan bersama-sama, koreografi bergeser fokus ke Deskripsi global kolaborasi, pertukaran informasi, memesan tindakan dan sebagainya, untuk mencapai tujuan yang telah disepakati.

3.2 Pendekatan Terdistribusi: Komputasi Pervasif, P2P, dan Grid
Komputasi mana-mana, P2P dan komputasi grid berbagi banyak masalah-masalah penelitian serius, terutama koordinasi perilaku dalam sistem berskala besar yang didistribusikan. Komputasi mana-mana pemerintah kecil, relatif rendah didukung perangkat komputasi tertanam dalam lingkungan berinteraksi pervasive dengan orang-orang.
Misalnya, pencarian layanan di paradigma meresap harus mengambil tempat tanpa manusia dalam lingkaran. Layanan harus dapat mengiklankan diri mereka sendiri untuk memfasilitasi penemuan.
Ini adalah salah satu contoh lingkungan komputasi yang sedang berkembang yang cenderung tumbuh dalam pentingnya. Dalam konteks Web Science dan mencari dan deskripsi tidak berubah terhadap pengalaman Web, penting bahwa asumsi-asumsi yang kita buat mengenai lingkungan, dan teknologi yang hidup di dalamnya, diminimalkan.
Jaringan P2P, ditandai dengan otonomi dari server pusat, intermiten konektivitas dan oportunistik penggunaan sumber daya, yang lain menarik lingkungan untuk generasi berikutnya Web.

3.3 Personalisasi
Personalisasi penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci. Untuk mendapatkan personalisasi yang efektif, ada harus diintegrasikan penggunaan informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, pola download, profil online), sumber daya yang disampaikan (konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan teknik data mining yang cukup untuk membuat pandangan menyeluruh dari sumber daya yang meliputi sebanyak informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi mereka tidak akan mau, dan yang bisa memperhitungkan dinamika sifat dari model pengguna.

3.4 Multimedia
Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik - ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Sebagai contoh ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka Sana memiliki upaya untuk menghasilkan 'bahasa-seperti' taksonomi generatif representasi visual yang ,tetapi ini tidak tampaknya memiliki aplikasi menarik. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip yang mungkin mendasari penalaran diagram . Secara umum, tidak diketahui bagaimana mengambil semantik dari representasi non-tekstual andal; Fenomena ini dikenal sebagai kesenjangan semantik.
Infrastruktur seperti yang telah dibuat, menggunakan ontologi deskriptor visual (i) yang berdasarkan representasi RDF MPEG-7 visual deskriptor, Ontologi struktur multimedia (ii) berdasarkan skema multimedia Deskripsi MPEG-7 dan (iii) inti ontologi pemodelan primitif pada akar dari hirarki konsep yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi, Semua dilengkapi dengan domain ontologi.
Tentu saja, media yang dibayangkan di sini adalah gambar dan video; pertanyaan terbuka penelitian tetap tidak hanya tentang seberapa jauh yang bisa di Cari oleh pendekatan seperti itu, tetapi juga tentang bagaimana berbagai media akan menyerah pendekatan seperti dalam cara yang integrable.

3.5 Pemrosesan Bahasa Alami
Pemrosesan Bahasa Alami / Natural Language Processing (NLP) berkaitan dengan Web dalam beberapa cara. Di tempat pertama, bahasa alami adalah sangat jarang domain, yang kebanyakan kalimat yang diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web menyediakan korpus menarik untuk penalaran NLP.
Kedua, mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan), yang dapat memberikan dukungan berguna untuk bagian manusia dari tugas pencarian.
Ketiga, NLP memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan. Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai tempat mana berguna dokumen yang diperoleh.
Dengan demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari bermakna melayang bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas sufficient atas pendek jangka menengah.

Lampiran:



No comments:

Post a Comment