2 Referensi & Identitas
Semantic Web mengandalkan
konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari sistem
pelabelan Web yang bergantung pada beberapa konvensi atau yang lain. Masalah
dengan label di Web adalah bahwa setiap Sistem pada dasarnya desentralisasi dan
tidak diawasi, sesuai dengan prinsip-prinsip yang mengatur Web, tetapi
kurangnya sentralisasi memungkinkan skema different dan Konvensi, dan memang
kecerobohan, untuk berkembang yang pada gilirannya membuka kemungkinan
kegagalan referensi yang unik.
2.1 Referensi: Ketika Dua Benda yang Sama?
Desentralisasi
adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang
pencipta konten dan desentralisasi menghalangi Web membuat asumsi nama yang
unik.
Di sisi lain,
URI menyediakan Web sumber daya untuk menghindari setidaknya beberapa masalah landasan
tradisional, ketika dapat diselesaikan bahwa dua istilah yang menunjuk ke URI
sama. Jadi jika "bintang pagi" dan "malam bintang" menunjuk
langsung ke maka setiap landasan lebih lanjut adalah tak berguna.
Di sisi lain, perbedaan kedua URI mungkin
merujuk kepada objek yang sama bebas yang jelas, dan dapat melakukannya melalui
hanya beberapa operasi yang digunakan. Sebuah metode heuristic untuk
menyelesaikan bentrokan seperti itu, di dunia nyata, adalah untuk membuat
penilaian cerdas yang didasarkan pada informasi agunan, dan ini telah menirukan
online oleh perhitungan komunitas praktek nama, berdasarkan jaringan sekitarnya
setiap sengketa kejadian hubungan.
2.2 Ketika Dua Halaman yang Sama?
Sebuah halaman
mengambil alternatif pada masalah referensi adalah bahwa penentuan ketika dua
halaman web adalah halaman yang sama. Hal ini tentu saja akan sepele dalam
banyak kasus, teks "utama" disalin dari satu halaman ke halaman lain,
tetapi dikelilingi oleh berbagai iklan, logo, header, dan footer. Mengambil
masalah referensi alternatif adalah menentukan ketika ada dua halaman web yang
sama.
Dasar
pembuatan kesamaan penilaian tidak hanya perlu konten pada halaman, tapi bisa
juga menjadi struktur hyperlink di
mana halaman tertanam. Informasi yang mengharuskan pengguna tidak perlu datang
dari satu halaman, tetapi sebaliknya dapat dikumpulkan dari gugus dokumen di
sekitar topik dasar, dan begitu struktur hubungan yang ada dapat menjadi sangat
penting. Dan cara yang lebih lanjut pemahaman kesamaan antara pola penggunaan
tertentu halaman dua halaman sering diakses pada titik-titik yang sama dalam
sesi menjelajah Web.
Dasar untuk
membuat penilaian kemiripan tidak perlu menambah konten pada halaman, tetapi
juga bisa menjadi struktur hyperlink dalam yang halaman tertanam. Informasi
yang mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah
bisa dipetik dari cluster dokumen seputar topik dasar, dan linkage struktur ada
bisa sangat penting. Dan mungkin lebih jauh cara memahami kesamaan antara pola
penggunaan tertentu halaman - dua halaman sering diakses pada titik-titik yang
sama di Web browser. Kesamaan konten berbasis dapat didekati oleh pencocokan
kata atau subsequences dari dua
halaman. Teknik relatif sederhana dapat digunakan untuk menentukan kemiripan
antara dua halaman (rasio antara ukuran persimpangan subsequences dan ukuran kesatuan mereka), dan penahanan satu dengan
yang lain (rasio antara persimpangan dan ukuran dari set lengkap).
3 Web Teknik: Tujuan Baru
Pengembangan
Web adalah campuran dari pengaturan standar, aktivitas terstruktur,
desentralisasi dan inovasi, dan disengaja rekayasa. Sebagai contoh, PageRank
memerlukan merangkak dan caching significant bagian web; Keberhasilan Google
tergantung pada mampu menjaga cache tractable sementara juga dari ukuran
signifikan. Pertumbuhan Web adalah jelas sesuatu yang diinginkan. Penyimpanan
jumlah yang selalu lebih besar dari informasi, dalam konteks percepatan
perhitungan, akan penting bagi masa mendatang. Tanpa penyimpanan cerdas dan
pengambilan lebih cepat untuk Media memori seperti video, maka akhirnya Web
akan tumbuh terlalu besar untuk teknologi sendiri. Pelebaran cakupan pencarian
untuk mencakup item seperti multimedia, Layanan atau komponen ontologi, juga
akan membutuhkan mengejar program penelitian akademis, effective antarmuka dan
model bisnis yang masuk akal, dan mengembangkan pendekatan untuk memanfaatkan
Web harus diperpanjang ke lingkungan Web baru ketika mereka diciptakan (seperti
jaringan P2P, misalnya).
3.1 Layanan Web
Layanan adalah
wilayah kunci dimana model rekayasa kami dari Web butuhkan untuk terlibat dan
jasa extended. Web didistribusikan potongan kode ditulis untuk memecahkan
tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui
pesan. tugas skala besar dapat dianalisis dan secara rekursif dipecah menjadi
sub-tugas yang dengan sedikit keberuntungan akan memetakan ke spesifik tugas
yang dapat ditangani oleh layanan. Jika itu terjadi, dan jika layanan
ditempatkan dalam konteks Web, yang berarti bahwa pengguna bisa memanggil
layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka.
Software
abstrak jauh dari hardware dan memungkinkan kita untuk menentukan mesin
komputasi dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan
solusi dalam cara yang relatif intuitif.
Proses algebras juga telah diterapkan ke
layanan. BPEL4WS adalah versi panjang dari bisnis proses eksekusi bahasa BPEL,
yang menjadi cara yang semakin penting untuk halaman tambahan layanan Web
dengan proses bisnis. BPEL memiliki batas-batas, tetapi memungkinkan penciptaan
komposit layanan dari layanan yang ada. Tahap berikutnya adalah untuk
menyesuaikan pendekatan ini untuk lingkungan P2P, dan saat ini sedang
dikembangkan untuk itu CDL, alias WS CDL, alias koreografi (Web Layanan
koreografi Deskripsi bahasa), sebuah bahasa berbasis XML untuk defining
komplementer dan umum perilaku diamati di P2P kolaborasi. Tujuannya adalah
bahwa dioperasikan P2P kolaborasi dapat disusun menggunakan koreografi tanpa
seperti specifics sebagai platform yang mendasari yang sedang digunakan;
Alih-alih fokus adalah tujuan umum kolaborator. Sedangkan BPEL memungkinkan
layanan-layanan existing untuk digabungkan bersama-sama, koreografi bergeser
fokus ke Deskripsi global kolaborasi, pertukaran informasi, memesan tindakan
dan sebagainya, untuk mencapai tujuan yang telah disepakati.
3.2 Pendekatan Terdistribusi: Komputasi Pervasif, P2P, dan Grid
Komputasi
mana-mana, P2P dan komputasi grid berbagi banyak masalah-masalah penelitian
serius, terutama koordinasi perilaku dalam sistem berskala besar yang
didistribusikan. Komputasi mana-mana pemerintah kecil, relatif rendah didukung
perangkat komputasi tertanam dalam lingkungan berinteraksi pervasive dengan orang-orang.
Misalnya,
pencarian layanan di paradigma meresap harus mengambil tempat tanpa manusia
dalam lingkaran. Layanan harus dapat mengiklankan diri mereka sendiri untuk
memfasilitasi penemuan.
Ini adalah
salah satu contoh lingkungan komputasi yang sedang berkembang yang cenderung
tumbuh dalam pentingnya. Dalam konteks Web Science dan mencari dan deskripsi tidak
berubah terhadap pengalaman Web, penting bahwa asumsi-asumsi yang kita buat
mengenai lingkungan, dan teknologi yang hidup di dalamnya, diminimalkan.
Jaringan P2P,
ditandai dengan otonomi dari server pusat, intermiten konektivitas dan
oportunistik penggunaan sumber daya, yang lain menarik lingkungan untuk
generasi berikutnya Web.
3.3 Personalisasi
Personalisasi
penting untuk meningkatkan nilai jaringan , dan peningkatan konsumen kunci. Untuk
mendapatkan personalisasi yang efektif, ada harus diintegrasikan penggunaan
informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, pola download,
profil online), sumber daya yang disampaikan
(konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan
teknik data mining yang cukup untuk membuat pandangan menyeluruh dari sumber
daya yang meliputi sebanyak informasi yang dibutuhkan pengguna, dalam
representasi yang akan masuk akal bagi mereka, sementara tidak termasuk
informasi mereka tidak akan mau, dan yang bisa memperhitungkan dinamika sifat
dari model pengguna.
3.4 Multimedia
Web adalah
lingkungan multimedia, yang membuat untuk kompleks semantik - ini tentu saja
tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering
menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam
bentuk analog. Sebagai contoh ahli sering menggunakan diagram untuk
mengekspresikan pengetahuan mereka Sana memiliki upaya untuk menghasilkan
'bahasa-seperti' taksonomi generatif representasi visual yang ,tetapi ini tidak
tampaknya memiliki aplikasi menarik. Beberapa peneliti telah mencoba untuk
menemukan prinsip-prinsip yang mungkin mendasari penalaran diagram . Secara
umum, tidak diketahui bagaimana mengambil semantik dari representasi
non-tekstual andal; Fenomena ini dikenal sebagai kesenjangan semantik.
Infrastruktur
seperti yang telah dibuat, menggunakan ontologi deskriptor visual (i) yang
berdasarkan representasi RDF MPEG-7 visual deskriptor, Ontologi struktur
multimedia (ii) berdasarkan skema multimedia Deskripsi MPEG-7 dan (iii) inti
ontologi pemodelan primitif pada akar dari hirarki konsep yang dimaksudkan
untuk bertindak sebagai jembatan antara ontologi, Semua dilengkapi dengan
domain ontologi.
Tentu saja,
media yang dibayangkan di sini adalah gambar dan video; pertanyaan terbuka
penelitian tetap tidak hanya tentang seberapa jauh yang bisa di Cari oleh
pendekatan seperti itu, tetapi juga tentang bagaimana berbagai media akan
menyerah pendekatan seperti dalam cara yang integrable.
3.5 Pemrosesan Bahasa Alami
Pemrosesan
Bahasa Alami / Natural Language Processing
(NLP) berkaitan dengan Web dalam beberapa cara. Di tempat pertama, bahasa
alami adalah sangat jarang domain, yang kebanyakan kalimat yang diucapkan atau
ditulis terjadi sekali saja atau sangat jarang, dan skala raksasa Web
menyediakan korpus menarik untuk penalaran NLP.
Kedua,
mengingat masalah skala Web, teknik NLP akan penting dalam tugas-tugas seperti
summarisation (Lihat, misalnya, dokumen pemahaman konferensi tahunan), yang
dapat memberikan dukungan berguna untuk bagian manusia dari tugas pencarian.
Ketiga, NLP
memiliki potensi besar untuk pembangunan macam antarmuka intuitif yang
heterogen dan tidak selalu melek komputer komunitas pengguna Web memerlukan.
Memang itu mungkin membantu menjembatani kesenjangan antara visi SW Web terdiri
dari data yang dimanipulasi secara logis, dan visi yang lebih tradisional dari
Web sebagai tempat mana berguna dokumen yang diperoleh.
Dengan
demikian kita memiliki disanalogy langsung antara NLP dan SW, yang adalah bahwa
URI, seperti kata-kata, pemilik, dan sehingga dapat diatur. Itu adalah bukan
untuk mengatakan bahwa peraturan tersebut akan memastikan kekebalan dari bermakna
melayang bahwa ahli bahasa mendeteksi, tetapi mungkin menyediakan stabilitas
sufficient atas pendek jangka menengah.
No comments:
Post a Comment