PembentukanSains

Apa yang relevan

Apabila anda menaip pertanyaan pada laman enjin carian atau dalam bar carian (di bahagian atas) pelayar acara mula mengambil tempat, tersembunyi daripada pengguna biasa. Bagaimana, maka, dalam luas World Wide Web untuk mencari maklumat, dan apa yang ada perkaitan carian? Perkataan itu sendiri berasal dari bahasa Latin «relevo» dan diterjemahkan ke dalam Bahasa Rusia sebagai "meningkatkan" atau "memudahkan". bersamaan Inggeris istilah - «relevan». Perenggan 3.5.1 GOST 7,73-96 berdiri untuk konsep, sebagai "relevan" dan "berkaitan" mempunyai definisi yang sama, yang dibuat mengikut maklumat yang diterima oleh permintaan maklumat pengguna.

Ini standard kebangsaan mengandungi lain terma berguna standard dan definisi yang berkaitan dengan bidang dapatan semula maklumat dan penyebaran menggunakan sistem maklumat automatik. Dokumen ini membantu untuk memahami makna banyak perkataan dalam aktiviti-aktiviti maklumat, penerbitan dan perpustakaan, dan bukan hanya unit bahasa, sebagai "yang berkaitan". Takrif "kejituan" dan "kejituan" sebagai perenggan dibuka 3.5.2 GOST 7,73-96. Mereka harus dianggap sebagai hampir sama maklumat data maklumat yang diterima perlu. Ini sering dikelirukan dengan konsep perkaitan yang tidak benar, kerana dalam satu kes ia adalah permintaan di bawah akar, dan lain - mengikut keperluan. Ia juga merupakan salah pada soalan: "Apa yang relevan?" Jawab bahawa istilah adalah berhampiran dengan konsep "mencukupi", iaitu, kesesuaian praktikal keputusan.

Tetapi bagaimana ia bahawa terdapat maklumat? Enjin carian menggunakan tentera bots - program autonomi, laman web yang dilawati dan menyimpan maklumat tentang mereka. Nama ini berasal dari perkataan Inggeris «bot», iaitu pendek untuk «robot». Program-program ini mencari tapak baru, dan kemudian pergi ke halaman rumah dan melihat-lihat kandungannya. Bots kajian yang berkaitan ke laman utama (pelayar dimuatkan pertama) pautan dalaman. Juga, program bots melihat link yang mengarah ke laman web lain, iaitu pautan luar. Menyimpan maklumat ini, lulus pada mereka, menemui tapak baru dan belajar bagaimana sumber-sumber web yang berkaitan. Oleh itu, mereka sentiasa mengkaji "peta" daripada World Wide Web. Tetapi apa yang relevan? Bagaimana ia berkaitan dengan bots?

Satu contoh yang khusus lihat bahawa enjin tawaran carian Yandex dan Google. Pada soalan "Apa yang relevan?" Yandex dijumpai di dalam isu 28 juta jawapan, manakala Google 155,000. Di sini kita boleh mengatakan bahawa mereka semua memenuhi permintaan dan tidak perlu sentiasa, ia mempunyai kejituan tidak akan semua daripada mereka. Sebagai contoh, laman dalam CEO Wikipedia menerangkan konsep ini sudah pasti akan menjadi berguna, dan tapak kos yang berkaitan dan tidak berkaitan tidak berkaitan dengan subjek apabila membuat keputusan. Lagi contoh grafik adalah apabila paparan menunjukkan "hands up", bertujuan untuk menerima maklumat mengenai kumpulan muzik, Yandex telah mengeluarkan 31 juta jawapan, dan di antara mereka terdapat satu artikel dengan rayuan kepada menaikkan tangan ke atas, kerana ia adalah, kepada kelulusan ahli fisioterapi, sangat membantu. Respon yang tidak boleh dianggap kejituan, walaupun 31 juta hits dia mengambil untuk mengeluarkan 586 kedudukan.

Oleh itu, perkaitan yang lebih tinggi daripada teks, semakin besar kemungkinan bahawa dia akan masuk ke dalam kedudukan teratas jawapan carian. angka ini adalah penilaian kuantitatif, tetapi algoritma direalisasikan dalam pelbagai enjin carian adalah berbeza dan tidak diketahui kepada pengguna, dan mereka berubah dari masa ke masa, kerana enjin carian yang cuba untuk mendaki dalam kedudukan itu, cuba untuk memberikan maklumat kejituan, mengurangkan masa untuk mencarinya. Dianggap kemasukan halaman kata kunci yang amat relevan yang sepadan dengan pertanyaan yang berkenaan dalam lingkungan 3-7%. Tetapi ini bukan satu-satunya kriteria yang relevan bagi dokumen itu. Ini termasuk beberapa petunjuk dalaman dan luaran. petunjuk dalaman (kecuali ketumpatan kata kunci), adalah kedudukan mereka dalam teks (memasukkan tajuk, mereka berhampiran dengan header dan antara satu sama lain untuk membentuk frasa carian mungkin), dan kehadiran sinonim, mengesahkan bahawa kandungan teks pertanyaan. Penunjuk luaran utama dianggap popular dalam rangkaian global, yang menunjukkan PageRank dalam Google, Yandex dan TIC mempunyai Tor100 di sistem Rambler. Iaitu, berapa kerap halaman pergi ke laman web lain, adalah lebih baik jika mereka yang bertaraf tinggi. Itulah yang relevan.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ms.delachieve.com. Theme powered by WordPress.