Огромното количество информация в Web пространството на Internet (към средата на 2003г. 3 -4 милиарда Web страници ) поставя много сериозно проблема как да се намери необходимата по даден въпрос информация . Как да се намерят URL адресите на сайтове, в които се намира търсената информация? Ето защо от 1994г. започнаха да се създават специални средства за систематизиране на информацията в Internet и за улесняване намирането на необходимата информация. Започна създаването на огромни бази от данни за Web сайтовете в Internet. В някои се съдържа информация за десетки и дори стотици милиони Web страници.
Достъпът на потребителите до тези бази данни се осигурява главно чрез така наречените портални сайтове (портали).
Основните функции на сайтове за търсене на информация са следните: събиране на информация за Web сайтове в Internet, систематизиране, индексиране и организиране на събраната информация във вид на база от данни, и осигуряване възможност за използване на базата от данни от потребителите от Internet
Видимата за потребителите на Internet е последната част. Именно потребителския графичен интерфейс на сайт е средството, чрез което потребителят търси необходимата информация и получава данните за URL адресите и друга кратка информация за Web сайтовете и Web страници, в които има интересуващата го информация.
Затова основния начин за популяризиране на Web сайтове в Internet е чрез присъствието на данни за сайта в базата данни на колкото е възможно повече портални и други специални сайтове.
Следователно, трябва така да се проектират и програмират Web сайтовете и Web страниците, че информация за тях да попадне в базите данни.
Най-общо, начините за събиране на информация за базите данни на порталните сайтове са два: автоматичен и ръчен.
В някои случаи се използва и комбинация и от двата начина.
При автоматичния начин за събиране на данни се използват специални сложни програми, наречени паяци, роботи или машини за търсене (Search Еngin.). Тези програми непрекъснато посещават регистрираните в Internet Web сайтове и събират информация за публикуваните на тях страници. Тази информация те търсят в самите Web страници.
Всяка машина за търсене работи по специфичен алгоритъм, търси и регистрира информация от дадена Web страница по различен начин.
Затова е трудно да се дадат препоръки, удовлетворяващи всички машини за търсене. Ето защо ще разгледаме как да се включи в Web страниците на Web сайта информацията, търсена от най-известните в настоящия етап машини за търсене (по-точно, машините за търсене на най-известните програми).
Първият елемент в структурата на Web сайтовете, от който се използва съдържащата в него информация е името на Web страницата, т.е. текста между таговете <TITLE>......</TITLE> в заглавната част на Web страницата. Ето защо името на всяка Web страница трябва възможно най-точно да отразява нейното съдържание.
Безсъдържателни имена, като "Добре дошли" или нещо подобно, са абсолютно ненужни. Добре е в името на страницата да се използват няколко от най-характерните за нея ключови думи. По този начин, името на Web страницата не само ще улесни посетителя, но и ще осигури попадането на адреса на страницата в база данни на Web портали.
Някои машини за търсене не могат да обработят имена на страница, съдържащи повече от 100 символа. Посочените изисквания към избора на името на Web страница се отнасят за всички Web страници на даден сайт. Те обаче са особено важни за началната (първата) страница на Web сайта ( като правило-файл index.html). Именно началната страница на Web сайт трябва в най-пълна степен да удовлетворява условията за попадане и правилно индексиране на Web сайта в базата данни на Web порталите.
Следващите елементи от структурата на Web страница , които се анализират и оценяват от машините за търсене, са таговете <META...> в заглавната част на Web страницата (параграф 18.1).
Първият <META...> таг , предназначен за машините за търсене, е с име name="keywords" (ключови думи).
Съдържанието на този таг content= ".........." не трябва да има повече от 1000 символа. Има машини за търсене, които не могат да анализират повече от 255 символа.
Добре е да се използват различни варианти на ключовите думи, например в единствено и множествено число. Не е за препоръчване една и съща ключова дума да се повтаря няколко пъти. Някои машини за търсене игнорират такива сайтове.
Другият важен <META...> таг е с име name="discription" , в съдържанието на който content= "........." се има кратко описание на Web сайта (Web страницата). Удачното кратко описание на Web сайта е изключително важно. В него трябва да се включат най-често използваните термини, фрази и техните синоними.
Друг начин за осигуряване включването на Web сайт в база данни на Web портал е началните параграфи на страницата да представляват кратко описание на целия сайт. Това е необходимо защото някои от машините за търсене анализират първите параграфи в съдържанието на Web страницата. Във връзка с това е необходимо да се обърне внимание на съдържанието на началната страница на Web сайта. Ако в нея няма подобни текстове (често срещан случай) шансовете за попадане в базата данни на много Web портали намаляват.
Някои машини за търсене анализират и други елементи на Web страниците, като например URL адреси в Web сайта, цялото съдържание на изходния код на Web страниците, имената на файловете и др. Ето защо е важно всичко в Web сайта и особено в първата страница да съдържа най-важна информация, характерна за Web сайта, която се анализира от машините за търсене.
Ръчното събиране на информация за Web сайтове се осъществява чрез посещение на различни сайтове от специални хора (рецензенти), които анализират и оценяват съдържанието на сайта и определят в коя категория да бъдат включени. Другият начин за ръчни събиране на данни за Web сайтове е възможността, която се предлага от някои Web портали, потребителите сами да регистрират своите сайтове в базите данни.
В този случай освен URI адреса на сайта е необходимо да се изпрати и друга информация като например, в коя категория на Web портала да се включи сайта. Обикновено тези портали поддържат тематични каталози, подобни на библиотечните.
При комбинираният начин събирането на информация се извършва както от машини за търсене, така и чрез включване в базата данни на информация за Web сайтове, изпратена ръчно от собствениците им.
В последно време се появиха Web сайтове, които извършват автоматично регистриране на Web сайтове в базите данни на Web портали.
Тази услуга се извършва както платено, така и безплатно. Например, сайта www.submit-it.com извършва безплатно регистриране на Web сайтове в 20 Web портала.
Използват се и други начини за популяризиране на сайтове в Internet. Един от тях е чрез размяната на така наречените рекламни банери - малки цветни графични обекти за връзка с даден сайт.
Често в Web сайтове се срещат рубрики наречени "полезни връзки". Обикновено в тях се съдържат връзки към сайтове, тематично свързани със съответния сайт. Така например, сайта ........................... съдържа връзки към сайтове на морски и военноморски учебни заведения (повече от ............адреса), а сайта ........................... съдържа връзки към сайтовете на ?????????????????????.
Другите начини за разпространяване на информация за Web сайтове е чрез традиционните средства за реклама в мултимедиите.
Вече не само в специализираните списания и вестници, но и в масовия печат могат да се срещнат URL адреси на Web сайтове. Могат да се използват и различни рекламни материали за популяризиране на Web сайтове.
Подходящ начин за популяризиране на Web сайтове е на фирмените бланки за писма и други документи на фирми и организации да се посочва и URL адреса на съответния сайти адрез на E-поща за контакти. Вече е обичайна практика в различни предавания по радио и телевизия, както и в рекламни съобщения да се цитират тези данни за Web сайтове.
Въобще, трябва да се каже, че винаги когато се посочва пощенски адрес, телефон, факс е целесъобразно да се посочи и URL адрес на сайт и, разбира се, адрес за E-mail.
URI адресите на лични сайтове е удачно да присъстват във визитните картички и други подобни лични материали.
Необходимо е да се обърне особено внимание на точността на изписване или изговаряне на URL адреси на сайтове. Известно е, че и най-дребната на пръв поглед неточност може да да се превърне от реклама в антиреклама.
Много е неприятно, когато потребител се опитва да види интересуващ го Web сайт, адреса на който е научил по някакъв начин и въпреки многократните опити, получава съобщение, че такъв адрес няма.
Разбира се популяризирането на Web сайтове е важна дейност, за да се постигне известност за съществуването на сайта, но основното все пак си остава качеството на сайта, интереса и ползата от посещаване на сайта.
От изложеното в учебното пособие може да се стигне до извода, че привлекателен, съдържателен и интересен за посетителите може да бъде Web сайт, в който всичко е анализирано и оценено от гледна точка на целта и предназначението на сайта.
Анализ и оценка трябва да се извършват през всички етапи на проектиране, програмиране и поддържане на публикувания Web сайт.