ՈՐՈՆՄԱՆ ՀԱՄԱԿԱՐԳԵՐ ԵՎ ԿԱՅՔԵՐԻ ՇՏԵՄԱՐԱՆՆԵՐ

Համացանցում առկա վեբ կայքերի թիվը հարյուրավոր միլիոնների է հասնում: Այս հսկայական շտեմարանում հետաքրքրող տվյալները, տեղեկատվությունը, նյութը գտնելը, թերևս, համացանցից օգտվողի առջև դրված կարևորագույն խնդիրն է: Խնդիրը լուծելու համար մեզ օգնության են հասնում որոնման համակարգերն ու կայքերի շտեմարանները:

Որոնման համակարգեր

Որոնման համակարգը վեբ կայքի տեսակ է, որը համացանցում տվյալների որոնում կազմակերպելու հնարավորություն է ընձեռում: Հիմնականում որոնումը կատարվում է ըստ կիրառողի ներմուծած տեքստի: Երբ գրում ենք որևէ բառ կամ արտահայտություն ու որոնման համակարգին տալիս ենք որոնելու հրահանգ, համակարգը իր մեջ ներառված կայքերից ընտրում է այն կայքերը, որոնցում հանդիպում է այդ բառն ու ներկայացնում մեզ: Ներկայացված ցանկից, մեծ հավանականությամբ, հնարավոր է գտնել պետք եկած նյութը:

Այս համակարգերը ոչ թե տվյալ պահին ուսումնասիրում են համացանցում եղած կայքերն ու դրանց միջից գտնում մեզ պետքականը, այլ նախօրոք ինդեքսավորում են բոլոր կայքերը: Հատուկ ռոբոտ ծրագրերն այցելում են կայք, «կարդում» դրանցում առկա ողջ տեղեկատվությունը ու գրանցում որոնման համակարգի սպասարկուներում՝ նախօրոք մշակելով ու բերելով որոնման համար հարմար տեսքի, ինդեքսավորում են: Միաժամանակ այդ ռոբոտ ծրագրերը հետևում են վեբ էջերում առկա հղումներին, այցելում դրանք ու ինդեքսավորում նաև այդ էջի տվյալները: Սա հնարավորություն է տալիս առանց որևէ անձի միջնորդության անընդհատ ընդլայնել ինդեքսավորվող կայքերի քանակը: Նույն վեբ էջերը ինդեքսավորվում են ոչ թե մեկ անգամ, այլ՝ պարբերաբար, որպեսզի դրանցում արված թարմացումները նույնպես ներառվեն որոնման մեջ:

Ամենատարածված որոնման համակարգերն են Google-ը (http://www.google.com), Yahoo!-ն (http://search.yahoo.com) և Microsoft կազմակերպության որոնման համակարգը՝ Bing-ը (http://www.bing.com): Ըստ http://searchenginewatch.com կայքի ուսումնասիրությունների, ԱՄՆ-ում 2009թ. օգոստոս ամսին որոնման համակարգերն, ըստ ճանաչվածության, ունեցել են հետևյալ սանդղակը.

  1. Google որոնման համակարգում իրականացվել է 6,986,580 որոնում, որը կազմել է ընդհանուր որոնումների թվի 64.6%-ը,
  2. Yahoo որոնման համակարգում իրականացվել է 1,726,060 որոնում, որը կազմել է ընդհանուր որոնումների թվի16%-ը;
  3. Bing որոնման համակարգում իրականացվել է 1,156,415 որոնում, որը կազմել է ընդհանուր որոնումների թվի 10.7%

Bing որոնման համակարգն իր աշխատանքը սկսել է 2009թ. հունիսի 1-ից ու հանդիսանում է Microsoft կազմակերպության նախորդ որոնման համակարգերի (MSN search-http://search.msn.com, Live search-http://www.live.com) հաջորդ սերունդը: Համակարգի առանձնահատկություններից մեկը որոնման արդյունքների դինամիկ կառավարումն է, այդ թվում՝ կայքից արված մեջբերումների չափի որոշումը, լրացուցիչ տեղեկատվության վահանակը՝ մկնիկը արդյունքի վրա պահելիս և այլն (նկ.18):

Նկ.18. Bing որոնման համակարգը

Աշխարհում հայկական նյութի որոնման վերաբերյալ լուրջ ուսումնասիրություն չկա, բայց ըստ http://top.am կայքի, որոնվող հայկական կայքերի բաժինը Google-ում եղել է 73.2%, Yandex-ում՝ 24.7%, Yahoo!-ում՝ 2%:

Ռուսաստանում բաշխվածության պատկերը փոքր-ինչ այլ տեսք ունի: Վերևում նշված որոնման համակարգերն անփոխարինելի գործիքներ են անգլալեզու որոնումների համար, բայց այլ լեզուներով որոնումներում ճկունությամբ զիջում են տեղային որոնման համակարգերին: Որոնման համակարգերի դրական կողմերից մեկն այն է, որ դրանք կարողանում են գտնել ոչ միայն ներմուծած բառը ճշգրտորեն պարունակող կայքերը, այլ նաև այդ բառի հոլովումները կամ հոգնակի տարբերակը պարունակող կայքերը, ինչպես նաև հաշվի են առնում լեզվական այլ առանձնահատկություններ: Այդպիսի առանձնահատկությունները հատուկ մշակվում են տեղային որոնողական համակարգերի համար. Ռուսաստանում այդպիսիք են http://yandex.ru-ն, http://mail.ru-ն, http://rambler.ru-ն: Ըստ http://liveinternet.ru կայքի ուսումնասիրությունների, Ռուսաստանում որոնման համակարգերի օգտագործման բաշխվածությունն ունի այս տեսքը՝ Yandex-60%, Google-24%, mail.ru-11%:

Հայերենի առանձնահատկությունները հաշվի առնող որոնման համակարգ է http://www.hsearch.am որոնման համակարգը: Այս համակարգը կարողանում է ֆիքսել որոնվող բառի տառասխալը, ներկայացնել դրա ճիշտ գրելաձևը և առաջարկել որոնել ըստ այդ տարբերակի: Այդ դեպքում առաջարկվում են նաև որոնվող բառի ռուսերեն և անգլերեն թարգմանությունները, հնարավորություն տալով որոնումը կատարել ըստ այդ թարգմանությունների: Համակարգը հաշվի է առնում նաև լեզվական մի շարք առանձնահատկություններ, և, օրինակ, «հայր» բառով որոնում կատարելիս գտնվում են նաև «հոր» տարբերակը պարունակող էջերը, «մուկ» բառով որոնում կատարելիս՝ «մկներ» տարբերակը գտնող էջերը, «դրություն» որոնելիս՝ «դրության» տարբերակը պարունակող էջերը և այլն: Բացի սրանից, համակարգը որոնում կատարում է նաև լատինատառ հայերենով: Այսպես, եթե փնտրեք «lusamut», ապա կգտնվեն «լուսամուտ» բառը պարունակող էջերը:

Այս ձեռնարկը պատրաստելու ընթացքում հայերենի լեզվական առանձնահատկություններ են մտցվել նաև Google որոնման համակարգում, որոնց մասին ամբողջական տեղեկատվություն դեռևս չկա: Առանձնահատկություններից մեկն այն է, որ այս համակարգը ևս սկսել է որոնում կատարել լատինատառ հայերենի դեպքում, և նույն բառը որոնելիս գտնվում են թե՛ «lusamut», թե՛ «լուսամուտ» բառը պարունակող էջերը: Կատարվում է նաև հակառակ փոխարկումը: Այսպես, եթե, օրինակ, որոնեք «նոթեփադ», ապա կգտնվեն «notepad> բառը պարունակող կայքերը: Մյուս առանձնահատկությունն այն է, որ սահմանված են տառեր, որոնք համակարգը որոշ դեպքերում նույնականացնում է: Այսպես, եթե կատարեք որոնում «ալիանս» բառով, ապա կգտնվեն նաև «ալյանս» բառը պարունակող կայքերը, եթե սխալմամբ «հոսք»-ի փոխարեն գրենք «հոսկ», ապա հոգ չէ, համակարգը, միևնույն է, կգտնի «հոսք» բառը պարունակող էջերը և այլն: Այս փոխարկումները, սակայն, երբեմն կարող են խնդիրներ առաջացնել: Այսպես, եթե որոնեք «թուր» բառը, համակարգն առաջին հերթին կգտնի ու ցույց կտա «տուր» բառը պարունակող էջերը: Նման խնդիրներից խուսափելու համար որոնող բառը պետք է գրել չակերտների մեջ՝ «”թուր”»:

Ընդհանրապես, որոնում կատարելիս որոնող համակարգերը գտնում են մեծ քանակությամբ կայքեր, որոնցում կողմնորոշվելն ու անհրաժեշտ նյութը գտնելը հաճախ շարունակում է բարդ խնդիր մնալ: Այս խնդրից հնարավորինս խուսափելու համար անհրաժեշտ է որոնումը ճիշտ կազմակերպել: Ընդհանրապես, կան որոշակի կանոններ ու հնարքներ, որոնք թույլատրում են հնարավորինս զտել գտնվող կայքերը՝ մոտենալով ձեր որոնած նյութին: Քանի որ ամենատարածված որոնման համակարգը Google-ն է, այս ձեռնարկի հավելվածում ներկայացվում են այդ համակարգի հնարքները, ճիշտ որոնում կազմակերպելու կանոնները, միջոցները: Համացանցից օգտվելու ու այդ հսկայական շտեմարանը օգտակար դարձնելու համար ամենակարևոր խնդիրը, թերևս, հենց ճիշտ որոնում կազմակերպելն իմանալն է: Մյուս որոնման համակարգերը ևս ունեն որոնում կազմակերպելու հնարքներ, և ընդհանուր սկզբունքները բոլորի համար նույնն են, հետևաբար, յուրացնելով հավելվածում ներկայացված նյութը, կարող եք ճիշտ որոնում կազմակերպել նաև այլ որոնման համակարգերում:

Որոնման համակարգերի մեծ մասը հնարավորություն է տալիս ոչ միայն կայքերի տեքստերում որոնում կատարել, այլև գտնել նկարներ, երաժշտություն, տեսանյութ: Որոնումը նորից կատարվում է բանալի բառերով:

Բայց կան նաև այլ, որոշակի ուղղությամբ մասնագիտացած որոնման համակարգեր: Սրանցից արժի առանձնացնել http://tineye.com կայքը, որը հնարավորություն է տալիս ըստ նկարի կատարել նկարների որոնում: Այսպես, եթե դուք ունեք ինչ-որ նկարի անորակ, փոքր տարբերակը, կամ նկարի միայն մի հատվածը, ապա http://tineye.com որոնման համակարգում ներբեռնում եք ձեր ունեցած նկարը, իսկ կայքը գտնում ու ձեզ է ներկայացնում այդ նկարը այլ վեբ կայքերում (նկ.19):

Նկ.19. Tineye.com կայքում կատարվել է որոնում Պտկասոյի նկարի փոքր հատվածով, համակարգը գտել է նկարի ամբողջական տարբերակը

Մեկ այլ, կիրառական ու հարմար որոնման համակարգ է http://songza.fm կայքը: Այս կայքը, ինչպես հուշում է իր անվանումը, թույլատրում է որոնել երգեր (ըստ երաժշտի կամ խմբի, կամ էլ՝ երգի անվան) ու դրանք անմիջապես լսել (նկ.20):

Նկ.20. Songza.fm կայքում որոնվել է Julia երգը, ու խաղարկվում է Քրիս Րիի համանուն երգը

Կայքերի շտեմարաններ

Անհրաժեշտ նյութը գտնելուն օգնում են նաև կայքերի շտեմարանները (անգլերեն կոչվում են web directory): Սրանք կայքեր են, որոնցում պարունակվում են այլ կայքերի հղումներ՝ կայքերի հակիրճ նկարագրությամբ: Հղումները դասավորվում են ըստ թեմաների: Ի տարբերություն որոնող համակարգերի, կայքերի շտեմարանները կազմում են ոչ թե ռոբոտ ծրագրերը, այլ՝ մարդիկ:

Շտեմարանների մի մասը փակ է: Դրանցում կայքեր գրանցել, շտեմարանը հարստացնել կարող են միայն պատասխանատու անձինք: Մյուսները բաց են, և ցանկացած ոք կարող է այդպիսի շտեմարանում ավելացնել իր կայքի հասցեն:

Ամենահայտնի կայքերի շտեմարանը http://dmoz.org-ն է, որը բազմալեզու է: Սույն ձեռնարկը պատրաստելու պահին այս շտեմարանի հայերեն հատվածում արդեն իսկ առկա էին 1000-ից ավելի կայքեր: Հարկավոր է ուշադրություն դարձնել, որ այստեղ գրանցվում են միայն հայերեն ու հայատառ կայքերը, այլ ոչ թե զուտ հայկական: Dmoz-ի հայերեն հատվածի հասցեն է՝ http://www.dmoz.org/World/Armenian/ (նկ.21):

Նկ.21. Dmoz.org կայքերի շտեմարանի հայերեն հատվածը

Հայկական կայքերի մեկ այլ շտեմարան է http://directory.f5blog.com-ը: Հայկական կայքեր գտնելու հարցում ձեզ կօգնի նաև http://circle.am կայքը, որը թեև իր առաջնային նշանակությամբ կայքերի այցելությունների վիճակագրություն իրականացնող կայք է, բայց միաժամանակ կայքերի շտեմարանի տեսքով ներկայացնում է հազարի չափ գործուն հայկական կայքեր: