Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46
Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47
Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 56
Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 59
Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 63
Wyszukiwarka internetowa
Z Wikipedii
Wyszukiwarka internetowa (ang. search engine) to program lub strona internetowa, której zadaniem jest ułatwienie użytkownikom Internetu znalezienie informacji w sieci.
Określenie Wyszukiwarka stosujemy do:
- stron internetowych serwisów wyszukujących - czyli implementacji oprogramowania wyszukującego działającego z interfejsem WWW ogólnodostępnym dla internautów
- oprogramowania przeznaczonego do indeksowania i wyszukiwania informacji w sieciach komputerowych: internecie, intranecie.
W znaczeniu ogólnym wyszukiwarka to oprogramowanie gromadzące w sposób automatyczny informacje o dokumentach tekstowych oraz plikach zgromadzonych w sieci (obszarze wyznaczonym dla wyszukiwarki do indeksowania).
Spis treści |
[edytuj] Historia wyszukiwarek
[edytuj] Historia wyszukiwarek na świecie
- 1990 Archie
- 1991 Veronica
- 1991 JugHead
- 1992 WWW Wanderer
- 1994 WebCrawler
- 1995 AltaVista
- 1995 MetaCrawler
- 1996 Google na Uniwersytecie Stanforda (pod adresem: http://google.stanford.edu)
- 1996 HotBot
- 1997 Yandex
- 1998 Google Google.com - jako niezależna firma
- 2000 Baidu
- 2000 Vivísimo
- 2004 hakia
- 2005 MSN Search
- 2007 Windows Live Search
- 2008 Wikia Search
- 2008 Cuil
[edytuj] Historia wyszukiwarek w Polsce
- 1991 Emulti
- 1994 Polski Archie
- 1995 Polski Infoseek ICM
- 1996 NEToskop
- 1996 Sieciowid
- 1996 Infoseek Onet
- 1996 polska AltaVista
- 1997 Sieciowid kończy działalność
- 2000 Arena.pl przejmuje zasoby Polskiego Infoseeka
- 2001 NetSprint
- 2002 polska wersja Google'a
- 2003 Szukacz
- 2003 Polski Yandex
- 2004 Szook
- 2004 Gooru
- 2005 koniec NEToskopu
- 2005 koniec polskiej wersji wyszukiwarki Yandex
- 2006 Wyszukiwarka Giga
- 2006 Wyszukiwarka Hm?
- 2006 Wyszukiwarka Hidee.org
- 2006 NetSeek.pl
- 2007 Wyszukiwarka video - viFinder.com, Wyszukiwarka filterfind.org
- 2007 LuckyAsk - pierwsza polska wyszukiwarka z nagrodami
- 2008 Charytatywna.com - pierwsze polska wyszukiwarka charytatywna
- 2008 Minigogle.pl - pierwsza polska wyszukiwarka zawierająca treści bezpieczne dla dzieci
- 2008 szukaj-numer.pl - Nowość w internecie, wyszukiwarka numerów GSM
[edytuj] Podział wyszukiwarek
[edytuj] Wyszukiwarki oparte na analizie treści strony
Ponieważ Internet rośnie znacznie szybciej niż jakakolwiek grupa ludzi może go katalogować, oraz z powodu wad katalogów (np. pod danym hasłem może znajdować się tysiące stron), powstały wyszukiwarki, które przeszukują Internet analizując zawartość stron. Kiedy użytkownik poda wyszukiwarce zapytanie, ona odpowie mu łączami do stron, które uzna, w zależności od użytego algorytmu, za najbardziej odpowiednie.
Wyszukiwarki oparte na tej zasadzie mogą objąć znacznie większą część sieci niż katalogi. Niestety są one bardzo podatne na nadużycia, przez co użytkownik zamiast użytecznych informacji dostaje linki na strony nie mające nic wspólnego z jego zapytaniem. Szczególnie wyspecjalizowały się w tym strony pornograficzne.
[edytuj] Wyszukiwarki oparte na analizie topologii sieci
Żeby przeciwdziałać temu, wyszukiwarki zaczęły stosować analizę topologii sieci. Tak więc stronę uważa się za odpowiadającą zapytaniu "britney spears", jeśli wiele stron na temat "britney spears" do niej linkuje. Strona porno z nagimi zdjęciami Britney, niezależnie od własnej treści, i niezależnie od całkowitej liczby linków (głównie z innych stron porno) na nią, nie będzie w ten sposób uznana za związaną z tematem. Natomiast jeśli zada się zapytanie "britney spears nude", strona ta zostanie uznana za istotną, ponieważ linkuje na nią wiele stron o tematyce "nude".
Początkową istotność na podstawie prostej heurystyki, po czym zwykle używa się algorytmu losowego skakania po linkach.
Pierwszą wyszukiwarką, która zastosowała zaawansowane algorytmy analizy topologii sieci był Google (http://www.google.com/ ).
Wyszukiwarki oparte na analizie topologicznej są często uważane za bardzo odporne na nadużycia. W rzeczywistości stosunkowo czestym atakiem są spam-systemy automatycznej wymiany linków. Inną formą ataku jest stworzenie dużej ilości gęsto linkowanych stron, z czego wszystkie na ten sam temat. Jest to jednak zadanie trudne i wymagające dużego nakładu pracy, a modyfikując heurystykę wartości początkowych można znacznie ograniczyć ten proceder, którego skala na razie jest minimalna.
[edytuj] Wyszukiwarki oparte na zasadzie aukcji miejsc
Osobnym pomysłem jest wprowadzony przez Overture (http://overture.com/ ) system, gdzie strony płacą wyszukiwarce kilka centów za każde kliknięcie, przy czym miejsca są licytowane - strona która daje więcej za kliknięcie znajdzie się wyżej na liście rezultatów. Pozycje płatne są oznaczone jako takie, razem z ceną. System ten jest korzystny dla właścicieli stron - płacą oni tylko za wejścia nie za wyświetlenia.
Twórcy twierdzą, że jest on również korzystny dla użytkownika, gdyż tylko strony, które oferują coś użytecznego z danej dziedziny mogą sobie pozwolić na taką reklamę. Z drugiej jednak strony wiele użytecznych stron jest niekomercyjnych, a nawet przy stronach komercyjnych wyniki będą często nieoptymalne - np. na taką reklamę nie mogą sobie pozwolić strony, które mają niskie marże i oferują produkty po niskich cenach, a jedynie te, które mają wysokie marże i oferują produkty drożej.
[edytuj] Reklamy w wyszukiwarkach
Wyszukiwarki stanowią wymarzony cel reklamodawców, ponieważ mają oni praktycznie pełną gwarancję, że osoba wyszukująca dane hasło jest nim zainteresowana. Tak więc większość wyszukiwarek oferuje reklamy zależne od treści zapytań (np. AdWords oferowany przez Google). Nie zawsze są one właściwie oddzielone od wyników poszukiwań, co stało się źródłem protestów grup ochrony praw konsumentów oraz kilku do dziś nierozstrzygniętych spraw sądowych. Ze względu na szeroką krytykę procederu nieoddzielania reklam od wyników, większość wyszukiwarek z niego zrezygnowała i wyraźnie zaznacza teraz reklamy.
[edytuj] Oprogramowanie wyszukiwarek
Oprogramowanie wyszukiwarek to zestaw programów, modułów, z których każdy ma oddzielne zadanie. W skład zestawu wchodzą takie elementy jak:
- Crawler, Robot, Pająk, Spider, Bot - modułów pobierających dokumenty z sieci
- Indeksera , Programów analizujących i oceniających
- Searcher'a - interfejsu wyszukującego wyszukiwarki/podsystem odpowiadający na zapytania/analizator zapytań + moduł prezentacji wyników
Oraz dochodzą do tego:
- programy konwersji dokumentów
- programy archiwizujące repozytorium [Google używa archwizera Z]
- programy analizy technik zabronionych [spam]
- moduły administracyjne
[edytuj] Algorytmy stosowane w wyszukiwarkach
algorytmy oceny relewancji dokumentu względem szukanej frazy - algorytmy oceny zawartości strony
- Binarne
- Ważenie częstością słów TF - częstość wystąpień słowa
- Częstość słów - odwrotna częstość w dokumentach TFIDF - model wektorowy
- PageRank
- In-degree
- Metoda Robertsona i Sparcka-Jonesa (1997)
- Okapi BM-25 TF - Metoda Robertsona (1994)
- KL-Dir Model Markova
- Metoda bazowa B
- Liczba wizyt (klikohit)
- HITS
- PHITS
- PLSA
- PLSA/PHITS
[edytuj] Poprawa relewancji wyników wyszukiwania
- grupowanie (clustering)
- personalizacja
- stop-words - stop listy
- tezaurus, podpowiedzi, weryfikacja pisowni
[edytuj] Pozycjonowanie stron w wyszukiwarkach
- Cloaking
- Dorway pages Jump Pages, Portal Pages
- keyword stuffing (meta tag stuffing)
- spamdexing
- invisible text Niewidzialny Tekst
- link farm Farmy linków
- biasing
- client pull (odświeżanie)
[edytuj] Zobacz też
| W piłkę kopani |
|
Dzięki temu, że, jak nieraz zresztą Czytelników informowałem, jestem człowiekiem niepodatnym na sportowe emocje, łatwiej mi powiedzieć coś, co ktoś przecież powiedzieć musi - a wszyscy się boją.
|
| Męczennicy z SB |
|
"Zemsta to potrawa, która najlepiej smakuje na zimno" - tę myśl autora "Niebezpiecznych Związków" powinni wziąć sobie do serca autorzy anty-esbeckich przepisów. Jeśli na obcięcie przywilejów dawnych utrwalaczy i wspieraczy systemu czekaliśmy przez 19 lat, to można było poczekać jeszcze tydzień i napisać dobrą ustawę. A tak to politycy Platformy dali obrońcom "biednych, krzywdzonych ludzi, którzy będą teraz żyli w nędzy" dodatkowe argumenty do ręki.
|
| 300! |
|
Nie, nie chodzi mi o trzystu dzielnych Spartan, którzy pod wodzą Leonidasa stanęli przeciwko najeźdźcom i polegli bohatersko. Chodzi mi - zbieżność liczb całkowicie przypadkowa - o trzy stówy.
|
| I czego to człowiek dla 300 złotych nie zrobi.... |
|
Politykom PiS coś chyba zaćmiło umysł. Podsuwanie marszałkom fałszywych usprawiedliwień dla uratowania 300 złotych, to nie tylko sromota i śmieszność, ale i polityczny błąd. Dam sobie rękę uciąć, że Platforma będzie teraz przy każdej okazji wypominała PiS- owi małość i mówiła - jak Bronisław Komorowski - że "Kaczyński sprzedał honor za 300 złotych".
|
| Kraina cyberseksu |
|
Przeczytałem w jednym z dzienników, że około miliona Polaków uzależnionych jest od cyberseksu i zjawisko to zatacza coraz szersze kręgi. Ja się nie dziwię.
|