Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined offset: 1 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 46

Notice: Undefined offset: 2 in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 47

Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 56

Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 59

Notice: Undefined variable: aUrl in /var/www/vhosts/wydmy.info/subdomains/www.informatyczne/httpdocs/___links_.php on line 63
Eksploracja danych - Informatyka

Eksploracja danych

Z Wikipedii

Skocz do: nawigacji, szukaj

Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) (ang. data mining) to jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Istnieje wiele technik eksploracji danych, które wywodzą się z ugruntowanych dziedzin nauki takich jak statystyka (statystyczna analiza wielowymiarowa) i uczenie maszynowe. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.

Spis treści

[edytuj] Techniki eksploracji danych

Techniki i metody służące eksploracji danych wywodzą się głównie z obszaru badań nad sztuczną inteligencją. Główne przykłady stosowanych rozwiązań należą do następujących zakresów:

[edytuj] Modele przetwarzania

W eksploracji danych rozwijane są różne modele przetwarzania, różniące się zakresem zastosowań, stosowanymi algorytmami rozwiązań, sposobem prezentacji wyników. Wśród nich wyróżnia się:

[edytuj] Obszar stosowania

Obszarów stosowania eksploracji danych jest wiele, obejmują one te miejsca, w których stosuje się systemy informatyczne, między innymi w celu gromadzenia pozyskanych danych w postaci baz danych. Jesteśmy świadkami prawdziwej eksplozji baz danych, mając na myśli ich liczbę i objętość. Ogromne zbiory danych gromadzone są w hurtowniach danych. Z powodu dużej prostoty konstruowania bazy danych oraz akceptowalnych cen, systemy gromadzące dane stosuje się prawie we wszystkich dziedzinach życia. Wszędzie tam natomiast, gdzie istnieje już baza danych, pojawia się potrzeba analizy tych danych w celu odkrycia nieznanej dotąd wiedzy. Dziedziny, w których szeroko stosuje się eksplorację danych to: technika, medycyna, astronomia, ekonomia, szeroko pojęty biznes.

Zastosowania KDD znajdują zastosowania przy:

  • eksploracji danych o ruchu internetowym,
  • rozpoznawaniu sygnałów obrazu, mowy, pisma,
  • wspomaganiu diagnostyki medycznej,
  • badaniach genetycznych,
  • analizie operacji bankowych,
  • projektowaniu hurtowni danych,
  • tworzeniu reklam skierowanych(ang. Targeted ads),
  • prognozowaniu sprzedaży(ang. Sales forecast),
  • wdrażaniu strategii Cross-selling'owej,
  • wykrywaniu nadużyć(ang. Fraud detection),
  • ocenie ryzyka kredytowego,
  • segmentacji klientów.

Przykładem może być odkrycie w danych z supermarketu zależności polegającej na tym że klient, który kupuje szampana i kwiaty, kupuje zwykle również czekoladki.

[edytuj] Przykłady wizualizacji

[edytuj] Gęstość

  • density (gęstości empiryczne) - wykresy rozkładów empirycznych dla wybranych zmiennych predykcyjnych są tym lepsze im linie obrazujące poszczególne klasy są względem siebie znacząco przesunięte. W sytuacji, gdy się na siebie nakładają, praktycznie nie ma możliwości wyznaczenia do jakiej klasy należą.


[edytuj] Boxplot

  • boxplot - celem obrazowania właściwości poszczególnych cech na wykresach typu boxplot, jest wyłonienie takich zmiennych, które charakteryzują się największymi przesunięciami względem siebie kwantyli, wartości maksymalnych, minimalnych oraz median.


[edytuj] Histogram

  • histogram - histogramy dla wybranych zmiennych predykcyjnych są tym lepsze im słupki są bardziej zróżnicowane. W sytuacji, gdy się na siebie nakładają, praktycznie nie ma możliwości wyznaczenia do jakiej klasy należą.


[edytuj] Co można odczytać z wykresów?

Tabelka przedstawia jakie dane można odczytać z poszczególnych wykresów.

Density Boxplot Histogram
Kwantyl nie tak nie
Mediana nie tak nie
Wartość min tak tak tak
Wartość max tak tak tak
Wartość cechy tak tak tak
Liczebność tak nie tak
Częstość tak nie tak
Wzajemna korelacja zmiennych tak nie tak

[edytuj] Literatura

  • Hand David, Mannila Heikki, Smyth Padhraic, Eksploracja danych, WNT, Warszawa 2005, ISBN 83-204-3053-4
  • Daniel T. Larose, Odkrywanie wiedzy z danych, Wyd. Nauk. PWN, Warszawa 2006, ISBN 83-01-14836-5

[edytuj] Linki zewnętrzne






Google Chrome 0.3.154.0
Jest to najnowsze dziecko od Google - nowoczesna przeglądarka internetowa Google Chrome została stworzona w celu zapewnienia użytkownikom szybkiego, łatwiejszego i bezpieczniejszego korzystania z internetu. Przeczytaj recenzję Google Chrome!
FlashGot 1.1.2
Dodatek do Mozilli Firefox oraz Thunderbird umożliwiający przekierowywanie pobierania plików do popularnych akceleratorów pobierania takich jak np. FlashGet, Free Download Manager czy GetRight. FlashGot umożliwia pobranie jednego pliku, całej zawartości danej strony lub stworzenie galerii ze zdjęć umieszczonych na przeglądanej stronie.
Amor Video Joiner 2.5.8
Narzędzie, które pomoże Ci w połączeniu ze sobą kilku plików video. Program pozwala łączyć dowolną ilość plików w dowolnych formatach. W takim przypadku aplikacja tworzy plik o zdefiniowanym przez użytkownika formacie. Świetnym rozwiązaniem zastosowanym w programie jest możliwość uprzedniego przeglądnięcie momentu przejścia pomiędzy łączonymi sekwencjami tak, aby wykonać wszystko tak jak sobie to zaplanowaliśmy. Aplikacja posiada przyjazny i prosty w obsłudze interfejs.
Amor Video Converter 2.4.8
Amor Video Converter to aplikacja do konwertowania plików multimedialnych. Program współpracuje z wieloma formatami m.in. AVI, MPEG, RM/RMVB, ASF/WMV oraz DivX. Narzędzie jest proste w użyciu gdyż zapoczątkowanie procesu konwersji wymaga od nas tylko kilka kliknięć myszą. Program umożliwia zamianę systemu PAL na NTSC i NTSC na PAL oraz dobierania odpowiedniego kompresora. Przyjazny interfejs użytkownika z możliwością zmiany skórek uprzyjemnia pracę z programem.
Amor SWF to VCD SVCD DVD Creator & Burner 2.5.9
Amor SWF to VCD SVCD DVD Creator & Burner to narzędzie do konwersji plików wykonanych w technologii Flash (SWF) do formatów Mpeg, VCD, SVCD lub DVD (VOB oraz IFO). Aplikacja obsługuje dwa formaty video: PAL oraz NTSC. Program dodatkowo pozwala nagrywać przekonwertowane pliki na płytę CD lub DVD. Oferuje wysoką prędkość konwersji, a pliki wynikowe nie tracą na jakości. Przyjazny oraz prosty w obsłudze interfejs zachęca do użytkowania.