ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://azon.e-science.pl/zasoby/19875Link do zasobu (repozytorium):
https://id.e-science.pl/records/19875Metadane zasobu
Tytuł |
Selekcja na bieżąco z danych masowych przy użyciu zespołu klasyfikatorów Wariant tytułu: On-line selection from mass data using the classifier ensemble |
---|---|
Osoby |
Autorzy:
Marcin Gromisz
Partner: Instytut Badań Systemowych PAN w Warszawie |
Opis |
W rozprawie zaproponowano nową metodę selekcji na bieżąco z danych masowych obiektów o pożądanych cechach, proces taki jest formalnie równoważny klasyfikacji binarnej: akceptacja, odrzucenie. Metoda przeznaczona jest do analizy danych charakteryzujących się wielkim wymiarem przestrzeni cech oraz relatywnie niskim prawdopodobieństwem a priori wystąpienia w populacji obiektów poszukiwanych, zakłada się również, iż selekcjonowana populacja zdefiniowana jest zbiorem przykładowych obiektów. W zadaniach uwarunkowanych jak opisane powyżej skonstruowanie klasyfikatora nastręcza zwykle trudności obliczeniowe wynikające z konieczności przetworzenia zbiorów przykładów o wielkiej liczności. W proponowanej metodzie w miejsce jednolitego klasyfikatora binarnego stosowany jest zespół klasyfikatorów binarnych, z których każdy konstruowany jest na podstawie stosunkowo nielicznego podzbioru przykładów. Badany obiekt poddawany jest równolegle działaniu wszystkich klasyfikatorów w zespole, poczym wszystkie otrzymane wyniki łączone są, jako przesłanki we wnioskowaniu prowadzącym do binarnej decyzji końcowej. Jako szczególnie użyteczny w tym zastosowaniu formalizm wnioskowania wskazano Teorię Dempstera-Shafera, w jej ujęciu wyniki poszczególnych klasyfikatorów są ilościowo interpretowane jako wartości funkcji przekonania (Bel) co do możliwości przynależenia, bądź nie przynależenia badanego obiektu do danej klasy, a następnie łączone zgodnie z regułą kombinacji Dempstera. W rozprawie zaproponowano praktyczny sposób interpretowania niedyskryminowanych wyników klasyfikatorów binarnych jako wartości funkcji przekonania Bel oraz adekwatną technikę wydzielania i standaryzacji podzbiorów uczących. Skuteczność proponowanej metody selekcji danych zweryfikowano w eksperymencie numerycznym wzorowanym na rzeczywistym zagadnieniu z dziedziny fizyki cząstek elementarnych. (Polski) Opis w innym języku: In the dissertation a new method of on-line selection from mass data of objects with desirable features is proposed; such a process is formally equivalent to the classification: acceptance, rejection. The proposed method is intended for the analysis of data characterized by a large dimension of features space and relatively low probability a priori of occurrence of wanted objects in the population; it is also assumed that the population subject to selection is defined by a set of example objects. In tasks conditioned as described above, constructing a classifier usually presents computational difficulties resulting from the need to process a training set with a large number of elements. In the proposed method instead of a uniform binary classifier an ensemble of binary classifiers is used, each of which is constructed on the basis of a relatively small subset of examples. The tested object is subjected in parallel to all classifiers in the ensemble, after which all results obtained are combined as the premises in the reasoning leading to the final binary decision. The Dempster-Shafer Theory was indicated as a particularly useful formalism of reasoning in this application; in its frame the results of individual classifiers are interpreted as values of the belief function (Bel) about the possibility of belonging or not belonging of tested object to a given class, and then combined according to the Dempster rule. The dissertation proposes a practical way to interpret non-discriminated results of binary classifiers as values of the belief function Bel and an adequate technique for separating and standardizing learning subsets. The effectiveness of the proposed method of data selection has been verified in a numerical experiment modeled on the real issue in the field of particle physics. (Angielski) |
Słowa kluczowe | "selekcja"@pl, "klasyfikacja danych"@pl, "rozpoznawanie obrazów"@pl, "dane masowe"@pl, "wnioskowanie przybliżone"@pl, "teoria Dempstera-Shafera"@pl, "pattern recognition"@en, "big data"@en, "approximate inference"@en, "Dempster-Shafer theory (DST)"@en |
Klasyfikacja |
Typ zasobu:
praca dyplomowa Dyscyplina naukowa: dziedzina nauk technicznych / informatyka (2011) Grupa docelowa: naukowcy, studenci, przedsiębiorcy Szkodliwe treści: Nie |
Charakterystyka |
Miejsce powstania: Warszawa
Czas powstania: 2010 Liczba stron: 146 Promotor: Sławomir Piotr Zadrożny Język zasobu: Polski Lokalizacja: Warszawa |
Licencja | CC BY-SA 4.0 |
Informacje techniczne |
Deponujący: Justyna Kupczak Data udostępnienia: 16-10-2018 |
Kolekcje | Kolekcja Instytutu Badań Systemowych PAN w Warszawie, Kolekcja e-Biblio IBS PAN |
Podobne zasoby
Forming and pruning one-class classifier ensembles
Bartosz Krawczyk, praca dyplomowa, Politechnika Wrocławska, dziedzina nauk technicznych / elektronika (2011)
Zróżnicowanie morfologiczne zawodników różnych dyscyplin sportowych
Jadwiga Pietraszewska, książka, Akademia Wychowania Fizycznego we Wrocławiu, Dziedzina nauk medycznych i nauk o zdrowiu / nauki o kulturze fizycznej (2018)
Nowe koncepcje układów rozpoznających w robotyce
Bohdan Macukow, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Dane pomiarowe sygnałów EMG i MMG z przedramienia
Andrzej Wołczowski, Michał Błędowski, Maciej Przydatek, zbiór, baza danych, Politechnika Wrocławska, dziedzina nauk fizycznych / biofizyka (2011)
Usługa implementująca algorytm rozpoznawania obrazów
kod źródłowy, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Model adaptacyjnego systemu rozpoznawania obrazów i jego zastosowanie w prognozowaniu (PD-1973-10)
Marek Rusinkiewicz, praca dyplomowa, Instytut Badań Systemowych PAN w Warszawie, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)