ZGŁOŚ PROBLEMikona ozdobna

Pola oznaczone gwiazdką (*) są wymagane
*
*
*
*
captcha
Zapoznałem/am się i akceptuję regulamin oraz politykę prywatności *

ODSYŁACZE

Link do zasobu (portal):

Link do zasobu (skrót):

http://azon.e-science.pl/zasoby/19408

Link do zasobu (repozytorium):

https://id.e-science.pl/records/19408

Typ zasobu: praca dyplomowa

Methods of semantic drift reduction in large similarity networks

Widok

Metadane zasobu

Tytuł Methods of semantic drift reduction in large similarity networks
Wariant tytułu: Metody redukcji dryfu semantycznego w wielkich sieciach podobieństwa
Osoby Autorzy: Łukasz Jerzy Bolikowski
Partner: Instytut Badań Systemowych PAN w Warszawie
Opis We have investigated the problem of clustering documents according to their semantics, given incomplete and incoherent hints reflecting the documents’ affinities. The problem has been rigorously defined using graph theory in set-theoretic notation. We have proved the problem to be NP-hard, and proposed five heuristic algorithms which deal with the problem using five quite different approaches: a greedy algorithm, an iterated finding of maximum cliques, energy minimization inspired by molecular mechanics, a genetic algorithm, and an adaptation of the Girvan-Newman algorithm. As a side effect of the fourth heuristic, an efficient and aesthetically appealing method of visualization of the large graphs in question has been eveloped. The approaches have been tested empirically on the network of links between articles from over 250 language editions of Wikipedia. A thorough analysis of the network has been performed, showing surprisingly large semantic drift patterns and an uncommon topology: a scale-free skeleton linking tight clusters. It has been demonstrated that, using a blend of the proposed approaches, it is possible to automatically detect, and to a large extent eliminate, the semantic drift in the network of links between the language editions of Wikipedia. Last but not least, an open-source implementation of the proposed algorithms has been documented. (Angielski)
Słowa kluczowe "wikipedia"@pl, "dryf semantyczny"@pl, "NP-hard problem"@pl, "algorytm genetyczny"@pl
Klasyfikacja Typ zasobu: praca dyplomowa
Dyscyplina naukowa: dziedzina nauk technicznych / informatyka (2011)
Grupa docelowa: naukowcy, studenci, przedsiębiorcy
Szkodliwe treści: Nie
Charakterystyka Miejsce powstania: Warsaw
Czas powstania: 2009
Liczba stron: 102
Promotor: Marek Antoni Niezgódka
Język zasobu: Angielski
Lokalizacja: Warszawa
Licencja CC BY-SA 4.0
Informacje techniczne Deponujący: Justyna Kupczak
Data udostępnienia: 04-10-2018
Kolekcje Kolekcja Instytutu Badań Systemowych PAN w Warszawie, Kolekcja e-Biblio IBS PAN

Cytowanie

Skopiowano

Łukasz Jerzy Bolikowski. Methods of semantic drift reduction in large similarity networks. [praca dyplomowa] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Adaptacyjny system nawigacji odruchowej robota mobilnego

Piotr Skrzypczyński, D. Rudziński, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

System wspomagania decyzji w gospodarce magazynowej w sferze dystrybucji

Grzegorz Chodak, praca dyplomowa, Politechnika Wrocławska, Dziedzina nauk społecznych / nauki o zarządzaniu i jakości (2018)

Usługa wspierająca projektowanie płytek drukowanych PCB

Damian Bartosz, kod źródłowy, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)

Softcomputing

Jacek Mazurkiewicz, książka, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)

Zobacz więcej