ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://azon.e-science.pl/zasoby/53213Link do zasobu (repozytorium):
https://id.e-science.pl/records/53213Metadane zasobu
Tytuł |
Korpus tekstów naukowych dla języka polskiego, cz.1 |
---|---|
Osoby |
Autorzy:
Teresa Sas
Partner: Politechnika Wrocławska |
Opis |
Korpus tekstów naukowych dla języka polskiego, utworzony na bazie zasobów DBC (prace habilitacyjne, artykuły naukowo-popularne). Korpus jest uporządkowanym zbiorem tekstów naukowych zapisanych w postaci elektronicznej, w formacie tekstowym umożliwiającym jego łatwe przetwarzanie w celach badawczych oraz wykorzystanie w aplikacjach praktycznych ze szczególnym wskazaniem na aplikacje związane z rozpoznawaniem mowy w języku polskim. Wszystkie słowa w korpusie są rozpisane literalnie, usunięta jest interpunkcja i znaki specjalne, daty i liczby są w postaci słownej, tekst został pofrazowany i otagowany znacznikami początku i końca frazy. Tak przygotowany korpus językowy umożliwia prowadzenie badań z zakresu rozpoznawania mowy, uczenia maszynowego, inżynierii języka naturalnego oraz lingwistyki. Unikalność tego zasobu polega na tym, że ukierunkowany jest on na słownictwo naukowe obejmujące nauki ścisłe, chemiczne, przyrodnicze i medyczne. (Polski) Uwagi: W pliku pdf opisano szczegółowo sposób tworzenia korpusu oraz podano listę dokumentów, które w nim uwzględniono. |
Słowa kluczowe | "korpus językowy"@pl, "Uczenie maszynowe"@pl, "korpus języka polskiego"@pl, "korpusy tekstowe"@pl, "inżynieria języka naturalnego"@pl, "ASR"@pl, "automatyczne rozpoznawanie mowy"@pl |
Klasyfikacja |
Typ zasobu:
zbiór, baza danych Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Grupa docelowa: ogół społeczeństwa, administracja publiczna, przedsiębiorcy, uczniowie, studenci, nauczyciele, naukowcy Szkodliwe treści: Nie |
Charakterystyka |
Miejsce powstania: Wrocław
Czas powstania: 2020 Język zasobu: Polski |
Powiązane zasoby | |
Licencja | CC BY-SA 4.0 |
Informacje techniczne |
Deponujący: Teresa Sas Data udostępnienia: 04-11-2020 |
Kolekcje | Kolekcja Politechniki Wrocławskiej, Kolekcja e-Science PWr |
Podobne zasoby
Splunk - konfiguracja, rozpoznawanie i wizualizacja informacji o incydentach i zagrożeniach
Arkadiusz Kotynia, Julia Jancelewicz, Urszula Warmińska, inny dokument, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / automatyka, elektronika i elektrotechnika (2018)
Forming and pruning one-class classifier ensembles
Bartosz Krawczyk, praca dyplomowa, Politechnika Wrocławska, dziedzina nauk technicznych / elektronika (2011)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 8
Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Eksperymenty z ujednoznaczniania znaczeń leksykalnych
Arkadiusz Janz, Paweł Kędzia, zbiór, baza danych, Politechnika Wrocławska, dziedzina nauk technicznych / informatyka (2011)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 16
Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 23.
Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)