ZGŁOŚ PROBLEMikona ozdobna

Pola oznaczone gwiazdką (*) są wymagane
*
*
*
*
captcha
Zapoznałem/am się i akceptuję regulamin oraz politykę prywatności *

ODSYŁACZE

Link do zasobu (portal):

Link do zasobu (skrót):

http://azon.e-science.pl/zasoby/53213

Link do zasobu (repozytorium):

https://id.e-science.pl/records/53213

Typ zasobu: zbiór, baza danych

Korpus tekstów naukowych dla języka polskiego, cz.1

Widok

Metadane zasobu

Tytuł Korpus tekstów naukowych dla języka polskiego, cz.1
Osoby Autorzy: Teresa Sas
Partner: Politechnika Wrocławska
Opis Korpus tekstów naukowych dla języka polskiego, utworzony na bazie zasobów DBC (prace habilitacyjne, artykuły naukowo-popularne).
Korpus jest uporządkowanym zbiorem tekstów naukowych zapisanych w postaci elektronicznej, w formacie tekstowym umożliwiającym jego łatwe przetwarzanie w celach badawczych oraz wykorzystanie w aplikacjach praktycznych ze szczególnym wskazaniem na aplikacje związane z rozpoznawaniem mowy w języku polskim. Wszystkie słowa w korpusie są rozpisane literalnie, usunięta jest interpunkcja i znaki specjalne, daty i liczby są w postaci słownej, tekst został pofrazowany i otagowany znacznikami początku i końca frazy.
Tak przygotowany korpus językowy umożliwia prowadzenie badań z zakresu rozpoznawania mowy, uczenia maszynowego, inżynierii języka naturalnego oraz lingwistyki. Unikalność tego zasobu polega na tym, że ukierunkowany jest on na słownictwo naukowe obejmujące nauki ścisłe, chemiczne, przyrodnicze i medyczne. (Polski)
Uwagi: W pliku pdf opisano szczegółowo sposób tworzenia korpusu oraz podano listę dokumentów, które w nim uwzględniono.
Słowa kluczowe "korpus językowy"@pl, "Uczenie maszynowe"@pl, "korpus języka polskiego"@pl, "korpusy tekstowe"@pl, "inżynieria języka naturalnego"@pl, "ASR"@pl, "automatyczne rozpoznawanie mowy"@pl
Klasyfikacja Typ zasobu: zbiór, baza danych
Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Grupa docelowa: ogół społeczeństwa, administracja publiczna, przedsiębiorcy, uczniowie, studenci, nauczyciele, naukowcy
Szkodliwe treści: Nie
Charakterystyka Miejsce powstania: Wrocław
Czas powstania: 2020
Język zasobu: Polski
Powiązane zasoby
Licencja CC BY-SA 4.0
Informacje techniczne Deponujący: Teresa Sas
Data udostępnienia: 04-11-2020
Kolekcje Kolekcja Politechniki Wrocławskiej, Kolekcja e-Science PWr

Cytowanie

Skopiowano

Teresa Sas. Korpus tekstów naukowych dla języka polskiego, cz.1. [zbiór, baza danych] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Splunk - konfiguracja, rozpoznawanie i wizualizacja informacji o incydentach i zagrożeniach

Arkadiusz Kotynia, Julia Jancelewicz, Urszula Warmińska, inny dokument, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / automatyka, elektronika i elektrotechnika (2018)

Forming and pruning one-class classifier ensembles

Bartosz Krawczyk, praca dyplomowa, Politechnika Wrocławska, dziedzina nauk technicznych / elektronika (2011)

Eksperymenty z ujednoznaczniania znaczeń leksykalnych

Arkadiusz Janz, Paweł Kędzia, zbiór, baza danych, Politechnika Wrocławska, dziedzina nauk technicznych / informatyka (2011)

Zobacz więcej