WYWIADY
EN FACE: Wojciech Materna...
... prezes Stowarzyszenia Informatyka Podkarpacka i szef rzeszowskiej firmy IT Top
Dyskryminacja i złe praktyki w przetargach publicznych
Rozmawiamy z dr. inż. Andrzejem Zalewskim z Politechniki Warszawskiej, biegłym sądowym, który brał udział w opracowywaniu rekomendacji dotyczących udzielania zamówień publicznych na dostawę zestawów komputerowych i systemów IT.
EnFace: Łukasz Brocki...
17 marca 2009
Dorota Konowrocka(Strona 2 z 2)
Computerworld — O PROBLEMIE Z ROZPOZNANIEM JĘZYKA POLSKIEGO
Języki słowiańskie są silnie fleksyjne, a rozmaite odmiany niesłychanie zwiększają liczbę słów, które muszą być rozpoznawane przez system. Oficjalny Słownik Polskiego Scrabblisty zawiera prawie 2,5 mln słów. A wydaje się, że to angielski jest językiem poetów... Do tego wymowa polskich wyrazów może być bardzo zróżnicowana. Przykładowo słowo "sześćset" można wymówić zgodnie z pisownią lub jako "szejset". W języku polskim zachodzą też różne efekty koartykulacyjne, które utrudniają budowę systemów rozpoznawania i syntezy mowy. W gruncie rzeczy synteza mowy jest o rząd wielkości łatwiejsza niż jej rozpoznawanie. Po to zatem, aby powstał sprawny program rozpoznający polską mowę, trzeba dysponować ogromnym językowym korpusem tekstowo-akustycznym. Kiedy przygotowywaliśmy taki korpus, na którym później szkoliliśmy sieć neuronową, 20 osób pracowało wyłącznie nad odsłuchiwaniem i spisywaniem ponad 10 tys. nagranych rozmów
Komentarze
- Liczba zatwierdzonych komentarzy (3) |
- dodaj komentarz |
- zobacz wszystkie
~sellap
- ocena: 1
- IP: 213.208.70.235
- 13-12-2010, 16:48
No
~pawel
- ocena: 1
- IP: 46.113.159.194
- 13-12-2010, 20:41
co

04-204 Warszawa ul. Jordanowska 12
tel.: (+48 22) 321 78 00 fax: (+48 22) 321 78 88
© copyright 2012 IDG Poland SA
tel.: (+48 22) 321 78 00 fax: (+48 22) 321 78 88
© copyright 2012 IDG Poland SA







wydrukuj