publicstandard.pl - IT w administracji - link do strony głównej
wyszukiwanie:
Podziel się opinią o serwisie

popularne

Najczęściej czytane

więcej...

WYWIADY

EN FACE: Wojciech Materna...

... prezes Stowarzyszenia Informatyka Podkarpacka i szef rzeszowskiej firmy IT Top

Dyskryminacja i złe praktyki w przetargach publicznych

Rozmawiamy z dr. inż. Andrzejem Zalewskim z Politechniki Warszawskiej, biegłym sądowym, który brał udział w opracowywaniu rekomendacji dotyczących udzielania zamówień publicznych na dostawę zestawów komputerowych i systemów IT.

powiększ tekst >
ARCHIWUM

EnFace: Łukasz Brocki...

17 marca 2009

Dorota Konowrocka
(Strona 2 z 2)

ComputerworldO PROBLEMIE Z ROZPOZNANIEM JĘZYKA POLSKIEGO

Języki słowiańskie są silnie fleksyjne, a rozmaite odmiany niesłychanie zwiększają liczbę słów, które muszą być rozpoznawane przez system. Oficjalny Słownik Polskiego Scrabblisty zawiera prawie 2,5 mln słów. A wydaje się, że to angielski jest językiem poetów... Do tego wymowa polskich wyrazów może być bardzo zróżnicowana. Przykładowo słowo "sześćset" można wymówić zgodnie z pisownią lub jako "szejset". W języku polskim zachodzą też różne efekty koartykulacyjne, które utrudniają budowę systemów rozpoznawania i syntezy mowy. W gruncie rzeczy synteza mowy jest o rząd wielkości łatwiejsza niż jej rozpoznawanie. Po to zatem, aby powstał sprawny program rozpoznający polską mowę, trzeba dysponować ogromnym językowym korpusem tekstowo-akustycznym. Kiedy przygotowywaliśmy taki korpus, na którym później szkoliliśmy sieć neuronową, 20 osób pracowało wyłącznie nad odsłuchiwaniem i spisywaniem ponad 10 tys. nagranych rozmów
Wystaw ocenę:
   Średnia ocena (liczba głosów: 4)
wydrukuj wydrukuj wyslij do znajomegowyślij do znajomego

Komentarze

~sellap

  • ocena: 1
  • IP: 213.208.70.235
  • 13-12-2010, 16:48

No jak widzę Primspeech jest sto lat za konkurencją, która już wypuściła systemy do transkrypcji do sprzedaży już jakiś czas temu. W tym tempie to może za 10 lat coś się pojawi na rynku od pana Brockiego.

~pawel

  • ocena: 1
  • IP: 46.113.159.194
  • 13-12-2010, 20:41

co za pie****y gość opowiada, już od dawna systemy rozpoznające mowę w języku polskim, jeśli zrobi rozpoznawanie mowy za dwa lata to będzie ostatnim który to zrobi i będzie mógł zamknąć swoją firmę, amen.