Page 26 - Telebrasil - Março/Abril 1981
P. 26

A VOZ ELETRÔNICA                                                                                                     quem se habitua. Há cerca de 250 dessas má­                                                                            som  pode ser m udado substancialm ente



                                                                                                                                     quinas computadorizadas em bibliotecas dos                                                                            quando é seguido ou precedido de outro. Em



                 Os computadores que escutam ainda são raros                                                                         EUA.                                                                                                                  quase todas as línguas isso acontece, uma

                                                                                                                                                                                                                                                           palavra se liga a outra, modificando seu som.
                 e caros, mas há modelos baratos em experiên­                                                                        A AT & T (companhia telefônica) está ex­


                 cia, é o que anuncia uma reportagem no “ Wall                                                                       perimentando um “ sistema de armazenagem                                                                              Um dos pioneiros na identificação de palavras



                 Street Journal” . A Texas Instruments, por                                                                          de voz” centralizado que talvez possa Substi­                                                                         para computadores, a Threshold Technology

                                                                                                                                                                                                                                                           Inc., uma nova (dez anos) companhia de New
                 exemplo, está desenvolvendo chips fminhos,                                                                          tuir a máquina que atende telefone e grava

                                                                                                                                                                                                                                                          Jersey, tem atualmente 600 instalações mun­
                 do tamanho de um cartão de crédito, de sili­                                                                        mensagens. Quem liga para uma pessoa e não


                 cone, a CrS 200 cada, que podem recitar um                                                                          a encontra pode ditar a mensagem, que é arma­                                                                         diais em experiência. O sistema da Threshold

                                                                                                                                                                                                                                                          pode identificar vocabulários de até 400 pala­
                  vocabulário de 200 paiavras. O consumidor                                                                          zenada no disco computadorizado da telefô­

                                                                                                                                                                                                                                                           vras. Mas cada sistema só pode ser usado pela
                 está habituado a ouvir a voz do computador                                                                          nica. Quando o dono deste telefone liga para o
                                                                                                                                                                                                                                                          pessoa que o treinou a conhecer os modelos in­
                  quando precisa depositar mais um níquel em                                                                         sistema centralizado, usa um código e escuta
                                                                                                                                                                                                                                                          dividuais de sua voz, repetindo a mesma pala­
                  determinada máquina, mas ainda não pode                                                                            sua mensagem tocada de volta. Seria imprati­
                                                                                                                                                                                                                                                          vra várias vezes. Esses sistemas têm sido usa­
                  dialogar com essa voz. No futuro bem pró­                                                                          cável para a telefônica armazenar essas men­
                                                                                                                                                                                                                                                          dos para controle de empacotamentos.
                  ximo, a capacidade de falar de um computador                                                                       sagens em fitas: levaria horas para encontrar


                  estará ligada à sua capacidade de ouvir. Com­                                                                      uma.                                                                                                                 Quando há muitas ordens a serem cumpridas,


                  binando as duas, os computadores poderão                                                                                                                                                                                                é mais simples que o computador aceite o co­


                  prover assistência telefônica, por exemplo,                                                                                                                                                                                             mando de várias pessoas do que se limitar à


                   sem auxílio de telefonistas e fazer reservas em                                                                                                                                                                                        voz de quem o treinou através do ditado de


                   hotel e avião. As experiências estão de tal                                                                                                                                                                                            palavras. A companhia Verbex Inc., subsidiá­


                   forma adiantadas que os dispositivos para voz                                                                                                                                                                                          ria da Exxon (Esso), já vende (Cr$  7 milhões


                  de computador e o  sistema de  escuta  bai­                                                                                                                                                                                             cada) um sistema que pode identificar até 70


                   xaram de preço.                                                                                                                                                                                                                        palavras, não importa quem as diga. Esses sis­



                                                                                                                                                                                                                                                          tema foi idealizado para trabalhar em linhas
                   As muitas aplicações da tecnologia da pala­
                                                                                                                                                                                                                                                          telefônicas.  A Fidelity Management & Re­
                   vras continuam fora de alcance. Por exemplo,
                                                                                                                                                                                                                                                          search, de Boston, companhia que maneja 22
                   os cientistas da IBM estão trabalhando há oito
                                                                                                                                                                                                                                                          conglomerados de títulos, ações do tesouro
                   anos num sistema de processamento de pala­
                                                                                                                                                                                                                                                          etc, usa o sistema Berbex. Antes, a Fidelity
                   vras que possa tomar ditado.  Esses cientis­
                                                                                                                                                                                                                                                           não sabia como responder logo aos chamados
                   tas acham que um produto comercial estará
                                                                                                                                                                                                                                                          de seus 600 mil clientes querendo saber os lu­
                   pronto dentro de dez anos.
                                                                                                                                                                                                                                                          cros atuais e o valor de suas ações. Com o sis­


                   O funcionamento do processo, no entanto, é                                                                                                                                                                                              tema Verbex, o cliente que telefonaé saudado


                   fácil de explicar: a fala pode ser convertida cm                                                                                                                                                                                        por uma voz amiga que pergunta a ele o nú­


                   impulsos digitais compreensíveis por um                                                                                                                                                                                                 mero de código de identificação e em seguida


                   computador. Para criar mensagens num cir­                                                                                                                                                                                               lhe fornece as informações básicas sobre suas


                   cuito integrado, como faz a Texas Instru­                                                                                                                                                                                               ações. Se o cliente quer informações extras,



                   ments, é preciso converter cerca de 2(X) pala­                                                                                                                                                                                          terá assistência humana, para isso bastando di­


                   vras em forma digital. Para encaixá-las num                                                                                                                                                                                             zer a palavra ‘ ‘operadora” . A Fidelity está tão


                   pequeno chip de silicone o computador sele­                                                                                                                                                                                             satisfeita com o sistema que pretende fazer to­


                   ciona os elementos vitais de cada palavra a ser                                                                                                                                                                                         das as transações deste ano através dele, e daí


                   armazenada. Quando a palavra é chamada de                                                                                                                                                                                               em diante um cliente poderá comprar e vender


                   volta, um modelo matemático do caminho vo­                                                                                                                                                                                              ações sem jamais falar com um ser humano.


                   cal humano (pulmões, epiglote, língua, dente)
                                                                                                                                                                                                                                                            Mas há limitações para essa mágica. O projeto
                   permite à amostra encher os milissegundos en­
                                                                                                                                                                                                                                                            da IBM para transcrever um vocabulário fala­
                   tre os sons armazenados com o ruído correto
                                                                                                                                                                                                                                                            do fez avanços nos últimos anos, mas ainda as­

                   que sobreveio. Sem o condcnsamento da fala
                                                                                                                                                                                                                                                            sim não maneja um vocabulário de mais de mil

                   para armazenagem, o circuito se lembraria de
                                                                                                                                                                                                                                                            palavras, menos de um quarto do vocabulário
                   apenas duas ou três palavras.
                                                                                                                                                                                                                                                            que a IBM encontrou numa amostra de 400
                                                                                                                                      Para que qm computador responda, é preciso
                   Um sistema de computadores (e circuitos inte­                                                                                                                                                                                             cartas comerciais. Quando uma pessoa dita
                                                                                                                                      que ele compreenda o que foi perguntado. Esta
                   grados individuais) pode possuir vocabulários                                                                                                                                                                                             sentenças, do vocabulário existente, o compu­
                                                                                                                                      é a parte complicada para compreender a fala.
                   il imitados, estocando na memóriadocomputa-                                                                                                                                                                                               tador gasta cerca de uma hora e meia para

                                                                                                                                      O computador precisa “ escutar” os sons cm
                   dor, por exemplo, os 40 ou 60 fonemas da lín­                                                                                                                                                                                             transcrever o equivalente a 30 segundos de fala

                                                                                                                                      ondas, digitalizá-los, e em seguida compará-
                   gua inglesa falada, e depois combiná-los em                                                                                                                                                                                               e é apenas 91 % correto.  A IBM informou ao

                                                                                                                                       los com os modelos de sons digitalizados que
                    palavras inteiras. A Kurzwcil Computer Pro­                                                                                                                                                                                               “ Wall Street Journal” que um dispositivo ex­

                                                                                                                                       tinha na memória.  Esta procura por um som
                   ducts, de Cambridge, Massachusetts, uma                                                                                                                                                                                                    perimental que possa transcrever mensagens
                                                                                                                                       que combine com o que foi ouvido, mesmo
                    subsidiária da Xerox, fabrica uma máquina de                                                                                                                                                                                              quase instantaneamente é uma possibilidade
                                                                                                                                       num vocabulário pequeno de mil palavras, é
                    leitura para cegos que pode decompor a pala­                                                                                                                                                                                              para  1990.  Antes disso, talvez em  1983, ha­
                                                                                                                                       tarefa difícil de cumprir. O problema é que o
                    vra impressa c pronunciá-la mais depressa do                                                                                                                                                                                              verá no mercado uma televisão japonesa, fa­

                                                                                                                                       modelo para a mesma palavra não parece exa­
                    que uma pessoa. O sistema divide as palavras                                                                                                                                                                                              bricada pela Toshiba Corp., de aparelhos cle-

                                                                                                                                       tamente o mesmo quando pronunciado duas
                    em sílabas, da forma como são lidas, e depois                                                                                                                                                                                             trônicos,  que poderá ser controlada oraf

                                                                                                                                       vezes, ate pela mesma pessoa.
                    as rccombina em palavras que a máquina pro­                                                                                                                                                                                                mente, por um máximo de duas pessoas (duas



                    nuncia de acordo com uma serie de  1.500 re­                                                                        A identificação da palavra se toma complicada                                                                          vozes diferentes), talvez através de micro­


                    gras lingüísticas armazenadas na memória do                                                                        cm casos de fala constante. Ensinar um com­                                                                             fone.


                    computador.  A pronúncia da máquina é im­                                                                           putador como é que soa uma palavra, sozinha,


                     perfeita, mas se torna compreensível para                                                                          por ela mesma, não é suficiente, porque este                                                                           (Wall Street Journal —  O Globo 01.02.81)
   21   22   23   24   25   26   27   28   29   30   31