Page 26 - Telebrasil - Março/Abril 1981
P. 26
A VOZ ELETRÔNICA quem se habitua. Há cerca de 250 dessas má som pode ser m udado substancialm ente
quinas computadorizadas em bibliotecas dos quando é seguido ou precedido de outro. Em
Os computadores que escutam ainda são raros EUA. quase todas as línguas isso acontece, uma
palavra se liga a outra, modificando seu som.
e caros, mas há modelos baratos em experiên A AT & T (companhia telefônica) está ex
cia, é o que anuncia uma reportagem no “ Wall perimentando um “ sistema de armazenagem Um dos pioneiros na identificação de palavras
Street Journal” . A Texas Instruments, por de voz” centralizado que talvez possa Substi para computadores, a Threshold Technology
Inc., uma nova (dez anos) companhia de New
exemplo, está desenvolvendo chips fminhos, tuir a máquina que atende telefone e grava
Jersey, tem atualmente 600 instalações mun
do tamanho de um cartão de crédito, de sili mensagens. Quem liga para uma pessoa e não
cone, a CrS 200 cada, que podem recitar um a encontra pode ditar a mensagem, que é arma diais em experiência. O sistema da Threshold
pode identificar vocabulários de até 400 pala
vocabulário de 200 paiavras. O consumidor zenada no disco computadorizado da telefô
vras. Mas cada sistema só pode ser usado pela
está habituado a ouvir a voz do computador nica. Quando o dono deste telefone liga para o
pessoa que o treinou a conhecer os modelos in
quando precisa depositar mais um níquel em sistema centralizado, usa um código e escuta
dividuais de sua voz, repetindo a mesma pala
determinada máquina, mas ainda não pode sua mensagem tocada de volta. Seria imprati
vra várias vezes. Esses sistemas têm sido usa
dialogar com essa voz. No futuro bem pró cável para a telefônica armazenar essas men
dos para controle de empacotamentos.
ximo, a capacidade de falar de um computador sagens em fitas: levaria horas para encontrar
estará ligada à sua capacidade de ouvir. Com uma. Quando há muitas ordens a serem cumpridas,
binando as duas, os computadores poderão é mais simples que o computador aceite o co
prover assistência telefônica, por exemplo, mando de várias pessoas do que se limitar à
sem auxílio de telefonistas e fazer reservas em voz de quem o treinou através do ditado de
hotel e avião. As experiências estão de tal palavras. A companhia Verbex Inc., subsidiá
forma adiantadas que os dispositivos para voz ria da Exxon (Esso), já vende (Cr$ 7 milhões
de computador e o sistema de escuta bai cada) um sistema que pode identificar até 70
xaram de preço. palavras, não importa quem as diga. Esses sis
tema foi idealizado para trabalhar em linhas
As muitas aplicações da tecnologia da pala
telefônicas. A Fidelity Management & Re
vras continuam fora de alcance. Por exemplo,
search, de Boston, companhia que maneja 22
os cientistas da IBM estão trabalhando há oito
conglomerados de títulos, ações do tesouro
anos num sistema de processamento de pala
etc, usa o sistema Berbex. Antes, a Fidelity
vras que possa tomar ditado. Esses cientis
não sabia como responder logo aos chamados
tas acham que um produto comercial estará
de seus 600 mil clientes querendo saber os lu
pronto dentro de dez anos.
cros atuais e o valor de suas ações. Com o sis
O funcionamento do processo, no entanto, é tema Verbex, o cliente que telefonaé saudado
fácil de explicar: a fala pode ser convertida cm por uma voz amiga que pergunta a ele o nú
impulsos digitais compreensíveis por um mero de código de identificação e em seguida
computador. Para criar mensagens num cir lhe fornece as informações básicas sobre suas
cuito integrado, como faz a Texas Instru ações. Se o cliente quer informações extras,
ments, é preciso converter cerca de 2(X) pala terá assistência humana, para isso bastando di
vras em forma digital. Para encaixá-las num zer a palavra ‘ ‘operadora” . A Fidelity está tão
pequeno chip de silicone o computador sele satisfeita com o sistema que pretende fazer to
ciona os elementos vitais de cada palavra a ser das as transações deste ano através dele, e daí
armazenada. Quando a palavra é chamada de em diante um cliente poderá comprar e vender
volta, um modelo matemático do caminho vo ações sem jamais falar com um ser humano.
cal humano (pulmões, epiglote, língua, dente)
Mas há limitações para essa mágica. O projeto
permite à amostra encher os milissegundos en
da IBM para transcrever um vocabulário fala
tre os sons armazenados com o ruído correto
do fez avanços nos últimos anos, mas ainda as
que sobreveio. Sem o condcnsamento da fala
sim não maneja um vocabulário de mais de mil
para armazenagem, o circuito se lembraria de
palavras, menos de um quarto do vocabulário
apenas duas ou três palavras.
que a IBM encontrou numa amostra de 400
Para que qm computador responda, é preciso
Um sistema de computadores (e circuitos inte cartas comerciais. Quando uma pessoa dita
que ele compreenda o que foi perguntado. Esta
grados individuais) pode possuir vocabulários sentenças, do vocabulário existente, o compu
é a parte complicada para compreender a fala.
il imitados, estocando na memóriadocomputa- tador gasta cerca de uma hora e meia para
O computador precisa “ escutar” os sons cm
dor, por exemplo, os 40 ou 60 fonemas da lín transcrever o equivalente a 30 segundos de fala
ondas, digitalizá-los, e em seguida compará-
gua inglesa falada, e depois combiná-los em e é apenas 91 % correto. A IBM informou ao
los com os modelos de sons digitalizados que
palavras inteiras. A Kurzwcil Computer Pro “ Wall Street Journal” que um dispositivo ex
tinha na memória. Esta procura por um som
ducts, de Cambridge, Massachusetts, uma perimental que possa transcrever mensagens
que combine com o que foi ouvido, mesmo
subsidiária da Xerox, fabrica uma máquina de quase instantaneamente é uma possibilidade
num vocabulário pequeno de mil palavras, é
leitura para cegos que pode decompor a pala para 1990. Antes disso, talvez em 1983, ha
tarefa difícil de cumprir. O problema é que o
vra impressa c pronunciá-la mais depressa do verá no mercado uma televisão japonesa, fa
modelo para a mesma palavra não parece exa
que uma pessoa. O sistema divide as palavras bricada pela Toshiba Corp., de aparelhos cle-
tamente o mesmo quando pronunciado duas
em sílabas, da forma como são lidas, e depois trônicos, que poderá ser controlada oraf
vezes, ate pela mesma pessoa.
as rccombina em palavras que a máquina pro mente, por um máximo de duas pessoas (duas
nuncia de acordo com uma serie de 1.500 re A identificação da palavra se toma complicada vozes diferentes), talvez através de micro
gras lingüísticas armazenadas na memória do cm casos de fala constante. Ensinar um com fone.
computador. A pronúncia da máquina é im putador como é que soa uma palavra, sozinha,
perfeita, mas se torna compreensível para por ela mesma, não é suficiente, porque este (Wall Street Journal — O Globo 01.02.81)