A técnica secreta sobre a replicação de voz que a Apple está lançando

0
two space gray and two silver iPhone 11's

Um salto para a personalização de voz

A gigante da tecnologia, Apple, revelou na última terça-feira um conjunto de novas ferramentas de acessibilidade para iPhones e iPads. Dentre elas, destaca-se uma ferramenta que promete ser um divisor de águas: a capacidade de duplicar a voz do usuário para realizar chamadas telefônicas após um breve treinamento de apenas 15 minutos.

Com a inovação apelidada de Personal Voice, será possível ao usuário ler prompts de texto e gravar áudios para que a tecnologia aprenda e recrie sua voz. Uma funcionalidade complementar chamada Live Speech vai então utilizar a “voz sintetizada” para ler em voz alta textos digitados pelo usuário em chamadas telefônicas, conversas via FaceTime e até mesmo em interações presenciais. Além disso, o usuário poderá armazenar frases de uso comum para facilitar a comunicação ao vivo.

Inclusão digital a um novo patamar

A Apple está direcionando esses recursos pioneiros para tornar seus dispositivos mais inclusivos para pessoas com deficiências cognitivas, visuais, auditivas e de mobilidade. Indivíduos que enfrentam condições como a ALS – esclerose lateral amiotrófica, onde há uma perda progressiva da voz, estão entre os que podem se beneficiar enormemente dessas ferramentas.

Sarah Herrlinger, diretora sênior de Política e Iniciativas de Acessibilidade Global da Apple, ressaltou a importância da acessibilidade em todos os aspectos do trabalho da empresa: “Essas funcionalidades inovadoras foram desenvolvidas com o feedback dos membros das comunidades de pessoas com deficiência, buscando apoiar um conjunto diversificado de usuários e ajudar as pessoas a se conectarem de maneiras novas.”

A previsão é que esses recursos estejam disponíveis ainda este ano, elevando o nível de como a acessibilidade é tratada nos dispositivos móveis.

O avanço da inteligência artificial e os desafios éticos

Embora essas ferramentas tenham o potencial de atender a uma necessidade real, elas também surgem em um momento em que os avanços na inteligência artificial despertam preocupações sobre o uso indevido de áudios e vídeos convincentes falsificados – os chamados “deepfakes” – para aplicação de golpes ou disseminação de desinformação.

A Apple garante que a ferramenta Personal Voice utiliza “aprendizado de máquina no próprio dispositivo para manter as informações dos usuários privadas e seguras”.

Outras empresas de tecnologia também têm explorado o uso da IA para replicar vozes. No ano passado, a Amazon anunciou que estava trabalhando em uma atualização do seu sistema Alexa que permitiria que a tecnologia imitasse qualquer voz, até mesmo de um ente querido falecido.

Integração e acessibilidade ampliadas

Além das funcionalidades de voz, a Apple anunciou o Assistive Access, que consolida alguns dos aplicativos mais populares do iOS, como FaceTime, Messages, Camera, Photos, Music e Phone, em um único app de Chamadas. A interface inclui botões de alto contraste, etiquetas de texto grandes, a opção de um teclado apenas de emojis e a capacidade de gravar mensagens de vídeo para pessoas que podem preferir comunicações visuais ou auditivas.

A Apple está também atualizando seu aplicativo Magnifier para pessoas com deficiência visual. Agora, ele incluirá um modo de detecção para auxiliar na interação com objetos físicos, permitindo, por exemplo, que alguém use a câmera do iPhone para identificar e anunciar os botões de um micro-ondas.

Essas novidades sinalizam um comprometimento da Apple em não apenas acompanhar as tendências tecnológicas, mas também em liderar quando se trata de tornar a tecnologia uma aliada da inclusão e da diversidade.

About The Author

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *