OpenAI apresenta assistente de voz do ChatGPT após atraso para aumentar segurança
Inicialmente, o número de usuários será restrito para poucos assinantes pagos do ChatGPT Plus, e o recurso estará disponível para todos apenas no segundo semestre deste ano
A OpenAI vai lançar um assistente de voz muito aguardado para o ChatGPT, com um número limitado de usuários, após ter adiado o lançamento para solucionar possíveis problemas de segurança. A startup de inteligência artificial informou que tornará o recurso de voz disponível para um pequeno grupo de clientes pagantes do ChatGPT Plus a partir da próxima terça-feira.
O produto oferecerá quatro vozes predefinidas, mas não será capaz de imitar como outras pessoas falam, segundo a empresa. A OpenAI também acrescentou novos filtros para garantir que o software possa identificar e recusar alguns pedidos para gerar música ou outros tipos de áudio protegidos por direitos autorais.
A opção de voz foi um dos destaques do evento de lançamento de produtos da empresa em maio para o GPT-4o, uma versão atualizada do modelo GPT-4 que é mais eficiente em lidar com texto, áudio e imagens em tempo real.
Leia também
• "Tudo bem, ChatGPT?'": Popularização da IA levanta reflexão sobre contato "afetuoso" com as máquinas
• Apple e OpenAI: o que já se sabe sobre como o ChatGPT será inserido no iPhone
• ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
A startup havia introduzido uma opção mais limitada para o ChatGPT conversar com os usuários no ano passado, mas o novo recurso promete ser mais rápido e combinar com poderosas capacidades de reconhecimento de imagem para transformar o chatbot num parceiro de conversa muito mais útil e dinâmico.
A OpenAI havia informado anteriormente que pretendia lançar o assistente de voz para um pequeno grupo de assinantes pagos do ChatGPT Plus no fim de junho, mas decidiu que precisava de mais um mês para atingir o padrão de lançamento.
A empresa disse que estava trabalhando na capacidade do software de identificar e recusar responder a certos tipos de conteúdo, e garantir que ele pudesse processar efetivamente solicitações de milhões de usuários.
Em um comunicado oficial feito ontem, a OpenAI disse que, ao lançar o recurso de forma gradual, poderá monitorar de perto o uso e melhorar a capacidade e a segurança do modelo com base no feedback do mundo real.
Além de ter reiterado seu plano de disponibilizar o recurso de voz para todos os assinantes pagos do ChatGPT Plus no outono do Hemisfério Norte, e de mencionar que continua trabalhando em recursos de vídeo e compartilhamento de tela demonstrados durante o evento de maio. Esses recursos ainda não têm uma data de lançamento definida.
Como resultado, o recurso de voz terá uma lista de capacidades mais limitada no início. Por exemplo, o chatbot não será capaz de acessar um recurso de visão computacional que permitiria oferecer feedback falado sobre os movimentos de dança de uma pessoa simplesmente usando a câmera do smartphone, por exemplo.