TECNOLOGIA

Do e-mail às redes sociais: como as big techs têm transformados IAs em assistentes onipresentes

Em meio a controvérsias, Apple, Google, Microsoft, Meta e OpenAI avançam com novas funções de IA espelhadas em seus produtos e serviços

IA em toda parte: anúncios recentes atestam a expansão da tecnologia - Reprodução

Dois anos e meio depois do lançamento do ChatGPT chacoalhar a indústria de tecnologia, o Vale do Silício parece querer incluir a inteligência artificial generativa em todos os cantos da internet e de dispositivos eletrônicos, do e-mail aos óculos de realidade virtual. As mudanças não devem demorar a chegar até mesmo para quem resiste a interagir com um robô de IA.

A Apple, que sinalizava cautela em dar esse passo, apresentou no mês passado a integração da Siri, sua assistente virtual, com o ChatGPT. O Google, buscador mais popular da internet, liberou nos EUA seu sistema que gera respostas por IA generativa em pesquisas. A empresa também tem integrado robôs às ferramentas de trabalho e ao e-mail.

 

No caso da Meta, o plano é incluir assistente de IA em suas redes sociais acessadas por mais de 3 bilhões de pessoas. Já a Microsoft levou a IA generativa para os computadores e também para o pacote Office por meio do Copilot. Enquanto isso, a OpenAI avança para que seu principal produto, o ChatGPT, tenha capacidade de enxergar e ouvir, além de ler.

Em comum, as big techs têm buscado injetar a inteligência artificial generativa no dia a dia de quem usa e consome seus produtos. O novo passo da indústria é também mudar a maneira com que a IA interage: ir além dos comandos de texto e fazer com que os sistemas possam "escutar" e "enxergar" de forma mais natural.

— Nós estamos vendo uma transição de ferramentas puramente passivas, que atendem a comandos de usuários a partir de cliques, para ferramentas que analisam o seu uso, e sugerem formas mais espertas de fazer algo — resume Carlos Rafael Gimenes, professor do curso de Sistemas da Informação da ESPM.

Uma série de anúncios feitos nas últimas semanas pelas gigantes de tecnologia mostram como o setor tem trabalhado para tornar a IA mais "onipresentes". O Globo preparou um guia sobre as mudanças, que não acontecem sem controvérsias:

OpenAI quer ChatGPT 'multimodal'
Uma IA que conversa, enxerga, escuta e analisa imagens ao vivo em tempo real. Em breve, é possível que também realize tarefas em nome dos usuários. Em maio, a OpenAI realizou a maior atualização do ChatGPT desde o lançamento do sistema e apresentou o GPT-4o, seu novo modelo de inteligência artificial que processa áudio, imagem e texto.

Com a atualização, o assistente virtual vai poder conversar de forma mais "natural", interagir por voz com outra IA, avaliar situações do "mundo real", cantar e até ler emoções dos usuários.

 

Mira Murati, diretora de tecnologia da OpenAI, durante apresentação do GPT-4o — Foto: Reprodução/OpenAI

A nova versão vai ser disponibilizada para todos os usuários, incluindo quem utiliza a versão gratuita do ChatGPT. Nem todas as funcionalidades, no entanto, estão disponíveis. As mais avançadas vão começar a ser liberadass a partir de julho para grupos restritos de usuários, segundo a OpenAI.

O lançamento acabou esquentando os debates sobre os limites legais e éticos no uso de conteúdos protegidos por direitos autorais, depois da companhia ser acusada de usar a voz de Scarlett Johansson para criar uma das personalidades do GPT-4o.

— Certamente podemos dizer que estamos na era da produtividade com a IA — diz Monica Magalhães, especialista em inovação e fundadora da Agência Disrupta — Mas também é momento de debater as questões mais polêmicas, como a de garantir direitos autorais dos conteúdos utilizados para treinamento destas redes neurais, por exemplo, ou de corrigir problemas de viés — acrescenta.

Google lançou IA nas buscas e expandiu Gemini
No dia seguinte à apresentação do GPT-4o, também em maio, o Google realizou seu principal evento do ano, o Google I/O e anunciou o que o CEO Sundar Pichai definiu como a mudança mais significativa no buscador em 25 anos: a inclusão de respostas de IA generativa nos resultados das pesquisas.

O sistema, chamado de AI Overview, gera resumos criados por IA. A ferramenta começou a rodar nos Estados Unidos e vai ser aberta para "bilhões" de pessoas ao longo do ano, segundo o Google. Poucos dias depois de começar a rodar, no entanto, a empresa teve que promover um "freio de arrumação" no AI Overview, depois do sistema gerar respostas equivocadas, que viralizaram nas redes.

No Google I/O, a gigante de tecnologia ainda exibiu sua versão, em desenvolvimento, do Gemini multimodal. O Gemini é o nome que o Google dá à sua família de recursos de IA. Similar ao GPT4o, o sistema também, promete a empresa, será capaz de processar áudio e vídeo em tempo real.

Outro passo da big tech foi avançar na integração do Gemini ao Gmail e aos sistemas de trabalho do Google (como o Docs). A IA vai começar a aparecer como uma barra lateral de seus aplicativos do Workspace (que incluem também o Drive, Apresentações e Tabela) e poderá realizar tarefas integradas nos aplicativos (como de encontrar e enviar informações de um e-mail para abrir o docs ou de buscar dados no Drive e gerar uma apresentação de Slides).

No Brasil, a integração com o Gemini está disponível apenas em inglês. Os usuários do país que assinam o Workspace, no entanto, têm a IA integrada ao Gmail e ao Docs por meio da função "Ajude-me a escrever". No e-mail, o robô resume mensagens e altera o "tom" das mensagens. No Docs, também pode gerar textos prontos com comandos (prompts) e fazer consultas dentro da ferramenta.

Microsoft avançou com computadores para IA
Na semana seguinte ao Google I/O, a Microsoft anunciou a integração da IA diretamente nos hardwares e softwares de computadores, com o Copilot+ PCs. O Copilot é o sistema de inteligência artificial da companhia que roda com o "cérebro" do ChatGPT. Segundo a empresa, os dispositivos que virem com esse selo vão ser cem vezes mais eficientes para cargas de trabalho de IA quando comparados aos PCs tradicionais.

A empresa também ampliou a injeção de IA ao Windows 11 e anunciou o Runtime, uma plataforma que leva aplicativos e modelos de inteligência artificial diretamente para seu sistema operacional. A ferramenta permite aos desenvolvedores criarem aplicações para o Windows integradas com funcionalidades de IA.

O Copilot ainda ganhou novas funcionalidades no Microsoft 365, pacote que inclui o Teams (de reuniões) e o Outlook (de e-mails). A principal delas é a possibilidade da IA ser uma espécie de assistente de equipe, chamado de "Team Copilot".

Com a atualização, o sistema poderá realizar funções de forma autônoma. Com a atualização, ele poderá ser personalizado e programado para executar ações de forma autônoma, a partir das necessidades específicas de áreas como marketing, vendas, finanças, RH ou TI. A ideia é que ele se torne um novo "colega de trabalho", segundo a Microsoft.

Meta levou IA generativa para as redes sociais
Dona do Facebook, Instagram e WhatsApp, a Meta realizou este ano seu principal passo para levar IA generativa para seus produtos: a integração de todas as suas redes sociais com robôs alimentados pelo Llama 3, modelo de inteligência artificial mais avançado da empresa.

Já disponível nos Estados Unidos, o Meta AI pode ser acessado em chats no WhatsApp, no Instagram e no Facebook. A IA, além de criar conteúdos em textos, gera imagens e acessa informações atualizadas na internet.

O sistema poderá ser ativado em todas redes a partir da função de "buscas". No Facebook, ele também aparece em publicações no feed como um novo botão, chamado de “Ask Meta AI” (“Pergunte ao Meta AI”). Ainda será possível acessá-lo em uma versão desktop, bastante parecida com o ChatGPT. A IA também estará em breve disponível no Quest, óculos de realidade virtual da Meta.

A ferramenta, de acordo com a Meta, vai começar a rodar no Brasil a partir de julho e será liberado de forma gradual para os usuários. A empresa, no entanto, foi impedida pelo agência brasileira de proteção de dados de usar informações dos usuários para treinar o sistema. Na Europa, decisão similar levou a empresa a interromper o lançamento da IA.

Para Matheus Popst, sócio da Arbor Capital, além da questão regulatória, ainda há dúvidas também sobre como a gigante das redes sociais irá fazer para monetizar o sistema. Ele avalia que a companhia também terá o desafio de calibrar a interação com a IA e com outros conteúdos:

— A própria Meta parece não saber como vai fazer isso. Tem outro ponto que é: se o usuário da Meta está interagindo com a IA, ele não está vendo outros conteúdos nas redes e, consequentemente, não está entrando nos anúncios. Mais IA, no caso da Meta, pode significar menos lucro.

Apple integrou IA generativa aos iPhones
A Apple revelou em junho que pretende "turbinar" seus equipamentos com IA generativa durante o WWDC (Worldwide Developers Conference), sua conferência anual para desenvolvedores.

O processo passa por uma atualização da Siri, a assistente de voz que vai acessar informações do ChatGPT e ter novas funcionalidades. A empresa também revelou o Apple Intelligence, que poderá reescrever, revisar e resumir textos em praticamente qualquer aplicativo, incluindo o Mail e o Notas. A IA também irá personalizar notificações na tela do celular e terá funções de criação e edição de imagens.

Integrada ao Apple Intelligence, a Siri também ficará mais "humana": poderá ser acessada por texto, além dos comandos de voz, e terá interações mais "naturais" com os usuários, com compreensão de contexto e linguagem mais similar a humana. A assistente também poderá executar tarefas mais complexas, como agendar compromissos e realizar mais ações dentro dos aplicativos. Outra capacidade da Siri é de lidar com múltiplas solicitações de forma simultânea.

— A Apple vinha sendo criticada por estar “atrasada” na corrida da IA e surpreendeu o mercado ao anunciar uma parceria com a OpenAI que transforma seus celulares em potentes assistentes pessoais — diz Andrea Janér, fundadora e CEO da Oxygen.