A mudança de rumo da OpenAI: Não treinando o GPT-4 com os dados do cliente da API

mudanças-de-privacidade-do-openai-6457d3fd3d25f-sej-760x400.png

Em uma mudança significativa em relação às suas práticas anteriores, a OpenAI anunciou que não utilizará mais os dados do cliente enviados através de suas APIs para treinar seus modelos de linguagem abrangentes, como o GPT-4.

A mudança foi confirmada por Sam Altman, o CEO da OpenAI, em uma entrevista recente à CNBC.

Nova abordagem da OpenAI em relação aos dados do usuário

A mudança de política da OpenAI foi implementada em 1º de março de 2023, quando a empresa silenciosamente atualizou seus termos de serviço para refletir esse novo compromisso com a privacidade do usuário.

Altman esclareceu: "Os clientes deixaram claro que não desejam que treinemos com seus dados, então mudamos nossos planos: não faremos isso."

APIs, ou interfaces de programação de aplicativos, são estruturas tecnológicas que permitem que os clientes se conectem diretamente ao software da OpenAI.

Altman afirmou que a OpenAI não tem utilizado dados da API para o treinamento do modelo "há algum tempo", sugerindo que este anúncio oficial formaliza uma prática já existente.

Implicações para clientes empresariais

A decisão da OpenAI tem implicações de grande alcance, especialmente para seus clientes empresariais, que incluem gigantes como Microsoft, Salesforce e Snapchat.

Essas empresas têm maior probabilidade de utilizar as capacidades da API da OpenAI para suas operações, portanto, a mudança de privacidade e proteção de dados é particularmente relevante para elas.

No entanto, as novas medidas de proteção de dados se aplicam exclusivamente aos clientes que utilizam os serviços de API da empresa. Os termos de serviço atualizados da OpenAI observam: "Podemos utilizar Conteúdo de Serviços outros que não sejam nossa API."

Assim, outras formas de entrada de dados, como texto digitado no popular chatbot ChatGPT, ainda podem ser utilizadas pelo OpenAI, a menos que os dados sejam compartilhados por meio da API.

Maior Impacto na Indústria

A mudança de política da OpenAI ocorre em um momento em que as indústrias lidam com os potenciais impactos de grandes modelos de linguagem, como o ChatGPT da OpenAI, substituindo materiais tradicionalmente criados por humanos.

Por exemplo, o Writers Guild of America recentemente começou uma greve depois que as negociações entre o Guild e os estúdios de cinema fracassaram. O Guild havia defendido restrições ao uso do ChatGPT da OpenAI para geração ou reescrita de roteiros.

A decisão da OpenAI de não usar os dados dos clientes para treinamento marca um momento crucial na conversa em andamento sobre privacidade de dados e IA. À medida que as empresas continuam a explorar e ultrapassar os limites da tecnologia de IA, garantir a privacidade do usuário e manter a confiança provavelmente permanecerão no centro dessas discussões.

A Evolução do ChatGPT: De GPT-3 para GPT-4

É importante ressaltar que o compromisso da OpenAI de não utilizar dados do cliente para treinamento se aplica ao seu mais recente modelo de linguagem, o GPT-4, lançado em 14 de março de 2023.

O GPT-4 introduziu várias melhorias em relação ao seu antecessor, o GPT-3, incluindo um aumento significativo no tamanho máximo de palavras (25.000 em comparação com o limite de 3.000 palavras do ChatGPT), maior tamanho da janela de contexto e melhorias nas habilidades de raciocínio e compreensão.

Outra característica notável do GPT-4 é sua multimodalidade, ou seja, a capacidade de compreender e inferir informações a partir de imagens, além do texto. Este último modelo gera textos mais parecidos com os humanos, utilizando recursos como emojis para uma sensação mais personalizada.

No entanto, o tamanho exato e a arquitetura do GPT-4 permanecem não divulgados, levando a especulações sobre os detalhes do modelo.

Apesar desses rumores, o CEO da OpenAI negou alegações específicas sobre o tamanho do modelo.

Em relação ao desempenho, o GPT-4 mostrou pontos fortes demonstrados na geração de texto, mas também algumas limitações. Por exemplo, obteve pontuação no percentil 54 no exame de redação do Graduate Record Examination (GRE) e teve desempenho no percentil 43 - 59 no exame de Cálculo BC do ensino médio (AP Calculus BC).

Além disso, ele se saiu bem em tarefas de codificação fáceis do Leetcode, mas seu desempenho diminuiu com o aumento da dificuldade das tarefas.

Embora os detalhes do processo de treinamento do GPT-4 não sejam oficialmente documentados, sabe-se que os modelos GPT geralmente envolvem aprendizado de máquina em grande escala com uma ampla gama de texto da internet.

Ansiando pelo Futuro

Como resultado das alterações na política de uso de dados da OpenAI, os dados utilizados para treinar seus modelos de linguagem não incluem informações compartilhadas através da API, a menos que os usuários concordem explicitamente em contribuir para esse propósito.

A medida que essa tecnologia melhora e desempenha um papel mais significativo em nossas vidas, é interessante observar como as empresas se adaptam e respondem às preocupações sobre a privacidade dos dados e conquistam a confiança das pessoas.

Artigos Relacionados

Ver mais >>

Desbloqueie o poder da IA com HIX.AI!