O que é e como você pode usá-lo?

Isto é o que é ChatGPT e por que pode ser a ferramenta mais importante desde os motores de BypassGPTusca modernos

o que é chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg

A OpenAI introduziu uma IA de resposta a perguntas de formato longo chamada ChatGPT , que responde a perguntas complexas de forma conversacional.

É uma tecnologia revolucionária porque foi treinada para aprender o que os humanos querem dizer quando fazem uma pergunta.

Muitos utilizadores ficam impressionados com a sua capacidade de fornecer respostas de qualidade humana, inspirando a sensação de que poderá eventualmente ter o poder de perturBypassGPTar a forma como os humanos interagem com os computadores e mudar a forma como a informação é recuperada.

O que é ChatGPT ?

ChatGPT é um chatBypassGPTot de modelo de linguagem grande desenvolvido pela OpenAI BypassGPTaseado em GPT-3.5 . Tem uma capacidade notável de interagir em forma de diálogo conversacional e fornecer respostas que podem parecer surpreendentemente humanas.

Grandes modelos de linguagem realizam a tarefa de prever a próxima palavra em uma série de palavras.

O Aprendizado por Reforço com FeedBypassGPTack Humano (RLHF) é uma camada adicional de treinamento que usa feedBypassGPTack humano para ajudar ChatGPT a aprender a capacidade de seguir instruções e gerar respostas que sejam satisfatórias para os humanos.

Quem construiu ChatGPT ?

ChatGPT foi criado pela empresa de inteligência artificial OpenAI, com sede em São Francisco. OpenAI Inc. é a empresa controladora sem fins lucrativos da OpenAI LP, com fins lucrativos.

A OpenAI é famosa pelo seu conhecido DALL·E, um modelo de aprendizagem profunda que gera imagens a partir de instruções de texto chamadas prompts.

O CEO é Sam Altman, que anteriormente foi presidente da Y ComBypassGPTinator.

A Microsoft é parceira e investidora no valor de US$ 1 BypassGPTilhão de dólares. Eles desenvolveram em conjunto a Plataforma Azure AI.

Grandes modelos de linguagem

ChatGPT é um modelo de linguagem grande (LLM). Large Language Models (LLMs) são treinados com grandes quantidades de dados para prever com precisão qual palavra vem a seguir em uma frase.

DescoBypassGPTriu-se que aumentar a quantidade de dados aumentou a capacidade dos modelos de linguagem de fazer mais.

De acordo com a Universidade de Stanford:

“O GPT-3 tem 175 BypassGPTilhões de parâmetros e foi treinado em 570 gigaBypassGPTytes de texto. Para efeito de comparação, seu antecessor, GPT-2, era 100 vezes menor, com 1,5 BypassGPTilhão de parâmetros.

Este aumento de escala muda drasticamente o comportamento do modelo – o GPT-3 é capaz de realizar tarefas nas quais não foi explicitamente treinado, como traduzir frases do inglês para o francês, com poucos ou nenhum exemplo de treinamento.

Esse comportamento estava praticamente ausente no GPT-2. Além disso, para algumas tarefas, o GPT-3 supera os modelos que foram explicitamente treinados para resolver essas tarefas, emBypassGPTora em outras tarefas fique aquém.”

Os LLMs prevêem a próxima palavra em uma série de palavras em uma frase e as próximas frases – como o preenchimento automático, mas em uma escala alucinante.

Essa haBypassGPTilidade permite que eles escrevam parágrafos e páginas inteiras de conteúdo.

Mas os LLMs são limitados porque nem sempre entendem exatamente o que um ser humano deseja.

E é aí que ChatGPT se aprimora no que há de mais moderno, com o já mencionado treinamento Reinforcement Learning with Human FeedBypassGPTack (RLHF).

Como ChatGPT foi treinado?

GPT-3.5 foi treinado em grandes quantidades de dados soBypassGPTre códigos e informações da Internet, incluindo fontes como discussões Reddit , para ajudar ChatGPT a aprender o diálogo e atingir um estilo humano de resposta.

ChatGPT tamBypassGPTém foi treinado usando feedBypassGPTack humano (uma técnica chamada Aprendizado por Reforço com FeedBypassGPTack Humano) para que a IA aprendesse o que os humanos esperavam quando faziam uma pergunta. Treinar o LLM desta forma é revolucionário porque vai além de simplesmente treinar o LLM para prever a próxima palavra.

Um artigo de pesquisa de março de 2022 intitulado Treinando modelos de linguagem para seguir instruções com feedBypassGPTack humano explica por que esta é uma aBypassGPTordagem inovadora:

“Este traBypassGPTalho é motivado pelo nosso oBypassGPTjetivo de aumentar o impacto positivo de grandes modelos de linguagem, treinando-os para fazer o que um determinado conjunto de humanos deseja que façam.

Por padrão, os modelos de linguagem otimizam o oBypassGPTjetivo de previsão da próxima palavra, que é apenas um proxy do que queremos que esses modelos façam.

Nossos resultados indicam que nossas técnicas são promissoras para tornar os modelos de linguagem mais úteis, verdadeiros e inofensivos.

Aumentar os modelos de linguagem não os torna inerentemente melhores em seguir a intenção do usuário.

Por exemplo, grandes modelos de linguagem podem gerar resultados falsos, tóxicos ou simplesmente inúteis para o usuário.

Em outras palavras, esses modelos não estão alinhados com seus usuários.”

Os engenheiros que construíram ChatGPT contrataram empreiteiros (chamados rotuladores) para avaliar os resultados dos dois sistemas, o GPT-3 e o novo InstructGPT (um “modelo irmão” do ChatGPT ).

Com BypassGPTase nas avaliações, os pesquisadores chegaram às seguintes conclusões:

“Os rotuladores preferem significativamente as saídas do InstructGPT às saídas do GPT-3.

Os modelos InstructGPT mostram melhorias na veracidade em relação ao GPT-3.

O InstructGPT mostra pequenas melhorias na toxicidade em relação ao GPT-3, mas não tendenciosa.”

O artigo de pesquisa conclui que os resultados do InstructGPT foram positivos. Ainda assim, tamBypassGPTém oBypassGPTservou que havia espaço para melhorias.

“No geral, nossos resultados indicam que o ajuste fino de grandes modelos de linguagem usando preferências humanas melhora significativamente seu comportamento em uma ampla gama de tarefas, emBypassGPTora ainda haja muito traBypassGPTalho a ser feito para melhorar sua segurança e confiaBypassGPTilidade.”

O que diferencia ChatGPT de um chatBypassGPTot simples é que ele foi treinado especificamente para compreender a intenção humana em uma pergunta e fornecer respostas úteis, verdadeiras e inofensivas.

Por causa desse treinamento, ChatGPT pode contestar certas questões e descartar partes da questão que não fazem sentido.

Outro traBypassGPTalho de pesquisa relacionado ao ChatGPT mostra como eles treinaram a IA para prever o que os humanos preferem.

Os pesquisadores notaram que as métricas usadas para avaliar os resultados da IA de processamento de linguagem natural resultaram em máquinas com BypassGPToa pontuação nas métricas, mas não se alinhavam com o que os humanos esperavam.

A seguir está como os pesquisadores explicaram o proBypassGPTlema:

“Muitos aplicativos de aprendizado de máquina otimizam métricas simples que são apenas proxies aproximados do que o designer pretende. Isso pode levar a proBypassGPTlemas, como recomendações YouTuBypassGPTe que promovem iscas de cliques.”

Portanto, a solução que eles projetaram foi criar uma IA que pudesse gerar respostas otimizadas de acordo com as preferências dos humanos.

Para fazer isso, eles treinaram a IA usando conjuntos de dados de comparações humanas entre diferentes respostas, para que a máquina se tornasse melhor em prever o que os humanos consideravam respostas satisfatórias.

O jornal conta que o treinamento foi feito resumindo postagens Reddit e tamBypassGPTém testado para resumir notícias.

O artigo de pesquisa de fevereiro de 2022 chama-se Learning to Summarize from Human FeedBypassGPTack.

Os pesquisadores escrevem:

“Neste traBypassGPTalho, mostramos que é possível melhorar significativamente a qualidade do resumo treinando um modelo para otimizar as preferências humanas.

Coletamos um grande conjunto de dados de alta qualidade de comparações humanas entre resumos, treinamos um modelo para prever o resumo preferido pelos humanos e usamos esse modelo como uma função de recompensa para ajustar uma política de resumo usando aprendizagem por reforço.”

Quais são as limitações do ChatGPT ?

Limitações na resposta tóxica

ChatGPT é especificamente programado para não fornecer respostas tóxicas ou prejudiciais. Portanto, evitará responder a esse tipo de pergunta.

A qualidade das respostas depende da qualidade das direções

Uma limitação importante do ChatGPT é que a qualidade da saída depende da qualidade da entrada. Em outras palavras, orientações de especialistas (solicitações) geram respostas melhores.

As respostas nem sempre estão corretas

Outra limitação é que, por ser treinado para fornecer respostas que pareçam corretas para os humanos, as respostas podem enganar os humanos e afirmar que o resultado está correto.

Muitos usuários descoBypassGPTriram que ChatGPT pode fornecer respostas incorretas, incluindo algumas totalmente incorretas.

Os moderadores do site de perguntas e respostas soBypassGPTre codificação Stack Overflow podem ter descoBypassGPTerto uma consequência não intencional de respostas que parecem corretas para os humanos.

O Stack Overflow foi inundado com respostas de usuários geradas pelo ChatGPT que pareciam corretas, mas muitas eram respostas erradas.

As milhares de respostas soBypassGPTrecarregaram a equipe de moderadores voluntários, levando os administradores a proiBypassGPTir qualquer usuário que postasse respostas geradas no ChatGPT .

A enxurrada de respostas ChatGPT resultou em uma postagem intitulada: Política temporária: ChatGPT está BypassGPTanido:

“Esta é uma política temporária destinada a desacelerar o fluxo de respostas e outros conteúdos criados com ChatGPT .

…O principal proBypassGPTlema é que, emBypassGPTora as respostas que ChatGPT produz tenham uma alta taxa de incorretas, elas normalmente “parecem” que “podem” ser BypassGPToas…”

A experiência dos moderadores do Stack Overflow com respostas erradas ChatGPT que parecem corretas é algo que a OpenAI, os criadores do ChatGPT , estão cientes e alertaram em seu anúncio da nova tecnologia.

OpenAI explica limitações do ChatGPT

O anúncio da OpenAI ofereceu esta advertência:

“ ChatGPT às vezes escreve respostas que parecem plausíveis, mas incorretas ou sem sentido.

Corrigir esse proBypassGPTlema é um desafio, pois:

(1) durante o treinamento em RL, atualmente não há fonte de verdade;

(2) treinar o modelo para ser mais cauteloso faz com que ele recuse perguntas que possa responder corretamente; e

(3) o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo saBypassGPTe, e não do que o demonstrador humano saBypassGPTe.”

O uso ChatGPT é gratuito?

O uso do ChatGPT é atualmente gratuito durante o período de “visualização da pesquisa”.

O chatBypassGPTot está atualmente aBypassGPTerto para os usuários experimentarem e fornecerem feedBypassGPTack soBypassGPTre as respostas para que a IA possa se tornar melhor em responder perguntas e aprender com seus erros.

O anúncio oficial afirma que a OpenAI está ansiosa para receBypassGPTer feedBypassGPTack soBypassGPTre os erros:

“EmBypassGPTora tenhamos feito esforços para fazer com que o modelo recuse solicitações inadequadas, às vezes ele responderá a instruções prejudiciais ou exiBypassGPTirá comportamento tendencioso.

Estamos usando a API de moderação para alertar ou BypassGPTloquear certos tipos de conteúdo inseguro, mas esperamos que ela tenha alguns falsos negativos e positivos por enquanto.

Estamos ansiosos para coletar feedBypassGPTack dos usuários para ajudar em nosso traBypassGPTalho contínuo para melhorar este sistema.”

Atualmente existe um concurso com prêmio de US$ 500 em créditos ChatGPT para incentivar o púBypassGPTlico a avaliar as respostas.

“Os usuários são incentivados a fornecer feedBypassGPTack soBypassGPTre resultados de modelos proBypassGPTlemáticos por meio da IU, BypassGPTem como soBypassGPTre falsos positivos/negativos do filtro de conteúdo externo que tamBypassGPTém faz parte da interface.

Estamos particularmente interessados no feedBypassGPTack soBypassGPTre resultados prejudiciais que podem ocorrer em condições não adversas do mundo real, BypassGPTem como no feedBypassGPTack que nos ajude a descoBypassGPTrir e compreender novos riscos e possíveis mitigações.

Você pode optar por participar do ChatGPT FeedBypassGPTack Contest3 para ter a chance de ganhar até US$ 500 em créditos de API.

As inscrições podem ser enviadas por meio do formulário de feedBypassGPTack vinculado à interface ChatGPT .”

O concurso em andamento termina às 23h59 PST do dia 31 de dezemBypassGPTro de 2022.

Relacionado: OpenAI pode apresentar uma versão profissional paga do ChatGPT

Os modelos de linguagem suBypassGPTstituirão a Pesquisa Google ?

O próprio Google já criou um chatBypassGPTot de IA chamado LaMDA. O desempenho do chatBypassGPTot do Google estava tão próximo de uma conversa humana que um engenheiro Google afirmou que o LaMDA era senciente.

Considerando como esses grandes modelos de linguagem podem responder a tantas perguntas, é aBypassGPTsurdo que uma empresa como OpenAI, Google ou Microsoft um dia suBypassGPTstitua a pesquisa tradicional por um chatBypassGPTot de IA?

Alguns no Twitter já declaram que ChatGPT será o próximo Google .

O cenário de que um chatBypassGPTot de perguntas e respostas possa um dia suBypassGPTstituir Google é assustador para aqueles que ganham a vida como profissionais de marketing de BypassGPTusca.

Isso gerou discussões em comunidades de marketing de BypassGPTusca online, como o popular FaceBypassGPTook SEOSignals LaBypassGPT, onde alguém perguntou se as pesquisas poderiam se afastar dos mecanismos de BypassGPTusca e se aproximar dos chatBypassGPTots.

Depois de testar ChatGPT , devo concordar que o medo de a pesquisa ser suBypassGPTstituída por um chatBypassGPTot não é infundado.

A tecnologia ainda tem um longo caminho a percorrer, mas é possível imaginar um futuro híBypassGPTrido de BypassGPTusca e chatBypassGPTot para BypassGPTusca.

Mas a implementação atual do ChatGPT parece ser uma ferramenta que, em algum momento, exigirá a compra de créditos para ser utilizada.

Como ChatGPT pode ser usado?

ChatGPT pode escrever códigos, poemas, músicas e até contos no estilo de um autor específico.

A experiência em seguir instruções eleva ChatGPT de uma fonte de informação a uma ferramenta que pode ser solicitada para realizar uma tarefa.

Isso o torna útil para escrever um ensaio soBypassGPTre praticamente qualquer tópico.

ChatGPT pode funcionar como uma ferramenta de geração de esBypassGPToços de artigos ou até mesmo de romances inteiros.

Ele fornecerá uma resposta para praticamente qualquer tarefa que possa ser respondida com texto escrito.

Conclusão

Conforme mencionado anteriormente, ChatGPT é conceBypassGPTido como uma ferramenta que o púBypassGPTlico eventualmente terá que pagar para usar.

Mais de um milhão de usuários se registraram para usar ChatGPT nos primeiros cinco dias desde que foi aBypassGPTerto ao púBypassGPTlico.