O futuro da IA está aqui: o ChatGPT pode criar código, contar uma história ou inventar uma cena de sua sitcom favorita
2022-12-05 17:33:01
Inteligência artificial nunca pareceu tão avançado como agora com o ChatGPT da OpenAI. Este modelo usa Aprendizagem por Reforço de Feedback Humano e pode ajudá-lo a codificar, inventar histórias e até mesmo contar uma piada. Embora o software tenha algumas limitações, tem sido surpreendente para os usuários nas mídias sociais, pois eles compartilham algumas descobertas que estão fazendo com este projeto.
Em uma postagem no blog, os criadores do ChatGPT explicam como funciona:
Treinamos este modelo usando Reinforcement Learning from Human Feedback (RLHF), usando os mesmos métodos do InstructGPT, mas com pequenas diferenças na configuração da coleta de dados. Treinamos um modelo inicial usando ajuste fino supervisionado: treinadores humanos de IA forneciam conversas nas quais jogavam dos dois lados - o usuário e um assistente de IA. Demos aos treinadores acesso a sugestões escritas em modelo para ajudá-los a redigir suas respostas.
Para criar um modelo de recompensa para aprendizado por reforço, precisávamos coletar dados de comparação, que consistiam em duas ou mais respostas do modelo classificadas por qualidade. Para coletar esses dados, pegamos conversas que os treinadores de IA tiveram com o chatbot. Selecionamos aleatoriamente uma mensagem escrita por modelo, experimentamos várias conclusões alternativas e pedimos aos treinadores de IA que as classificassem. Usando esses modelos de recompensa, podemos ajustar o modelo usando Otimização de Política Proximal . Realizamos várias iterações desse processo.
Este software é ajustado a partir de um modelo da série GPT-3.5. Ambos foram treinados em uma infraestrutura de supercomputação do Azure AI. Por exemplo, um tweet que explodiu foi como um engenheiro sênior de dados do Twitter poderia tecnicamente enganar Elon Musk criando uma ideia plausível de contribuição de código. O interessante é como a IA aprende e melhora para o que o usuário deseja, conforme você pode ler aqui .
Outro caso de uso atraente para o ChatGPT é a IA criando um script de Seinfield no qual Jerry precisa aprender o algoritmo de classificação de bolhas. E os resultados são impressionantes.
O novo ChatGPT da OpenAI escreve uma cena de Seinfeld na qual Jerry precisa aprender o algoritmo de ordenação de bolhas: pic.twitter.com/yjPlrA3OmE
— Riley Goodside (@goodside) 30 de novembro de 2022
ChatGPT também pode ser um bom exemplo de um companheiro de depuração ou mesmo criando um plano de estratégia de negócios . Dito isso, é importante entender que o software ainda tem algumas limitações e às vezes vai te dizer coisas erradas.
- Às vezes, o ChatGPT escreve respostas que parecem plausíveis, mas incorretas ou sem sentido;
- O ChatGPT é sensível a ajustes na frase de entrada ou à tentativa do prompt exato várias vezes. Por exemplo, dada a formulação de uma pergunta, o modelo pode alegar não saber a resposta, mas, com uma pequena reformulação, pode responder corretamente;
- O modelo geralmente é excessivamente detalhado e usa certas frases, como reafirmar que é um modelo de linguagem treinado pela OpenAI;
- Idealmente, o modelo faria perguntas esclarecedoras quando o usuário fornecesse uma consulta ambígua. Em vez disso, esses modelos atuais geralmente adivinham o que o usuário pretendia;
- Às vezes, ele responde a instruções prejudiciais ou exibe um comportamento tendencioso.
Embora os usuários tentem tirar proveito da IA, é importante observar que ela não reforça a violência, o bullying ou qualquer coisa que possa prejudicar uma pessoa. Como todo mundo está tentando usar o ChatGPT, pode ser que esteja em plena capacidade, mas você pode aproveite sua chance aqui .
não perca : IA maluca mostra como seriam as celebridades mortas hojeLink de origem: bgr.com