Compreendendo e possibilitando o poder transformacional dos LLMs

Robert Daigle, Director, Global AI Business at Lenovo

Recentemente, grandes modelos de linguagem (LLMs) conquistaram o mundo, com destaque especial para o lançamento do ChatGPT. Este avanço revolucionário gerou uma infinidade de oportunidades e produziu um número quase igual de dilemas. 

À medida que a IA generativa se torna um imperativo estratégico para desbloquear valor comercial proprietário em todo o mundo, a Lenovo está empenhada em ser o parceiro mais confiável e em capacitar a transformação inteligente dos clientes, simplificando a implementação de IA e removendo complexidades, revelando recentemente um investimento adicional de mil milhões de dólares na aceleração de um -parar a capacitação para recursos críticos de IA, como LLMs e outras cargas de trabalho críticas de IA generativa, por meio de sua rede expandida dos melhores inovadores de IA e mais de 150 soluções de IA prontas para uso. À medida que a empresa impulsiona a sua tecnologia de IA e o seu impulso, o investimento também se concentra em capacitar LLMs para os utilizadores, permitindo eficiências e insights orientados pela IA que irão transformar empresas, bem como indústrias inteiras. 

A Lenovo adota e avança ainda mais a IA com soluções ponta a ponta para uma ampla gama de setores verticais da indústria, dispositivos inteligentes para atender às necessidades de IA generativa e avanços operacionais para fabricação, operações da cadeia de suprimentos e muito mais. 

Além do ChatGPT 

ChatGPT, como um chatbot de última geração que apresentou capacidades incomparáveis, desde a elaboração de documentos complexos até programas de codificação e até mesmo a aprovação no Exame da Ordem. Sua rápida adoção e uso generalizado fizeram com que ele se tornasse o aplicativo de crescimento mais rápido, superando todos os outros na Internet. 

Embora o ChatGPT nos tenha apresentado as capacidades surpreendentes dos LLMs, surge uma questão crítica: como podemos aproveitar o potencial dos LLMs para gerar valor para as nossas organizações de forma responsável? Esta questão é de suma importância, pois o potencial transformador dos LLMs pode moldar indústrias e redefinir fluxos de trabalho. A versatilidade da IA generativa, da qual os LLMs são um exemplo notável, é a chave para automatizar tarefas, tornar a vida mais agradável e dar maior significado ao trabalho. 

O cerne desta transformação está no conceito de LLMs, que estão na vanguarda da inovação tecnológica. Esses modelos, com sua capacidade de processamento de linguagem natural e produção de texto semelhante ao humano, abrem as portas para uma comunicação e automação mais eficientes. O poder transformador dos LLMs torna-se ainda mais pronunciado quando se considera a sua aplicação em vários domínios, desde a criação de conteúdo até à interação com o cliente. Vamos desvendar o que é e como você pode começar. 

Um dos fundamentos mais importantes da IA generativa é que ela deve ser implantada de forma segura e responsável. A implantação de LLMs e aplicativos generativos de IA em seu próprio data center ou em sua infraestrutura de borda proporciona soberania de dados e maior controle sobre seus sistemas de IA. As organizações também devem considerar o estabelecimento de uma metodologia de IA responsável para garantir que estão evitando possíveis armadilhas em sua jornada de IA. 

Quais são as diferenças entre IA generativa, modelos de linguagem grande e modelos básicos? 

IA generativa, LLMs e modelos básicos são conceitos intimamente relacionados no campo da inteligência artificial, cada um com características distintas que contribuem para suas funções únicas em diversas aplicações. 

IA generativa é um termo amplo que abrange qualquer modelo de aprendizado de máquina capaz de criar resultados dinamicamente após o treinamento. Esta capacidade de gerar resultados complexos, como texto, imagens ou código, distingue a IA generativa de outras abordagens de aprendizagem automática. O objetivo é replicar padrões e criar novas instâncias com base em distribuições de dados aprendidas. Os modelos generativos de IA podem produzir conteúdo de forma autônoma, tornando-os ferramentas versáteis para criação de conteúdo, aumento de dados e tarefas criativas. 

Large Language Models (LLMs) são uma categoria específica de modelos generativos de IA especializados no tratamento de tarefas relacionadas à linguagem. Esses modelos são treinados em vastos conjuntos de dados de texto e podem gerar respostas de texto semelhantes às humanas, realizar tradução de idiomas, responder perguntas e muito mais. Eles se destacam na compreensão do contexto e na geração de texto coerente com base nas informações fornecidas. Os exemplos incluem a série GPT e BERT da OpenAI. 

Os modelos básicos são LLMs pré-treinados que servem como arquitetura base para aplicativos generativos de IA. Eles fornecem uma estrutura com componentes pré-treinados que podem ser ajustados para tarefas específicas. Esses modelos capturam a compreensão geral da linguagem e podem ser adaptados para diversas aplicações com dados adicionais. Eles desempenham um papel vital no desenvolvimento de aplicativos de IA generativos personalizados. 

Quais são alguns dos principais casos de uso?

Os LLMs começam com várias entradas: áudio, vídeo, texto, código, etc., que podem ser aprimorados e convertidos para outras formas, como chatbots, traduções, código, avatares, etc. 

Esses casos de uso abrangem a maioria dos setores verticais — saúde, manufatura, finanças, varejo, telecomunicações, energia, governo, tecnologia — e geram um impacto significativo nos negócios. 

O uso de GenAI e LLMs pela indústria de ciências biológicas está se expandindo e oferecendo uma grande promessa para pesquisas fundamentais. Esses modelos estão sendo usados para gerar imagens de estruturas e processos biológicos, facilitando uma melhor compreensão e aproximando-nos da medicina de precisão. 

A indústria de serviços financeiros já está a adotar modelos generativos de IA para determinadas tarefas financeiras. Estas instituições estão a utilizar IA generativa para aumentar a eficiência, melhorar as experiências dos clientes e reduzir custos operacionais. 

Na fabricação, a IA generativa permite que as indústrias projetem novas peças otimizadas para atender a metas e restrições específicas, como desempenho e precisão. 

Para as operações, os modelos GenAI podem ajudar a otimizar as cadeias de abastecimento, melhorar a previsão da procura, fornecer melhores avaliações de risco dos fornecedores e melhorar a gestão de inventário. A IA generativa pode analisar grandes quantidades de dados históricos de vendas, incorporando fatores como sazonalidade, promoções e condições econômicas. 

Em todas estas indústrias, a IA generativa também pode ajudar a criar dados sintéticos para desenvolvimento e formação. 

O modelo para implantar LLMs 

IA generativa e LLMs são extremamente intensivos em termos computacionais. Melhorias significativas no desempenho da carga de trabalho e no custo de uso de recursos de computação podem ser obtidas usando software, bibliotecas e estruturas otimizadas que aproveitam aceleradores, operadores paralelizados e maximizam o uso principal. Conforme descrito acima, os LLMs de IA generativos requerem recursos de computação acelerados. Numa parceria alargada com a VMware para ajudar os clientes a aproveitar o valor dos seus dados, o Reference Design for Generative AI da Lenovo considera cuidadosamente cada detalhe para otimizar o desempenho.

Aproveitando a plataforma de software NVIDIA AI Enterprise, que inclui a estrutura NVIDIA NeMo, o mais novo Reference Design para IA Generativa baseado em Large Language Models (LLMs) mostra às empresas como implantar e comercializar poderosas ferramentas de IA generativa e modelos básicos, usando um sistema pré-validado. , solução totalmente integrada e com desempenho otimizado para data centers. Juntamente com o recentemente anunciado VMware Private AI, as empresas podem obter excelente desempenho em seu modelo com integrações de GPU do vSphere e do VMware Cloud Foundation. A solução apresenta as plataformas mais densas em GPU desenvolvidas especificamente para cargas de trabalho de IA, incluindo o Lenovo ThinkSystem SR675 V3 e ThinkSystem SR670 V2, que são as plataformas de computação mais versáteis e aceleradas do mercado, com três configurações de servidor em um, incluindo suporte para sistemas NVIDIA HGX A100 de 4 GPUs com refrigeração líquida híbrida NVLink e Lenovo Neptune, bem como configurações de 4 ou 8 GPUs com GPUs NVIDIA L40S e NVIDIA H100 Tensor Core ou servidores NVIDIA H100 NVL em um espaço compacto de 3U. 

Para suportar a integração de rede crítica, a Lenovo está adicionando a mais recente tecnologia de rede NVIDIA Spectrum-X da NVIDIA ao seu portfólio de IA. Usando unidades de processamento de dados (DPUs) NVIDIA BlueField e switches NVIDIA Spectrum-4 em seu design de referência de IA generativa, a Lenovo está oferecendo a opção para a maneira mais avançada de integrar cargas de trabalho de IA em data centers corporativos atualmente. 

Ética e responsabilidade 

A IA responsável é uma estrutura de governança que cobre questões éticas, legais, de segurança, privacidade e responsabilidade. Embora a implementação de IA responsável varie de acordo com a empresa, a necessidade dela é clara. Sem práticas responsáveis de IA, uma empresa fica exposta a sérios riscos financeiros, de reputação e legais. Do lado positivo, as práticas responsáveis de IA estão a tornar-se pré-requisitos para a licitação de determinados contratos, especialmente quando os governos estão envolvidos; uma estratégia bem executada ajudará muito na conquista dessas licitações. Além disso, adotar uma IA responsável pode contribuir para um ganho de reputação para a empresa em geral. 

O novo Lenovo AI Discover Center of Excellence fornece acesso a cientistas de dados, arquitetos e engenheiros de IA da Lenovo para ajudar a explorar, implantar e dimensionar soluções de IA. O serviço também orienta os clientes para os parceiros de software mais adequados, infraestrutura otimizada para IA e orientação de IA responsável por meio do Comitê de IA Responsável da Lenovo. À medida que as empresas aprendem a implantar a IA, o comitê ajuda os clientes em sua abordagem para projetar, implantar e usar a IA de forma ética, ajudando as organizações a compreender e abordar questões de privacidade, uso justo, diversidade, equidade, inclusão e acessibilidade. 

Juntos, esses avanços servem para simplificar a implementação da IA, tornando os LLMs acessíveis a organizações de todos os tamanhos e permitindo inteligência transformadora em todos os setores.

[ssba]

MWC 2024

Experience breakthrough technology solutions and see how we're transforming, connecting, and empowering the world with AI for all.

Join us Feb. 26-29
Don't Miss StoryHub Updates: