@EruptionGlobal

📊 AO VIVO
💱 Moedas💵USD/BRLDólar AmericanoR$ 5,1523💶EUR/BRLEuroR$ 5,9100💷GBP/BRLLibra EsterlinaR$ 6,8130🇯🇵JPY/BRLIene JaponêsR$ 0,0320🇨🇳CNY/BRLYuan ChinêsR$ 0,7595🇨🇭CHF/BRLFranco SuíçoR$ 6,4069🇦🇷ARS/BRLPeso ArgentinoR$ 0,0036🇲🇽MXN/BRLPeso MexicanoR$ 0,2969🇨🇦CAD/BRLDólar CanadenseR$ 3,6478🇦🇺AUD/BRLDólar AustralianoR$ 3,6136🪙 CriptoBTC/BRLBitcoinR$ 324.764,00 ▼ -0,35%ΞETH/BRLEthereumR$ 8.763,39 ▼ -0,96%SOL/BRLSolanaR$ 355,21 ▼ -1,39%🔶BNB/BRLBinance CoinR$ 2.986,35 ▼ -0,46%💎XRP/BRLRippleR$ 5,820 ▼ -1,79%🐕DOGE/BRLDogecoinR$ 0,4266 ▼ -1,18%🔵ADA/BRLCardanoR$ 0,828 ▼ -2,03%🔺AVAX/BRLAvalancheR$ 30,59 ▼ -6,09%🔗LINK/BRLChainlinkR$ 40,62 ▼ -1,78%DOT/BRLPolkadotR$ 4,91 ▼ -2,16%🔘LTC/BRLLitecoinR$ 225,68 ▼ -0,32%TRX/BRLTronR$ 1,6600 ▲ +0,26%XLM/BRLStellar LumensR$ 1,1200 ▼ -7,18%VET/BRLVeChainR$ 0,02515 ▲ +0,99%🦄UNI/BRLUniswapR$ 15,66 ▼ -0,75%🥇 Metais🥇OUROGold / oz (XAU)R$ 21.347,00 /oz ▼ -1,78%🥇PAXGPAX Gold / ozR$ 21.386,00 /oz ▼ -1,84%💱 Moedas💵USD/BRLDólar AmericanoR$ 5,1523💶EUR/BRLEuroR$ 5,9100💷GBP/BRLLibra EsterlinaR$ 6,8130🇯🇵JPY/BRLIene JaponêsR$ 0,0320🇨🇳CNY/BRLYuan ChinêsR$ 0,7595🇨🇭CHF/BRLFranco SuíçoR$ 6,4069🇦🇷ARS/BRLPeso ArgentinoR$ 0,0036🇲🇽MXN/BRLPeso MexicanoR$ 0,2969🇨🇦CAD/BRLDólar CanadenseR$ 3,6478🇦🇺AUD/BRLDólar AustralianoR$ 3,6136🪙 CriptoBTC/BRLBitcoinR$ 324.764,00 ▼ -0,35%ΞETH/BRLEthereumR$ 8.763,39 ▼ -0,96%SOL/BRLSolanaR$ 355,21 ▼ -1,39%🔶BNB/BRLBinance CoinR$ 2.986,35 ▼ -0,46%💎XRP/BRLRippleR$ 5,820 ▼ -1,79%🐕DOGE/BRLDogecoinR$ 0,4266 ▼ -1,18%🔵ADA/BRLCardanoR$ 0,828 ▼ -2,03%🔺AVAX/BRLAvalancheR$ 30,59 ▼ -6,09%🔗LINK/BRLChainlinkR$ 40,62 ▼ -1,78%DOT/BRLPolkadotR$ 4,91 ▼ -2,16%🔘LTC/BRLLitecoinR$ 225,68 ▼ -0,32%TRX/BRLTronR$ 1,6600 ▲ +0,26%XLM/BRLStellar LumensR$ 1,1200 ▼ -7,18%VET/BRLVeChainR$ 0,02515 ▲ +0,99%🦄UNI/BRLUniswapR$ 15,66 ▼ -0,75%🥇 Metais🥇OUROGold / oz (XAU)R$ 21.347,00 /oz ▼ -1,78%🥇PAXGPAX Gold / ozR$ 21.386,00 /oz ▼ -1,84%
⟳ 19:06
HomeTecnologia & Inovação EconômicaStartup Promete Revolução em LLMs: Desafios de Escalabilidade e Oportunidades de Redução de Custos
Tecnologia & Inovação Econômica

Startup Promete Revolução em LLMs: Desafios de Escalabilidade e Oportunidades de Redução de Custos

Por Vinícius Hoffmann Machado19 jun 20267 min de leitura
Startup Promete Revolução em LLMs: Desafios de Escalabilidade e Oportunidades de Redução de Custos

Resumo

Subquadratic Afirma Ter Superado Gargalo Matemático em LLMs, Prometendo Eficiência e Redução de Custos Sem Precedentes

Uma startup sediada em Miami, a Subquadratic, emergiu recentemente do anonimato com uma afirmação audaciosa: ter resolvido um gargalo matemático que tem limitado o desenvolvimento de modelos de linguagem grandes (LLMs) por quase uma década. A promessa é de sistemas mais rápidos, mais baratos e com menor consumo de energia.

Inicialmente, os detalhes foram escassos, gerando ceticismo na comunidade de inteligência artificial. No entanto, a empresa começou a apresentar evidências, incluindo os resultados de uma avaliação independente de sua nova tecnologia. Esses resultados iniciais sugerem que as alegações da Subquadratic podem, de fato, merecer atenção.

O cerne da inovação reside em um novo tipo de LLM, batizado de SubQ, que, segundo a empresa, processa até 12 vezes mais texto simultaneamente que modelos convencionais. Isso abre portas para tarefas intensivas em dados, como a análise de centenas de documentos ou bases de código completas, com desempenho comparável aos modelos de ponta de gigantes como Google DeepMind, OpenAI e Anthropic.

Fonte Principal

Entendendo o Gargalo da Atenção Densa nos LLMs Atuais

Para compreender a magnitude da proposta da Subquadratic, é crucial entender como a maioria dos LLMs opera atualmente. O mecanismo fundamental é a rede neural conhecida como Transformer, que utiliza um processo chamado atenção densa. LLMs modernos encadeiam múltiplos Transformers, e a atenção densa é a operação chave que permite a compreensão do contexto em textos extensos.

O processo de atenção densa envolve a codificação de cada palavra (ou token) em um número. Para capturar o significado completo do texto, cada número é multiplicado por todos os outros números correspondentes àquele trecho. Em um texto de 10.000 palavras, isso pode gerar quase 50 milhões de multiplicações individuais. Essa complexidade computacional é a principal razão pela qual LLMs são notórios por seu alto consumo de energia e custos operacionais elevados.

A natureza quadrática do aumento computacional é o principal gargalo. Dobrar o número de palavras em um texto não apenas dobra, mas quadruplica aproximadamente o número de computações necessárias. Essa escalabilidade limitada restringe a capacidade dos LLMs de processar e raciocinar sobre volumes massivos de informação de forma eficiente.

A Solução Proposta: Atenção Esparsa e Eficiência Inovadora

A Subquadratic propõe abandonar a atenção densa em favor da atenção esparsa. Em vez de multiplicar cada token por todos os outros, a atenção esparsa seleciona apenas um subconjunto de multiplicações. A lógica por trás disso é que nem todas as relações entre palavras em um texto são igualmente importantes para a compreensão do seu significado.

Essa abordagem, embora simples em conceito, tem sido um desafio técnico significativo. Muitos tentaram implementar mecanismos de atenção esparsa que pudessem igualar o desempenho da atenção densa, mas sem sucesso até agora. A Subquadratic alega ter encontrado a solução, apresentando o SubQ como o primeiro LLM com atenção esparsa a rivalizar com modelos de atenção densa convencionais em desempenho.

O diferencial da Subquadratic reside na sua capacidade de selecionar dinamicamente quais relações entre palavras são importantes, em vez de usar padrões fixos. Essa seleção é calculada em tempo real e varia para cada entrada de texto, constituindo o que a empresa chama de “molho secreto”.

Resultados Preliminares e Validação Independente

Os resultados de testes independentes realizados pela Appen, uma empresa especializada na avaliação de modelos de IA, parecem corroborar muitas das alegações da Subquadratic. Em um teste de velocidade bruta, o SubQ se mostrou 56 vezes mais rápido que modelos que utilizam técnicas de atenção esparsa anteriores, como o FlashAttention.

Em testes de codificação competitiva, o SubQ alcançou 89.7% de performance no LiveCodeBench, colocando-o no mesmo patamar dos melhores modelos de codificação disponíveis. Jeanine Sinanan-Singh, diretora de pesquisa em IA generativa da Appen, descreveu os resultados como “realmente empolgantes” e “potencialmente um divisor de águas”, dada a dificuldade inerente de velocidade e eficiência em modelos de linguagem.

A alegação de redução de custos é igualmente impressionante. Enquanto rodar o modelo Opus da Anthropic em um teste específico custa cerca de US$ 2.600, a Subquadratic afirma que o mesmo teste com o SubQ custou apenas US$ 8. Além disso, o SubQ possui uma janela de contexto de até 12 milhões de tokens, comparada a cerca de 1 milhão dos modelos de ponta atuais, permitindo o processamento de volumes de dados significativamente maiores.

Desafios, Ceticismo e o Futuro dos LLMs

Apesar dos resultados promissores, o ceticismo persiste. A falta de acesso generalizado ao SubQ para testes independentes e a reutilização de pesos de modelos pré-existentes (como o Qwen chinês) em vez de um treinamento totalmente do zero levantam questões sobre a originalidade e a amplitude da inovação.

Dan McAteer, engenheiro de IA, resumiu a reação inicial como “SubQ é ou o maior avanço desde o Transformer… ou é a Theranos da IA”. A Subquadratic reconhece a necessidade de apresentar mais evidências verificadas antes de anúncios grandiosos, mas defende que sua abordagem de atenção esparsa dinâmica representa uma mudança fundamental na arquitetura dos LLMs.

A empresa foca o SubQ em nichos específicos como codificação e análise de grandes volumes de dados, com dezenas de milhares de usuários interessados em acesso antecipado. No entanto, a capacidade limitada de atendimento inicial pode gerar frustração e manter o ceticismo ativo.

Conclusão Estratégica Financeira: Um Novo Paradigma em IA e Seus Impactos Econômicos

Se as alegações da Subquadratic se confirmarem em larga escala, os impactos econômicos podem ser transformadores. A redução drástica nos custos de computação e energia para treinar e operar LLMs poderia democratizar o acesso a essa tecnologia, permitindo que empresas menores e startups inovadoras desenvolvam soluções de IA mais sofisticadas sem o investimento proibitivo atual.

A oportunidade reside em pioneirismo e eficiência. A empresa que conseguir provar e escalar uma arquitetura de LLM significativamente mais barata e rápida pode capturar uma fatia substancial do mercado, tanto em termos de receita direta quanto de valuation. Riscos incluem a dificuldade de validação independente completa e a resistência de um mercado dominado por players estabelecidos.

Para investidores e gestores, a lição é a vigilância. O setor de IA está em ebulição, e inovações que quebram gargalos de escalabilidade e custo têm potencial para redefinir o cenário competitivo. Acredito que a tendência futura aponta para uma busca incessante por eficiência, e o modelo da Subquadratic, se validado, pode ser um precursor de uma nova era na construção de LLMs, afastando-se dos Transformers tradicionais.

Este conteúdo é de caráter exclusivamente informativo e educacional. Não constitui recomendação de investimento, consultoria financeira ou oferta de qualquer ativo. Consulte um profissional habilitado antes de tomar decisões financeiras.

O que você acha dessa nova tecnologia? A Subquadratic realmente quebrou um paradigma ou é apenas mais um burburinho no mundo da IA? Compartilhe sua opinião nos comentários!

Compartilhar este artigo

Vinícius Hoffmann Machado
Fundador · Eruption Global

Engenheiro de Produção e especialista em finanças corporativas com mais de 13 anos de experiência em gestão estratégica de custos, planejamento orçamentário e análise de mercado. Fundador da Eruption Global, portal dedicado à análise econômica aplicada.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Newsletter

Receba as principais análises direto no seu e-mail, sem spam.